to jest fajne. Przewiduję, że do maja 2026 roku każdy będzie mógł trenować niestandardowy model jak ten do ~dowolnego zadania za pomocą jakiejś kombinacji prime-rl/weryfikatorów, tinker, skyRL, slime itd. obroną będzie wiedza, jakie zadanie należy RL i czary z danymi/środowiskiem.