Det här är coolt. Jag förutspår att i maj 2026 kommer vem som helst att kunna träna en anpassad modell som denna för ~vilken uppgift som helst via någon kombination av Prime-RL/Verifiers, Tinker, SkyRL, Slime osv. vallgraven kommer att vara att veta vilken uppgift man ska RL och data/miljömagi