dit is cool. ik voorspel dat tegen mei 2026 iedereen in staat zal zijn om een aangepast model zoals dit te trainen voor ~elke taak via een combinatie van prime-rl/verifiers, tinker, skyRL, slime enz. de bescherming zal liggen in het weten welke taak te RL en data/env tovenarij.