Enfin exploré le Hub des Environnements @PrimeIntellect ! Une plateforme pour partager des environnements RL pour entraîner/évaluer des LLMs/Agents, en gardant les choses ouvertes. J'ai écrit un guide sur le Hub des Environnements + Vérificateurs (@willccbb), de l'essentiel aux évaluations & à l'entraînement GRPO sur l'environnement de tri d'alphabet de @kalomaze. 👇
15,1K