zeer cool en grondig stuk over het gebruik van de Environments Hub :)
Stefano Fiorucci
Stefano Fiorucci4 sep, 23:32
Eindelijk de @PrimeIntellect Environments Hub verkend! Een platform om RL-omgevingen te delen voor het trainen/evalueren van LLM's/Agents, alles open houdend. Ik heb een handleiding geschreven over de Environments Hub + Verifiers (@willccbb), vanaf de basis tot evaluaties & GRPO-training op @kalomaze's alphabet-sort omgeving. 👇
7,75K