Finalmente explorado @PrimeIntellect Hub de Ambientes! Uma plataforma para compartilhar ambientes RL para LLMs/Agentes de treinamento/avaliação, mantendo as coisas abertas Escreveu um passo a passo no Environments Hub + Verifiers (@willccbb), do básico às avaliações e treinamento GRPO no ambiente de classificação alfabética do @kalomaze. 👇
15,39K