Ogłaszamy ARES - nasz otwarty zestaw do badań i oceny Agentic.
ARES opiera się na 3 filarach (👇 zobacz wątek), aby ułatwić uczenie przez wzmocnienie dla agentów kodu.
Odkryliśmy również, że jest niezwykle przydatny w naszych badaniach nad interpretacją mechanizmów.
1 000 000 $ na zrozumienie, jak LLM-y piszą kod.
Ogłaszamy: Wyzwanie Interpretowalności Marsjańskiej.
Zrozumienie wewnętrznych mechanizmów LLM-ów to największe wyzwanie naukowe naszych czasów. Rozwiążmy to.
Aplikuj tutaj:
🧵👇