Ankündigung von ARES - unserer Open-Source-Agentic Research and Evaluation Suite.
ARES basiert auf 3 Säulen (👇 siehe den Thread), um das Verstärkungslernen für Code-Agenten zu erleichtern.
Wir haben auch festgestellt, dass es für unsere eigene Forschung zur mechanischen Interpretation unglaublich nützlich ist.
1.000.000 $, um zu verstehen, wie LLMs Code schreiben.
Ankündigung: Die Martian Interpretability Challenge.
Das Verständnis der inneren Abläufe von LLMs ist die größte wissenschaftliche Herausforderung unserer Zeit. Lassen Sie uns das lösen.
Bewerben Sie sich hier:
🧵👇