to jest fajne. Przewiduję, że do maja 2026 roku każdy będzie mógł trenować niestandardowy model jak ten do ~dowolnego zadania za pomocą jakiejś kombinacji prime-rl/weryfikatorów, tinker, skyRL, slime itd.
obroną będzie wiedza, jakie zadanie należy RL i czary z danymi/środowiskiem.
Przedstawiamy WarpGrep, szybkiego podagenta kontekstowego, który poprawia wydajność agenta kodującego.
WarpGrep przyspiesza zadania kodowania o 40% i redukuje rotację kontekstu o 70% w długoterminowych zadaniach, traktując pozyskiwanie kontekstu jako własny system trenowany w RL.
Zainspirowani SWE-Grep od Cognition - otwieramy dostęp do Claude Code, Codex, OpenCode lub dowolnego agenta kodującego za pośrednictwem MCP (lub przez nasze SDK)
nowy post na blogu! *Zagłębiam się* w Tinker API, wyjaśniam, dlaczego jest to dobre, naprawdę, i dzielę się moimi szalonymi teoriami na temat tego, jak to działa