Esto mola. Predigo que para mayo de 2026 cualquiera podrá entrenar un modelo personalizado como este para ~cualquier tarea mediante alguna combinación de prime-rl/verificadores, tinker, skyRL, slime, etc.
el foso será saber qué tarea hacer en RL y la magia de datos/entorno
Presentamos WarpGrep, un subagente de contexto rápido que mejora el rendimiento del agente de codificación.
WarpGrep acelera las tareas de codificación en un 40% y reduce la podredumbre del contexto en un 70% en tareas de largo horizonte al tratar la recuperación de contexto como un sistema propio entrenado para RL.
Inspirados por el software de Cognition, estamos abriendo el acceso a Claude Code, Codex, OpenCode o cualquier agente de codificación a través de MCP (o a través de nuestro SDK)