🚀 ¡Hola, Kimi K2 Thinking!
El modelo de agente de pensamiento de código abierto está aquí.
🔹 SOTA en HLE (44,9%) y BrowseComp (60,2%)
🔹 Ejecuta hasta 200 – 300 llamadas secuenciales de herramientas sin interferencia humana
🔹 Sobresale en razonamiento, búsqueda agencial y codificación
🔹 Ventana de contexto de 256K
Creado como un agente pensante, K2 Thinking marca nuestros últimos esfuerzos en el escalado en tiempo de prueba, escalando tanto los tokens de pensamiento como los turnos de llamada de herramientas.
K2 Thinking ahora está disponible en modo chat, con el modo agente completo próximamente. También es accesible a través de API.
🔌 La API está activa:
🔗 Blog de tecnología:
🔗 Pesos y código:
¡NVIDIA DGX Spark ya está aquí!
Es muy emocionante hacer que Ollama funcione con @nvidia DGX Spark.
Súper increíble ver 128 GB de memoria unificada y la arquitectura Grace Blackwell.
👇👇👇