🚀 Привет, Kimi K2 Thinking!
Модель открытого исходного кода Thinking Agent здесь.
🔹 SOTA на HLE (44.9%) и BrowseComp (60.2%)
🔹 Выполняет до 200 – 300 последовательных вызовов инструментов без человеческого вмешательства
🔹 Превосходно справляется с рассуждениями, агентным поиском и кодированием
🔹 256K контекстное окно
Созданный как мыслящий агент, K2 Thinking отмечает наши последние усилия в масштабировании во время тестирования — масштабирование как токенов мышления, так и вызовов инструментов.
K2 Thinking теперь доступен в режиме чата, полный агентный режим скоро будет доступен. Он также доступен через API.
🔌 API в режиме реального времени:
🔗 Технический блог:
🔗 Веса и код:
NVIDIA DGX Spark здесь!
Так здорово заставить Ollama работать на @nvidia DGX Spark.
Просто потрясающе видеть 128 ГБ унифицированной памяти и архитектуру Grace Blackwell.
👇👇👇