🚀 Olá, Kimi K2 Thinking!
O modelo de agente de pensamento de código aberto está aqui.
🔹 SOTA em HLE (44,9%) e BrowseComp (60,2%)
🔹 Executa até 200 a 300 chamadas sequenciais de ferramentas sem interferência humana
🔹 Destaca-se em raciocínio, pesquisa agêntica e codificação
🔹 Janela de contexto de 256K
Construído como um agente de pensamento, o K2 Thinking marca nossos esforços mais recentes em escalonamento de tempo de teste - dimensionando tokens de pensamento e turnos de chamada de ferramentas.
O K2 Thinking agora está ativo no modo de bate-papo, com o modo de agente completo em breve. Também é acessível via API.
🔌 A API está ativa:
🔗 Blog de tecnologia:
🔗 Pesos e código:
NVIDIA DGX Spark está aqui!
É tão emocionante fazer Ollama rodar em @nvidia DGX Spark.
Super incrível ver 128 GB de memória unificada e a arquitetura Grace Blackwell.
👇👇👇