🚀 Ciao, Kimi K2 Thinking!
Il Modello di Agente di Pensiero Open-Source è qui.
🔹 SOTA su HLE (44,9%) e BrowseComp (60,2%)
🔹 Esegue fino a 200 – 300 chiamate a strumenti sequenziali senza interferenza umana
🔹 Eccelle nel ragionamento, nella ricerca agentica e nella programmazione
🔹 Finestra di contesto di 256K
Costruito come un agente di pensiero, K2 Thinking segna i nostri ultimi sforzi nel ridimensionamento durante il test — ridimensionando sia i token di pensiero che i turni di chiamata agli strumenti.
K2 Thinking è ora attivo in modalità chat, con la modalità agentica completa in arrivo presto. È anche accessibile tramite API.
🔌 API è attiva:
🔗 Blog tecnico:
🔗 Pesi e codice:
NVIDIA DGX Spark è qui!
È così emozionante far funzionare Ollama su @nvidia DGX Spark.
Super fantastico vedere 128GB di memoria unificata e l'architettura Grace Blackwell.
👇👇👇