🚀 Hallo, Kimi K2 Thinking!
Het Open-Source Thinking Agent Model is hier.
🔹 SOTA op HLE (44,9%) en BrowseComp (60,2%)
🔹 Voert tot 200 – 300 opeenvolgende tool-aanroepen uit zonder menselijke tussenkomst
🔹 Uitstekend in redeneren, agentisch zoeken en coderen
🔹 256K contextvenster
Gebouwd als een denkagent, markeert K2 Thinking onze nieuwste inspanningen in test-tijd schaling — zowel het schalen van denk-tokens als tool-aanroepbeurten.
K2 Thinking is nu live in chatmodus, met de volledige agentische modus die binnenkort komt. Het is ook toegankelijk via API.
🔌 API is live:
🔗 Tech blog:
🔗 Gewichten & code:
NVIDIA DGX Spark is hier!
Het is zo spannend om Ollama te laten draaien op @nvidia DGX Spark.
Super geweldig om 128GB aan uniforme geheugen en de Grace Blackwell-architectuur te zien.
👇👇👇