Il 70% dei team di produzione AI utilizza modelli open source. Il 72,5% collega agenti a database, non a interfacce chat. Questo è ciò che 375 costruttori tecnici effettivamente realizzano - e non assomiglia affatto all'AI di Twitter.
Il 70% dei team utilizza modelli open source in qualche modo. Il 48% descrive la propria strategia come per lo più aperta. Il 22% si impegna a essere solo open. Solo l'11% rimane puramente proprietario.
Gli agenti sul campo sono operatori di sistema, non interfacce chat. Pensavamo che gli agenti avrebbero principalmente chiamato API. Invece, il 72,5% si collega a database. Il 61% a ricerche web. Il 56% a sistemi di memoria e file. Il 47% a interpreti di codice.
Il centro di gravità è dato ed esecuzione, non conversazione. Team sofisticati costruiscono MCP per accedere ai propri sistemi interni (58%) e API esterne (54%).
I dati sintetici alimentano la valutazione più che l'addestramento. Il 65% utilizza dati sintetici per la generazione di valutazioni rispetto al 24% per il fine-tuning. Questo indica un'imminente crescita nei mercati di dati di valutazione, librerie di scenari e corpora di modalità di fallimento prima che i dati di addestramento sintetici aumentino.
Il tempismo rivela dove sta andando la stack. I team devono verificare la correttezza prima di poter scalare la produzione.
L'88% utilizza metodi automatizzati per migliorare il contesto. Eppure rimane il punto dolente numero 1 nel deployare prodotti AI. Questo divario tra l'adozione degli strumenti e la risoluzione dei problemi indica una sfida fondamentale.
Gli strumenti esistono. Il problema è più difficile di quanto una migliore ricerca o un'interpretazione più intelligente possano risolvere.
I team hanno bisogno di sistemi che verifichino la correttezza prima di poter scalare la produzione. Gli strumenti esistono. Il problema è più difficile di quanto una migliore ricerca possa risolvere.
Il contesto rimane la vera sfida e la più grande opportunità per la prossima generazione di infrastrutture AI.
Esplora il set di dati interattivo completo qui : o leggi l'analisi completa di Lauren :