本番のAIチームの70%がオープンソースモデルを使用しています。72.5%はエージェントをチャットインターフェースではなくデータベースに接続しています。これが375の技術ビルダーが実際に出荷しているもので、TwitterのAIとは全く似ていません。 チームの70%が何らかの形でオープンソースモデルを使用しています。48%は戦略をほぼオープンだと答えています。22%はオープンのみにコミットしています。純粋に独自企業のまま残るのはわずか11%です。 現場のエージェントはシステムオペレーターであり、チャットインターフェースではありません。エージェントは主にAPIを呼び出すと思っていました。代わりに、72.5%がデータベースに接続しています。61%はウェブ検索に。56%はメモリシステムおよびファイルシステムに割り当てられています。47%はコードインタプリタに。 重心は会話ではなくデータと実行にあります。高度なチームは、自社の内部システム(58%)と外部API(54%)にアクセスできるMCPを構築しています。 合成データはトレーニングよりも評価の力を発揮します。65%が評価生成に合成データを用い、24%が微調整に使用しています。これは、合成トレーニングデータがスケールアップする前に、評価データマーケットプレイス、シナリオライブラリ、故障モードコーパスが近い将来に急増することを示唆しています。 タイミングが積み重ねの行き先を示します。チームは生産を拡大する前に正確性を検証する必要があります。 88%が文脈を改善するために自動化手法を使用しています。それでも、AI製品の導入における#1の課題は依然として存在しています。このツール導入と問題解決のギャップは、根本的な課題を示しています。 ツールは存在します。この問題は、より良い検索や賢いチャンク化では解決しにくいです。 チームは生産を拡大する前に正確性を検証するシステムを必要としています。ツールは存在します。この問題は、より良い検索だけでは解決できないほど難しいです。 文脈こそが次世代AIインフラにとって最大の課題であり、最大のチャンスです。 こちらでインタラクティブなデータセット全体をご覧ください:またはローレンの完全な分析をお読みください: