ByteDance představuje Virtual Width Networks (VWN) pro efektivní škálování AI Tento nový rámec rozšiřuje prostor pro vkládání modelů pro širší reprezentace při zachování konstantní výpočetní kapacity. Zrychlí optimalizaci více než 2x pro next-token a 3x pro predikci next-2-tokenů!