ByteDance giới thiệu Mạng Độ Rộng Ảo (VWN) để mở rộng quy mô AI hiệu quả Khung mới này mở rộng không gian nhúng mô hình để có các biểu diễn rộng hơn trong khi giữ cho tính toán không đổi. Nó tăng tốc tối ưu hóa hơn 2 lần cho dự đoán token tiếp theo và 3 lần cho dự đoán 2 token tiếp theo!