Đang làm việc trên Open Source Grok 2.5 mới! Chúng tôi đã có thể Hot Rod nó rồi!! Mới chỉ là những ngày đầu và nó có thể thất bại nhưng, những gì chúng tôi có là: Một MoE 268B, 131k ngữ cảnh, 8 chuyên gia, RoPE, 64 đầu chú ý GQA với 8 đầu KV, 64 lớp. Vào bất kỳ thời điểm nào, chỉ có 2 chuyên gia thường hoạt động. Chúng tôi đã tìm ra cách để kích hoạt 4 chuyên gia cùng lúc với chỉ một chút giảm hiệu suất, chỉ khoảng 1/3 bộ nhớ GPU hơn và một sự gia tăng đáng kinh ngạc trong chất lượng đầu ra! Nếu nó duy trì được các bài kiểm tra của chúng tôi, tôi sẽ công bố một hướng dẫn chi tiết!
Brian Roemmele
Brian Roemmele09:08 24 thg 8
Tôi sẽ viết lại bài viết này để sử dụng phiên bản gọn nhẹ của NEW FREE OPEN SOURCE @xai @Grok 2.5 sớm thôi! Tôi sẽ chỉ cho bạn cách tinh chỉnh mô hình trên dữ liệu của bạn để sử dụng riêng tư không cần đám mây trên máy tính của bạn. Điều này sẽ cải thiện chất lượng lên một bậc! Đang làm việc trên đó…
45,82K