Z radością dzielę się informacją, że Alibaba ma 146 prac zaakceptowanych na NeurIPS 2025, obejmujących trening modeli, zbiory danych, badania podstawowe i optymalizację wnioskowania, co jest jednym z najwyższych wyników wśród firm technologicznych! 🚀Nasza zwycięska praca, "Gated Attention for Large Language Models: Non-linearity, Sparsity, and Attention-Sink-Free", jest pierwszą, która systematycznie bada, jak bramkowanie uwagi wpływa na wydajność dużych modeli. Przeczytaj więcej: #AlibabaAI