AlibabaがNeurIPS 2025で146本の論文が受理され、モデルトレーニング、データセット、基礎研究、推論最適化を網羅し、テック企業の中でもトップクラスであることをお知らせできることを嬉しく思います! 🚀受賞論文「大規模言語モデルのためのゲーテッドアテンション:非線形性、スパーシティ、アテンションシンクフリー」は、アテンションゲーティングが大規模モデルのパフォーマンスにどのように影響するかを体系的に探求した初のものです。 続きを読む: #AlibabaAI