很高兴分享,阿里巴巴在2025年NeurIPS会议上接受了146篇论文,涵盖模型训练、数据集、基础研究和推理优化,是科技公司中接受论文数量最高的之一! 🚀我们获奖的论文《大型语言模型的门控注意力:非线性、稀疏性和无注意力消耗》是首个系统性探讨注意力门控如何影响大型模型性能的研究。 阅读更多: #AlibabaAI