首页 > 快讯 > NeurIPS 2025 杰出论文公布:阿里通义千问凭借“门控注意力”机制荣获中国唯一重量级奖项

NeurIPS 2025 杰出论文公布:阿里通义千问凭借“门控注意力”机制荣获中国唯一重量级奖项

发布时间:2025-11-28 18:09:20 | 责任编辑:张毅 | 浏览量:1 次

全球 AI 顶会 NeurIPS 2025 今晚公布获奖名单,阿里巴巴通义千问团队凭《Attention Gating Makes Better Foundation Models》拿下最佳论文奖,成为 4 篇获奖论文中唯一中国面孔。本届大会共收稿 2 万篇,录取率仅 25%,竞争强度创历史新高。
论文核心是一把“滑动门”:在标准注意力后加一层可学习的门控,实时决定哪些头、哪些 token 继续参与下游计算。实验显示,1.7 B 稠密模型与 15 B MoE 模型在 3.5 T tokens 上训练,**参数只增 1 %,困惑度降 0.2,MMLU 涨 2 分**,Pile 各子域均取得一致提升。团队解释,门控相当于给注意力做“安检”,无效信息被拦在 FFN 之前,计算效率与鲁棒性同步提高。
该机制已装进即将发布的 Qwen3-Next,阿里同时把代码与 1.7 B 实验模型开源至 GitHub,供社区二次验证。通义千问表示,下一步将把门控思路扩展到多模态与长文本,让“会自己过滤的注意力”成为下一代大模型的标准组件。

NeurIPS 2025 杰出论文公布:阿里通义千问凭借“门控注意力”机制荣获中国唯一重量级奖项

这是一篇关于NeurIPS 2025 最佳论文揭晓:阿里通义千问靠“门控注意力”摘下中国唯一大奖的文章,内容值得关注。

©️版权声明:
本网站(https://aigc.izzi.cn)刊载的所有内容,包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏,以及其他非商业性或非盈利性用途,但同时应遵守著作权法及其他相关法律的规定,不得侵犯本网站及相关权利人的合法权利。除此以外,将本网站任何内容或服务用于其他用途时,须征得本网站及相关权利人的书面许可,并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容,请及时通知本站,予以删除。

最新Ai信息

最新Ai工具

热门AI推荐