腾讯重磅宣告大模型战略更新,Turbo S 和 T1 模型迎来全面换代革新
发布时间:2025-05-21 14:18:14 | 责任编辑:吴昊 | 浏览量:9 次
5月21日,腾讯宣布其混元大模型矩阵全面升级,标志着腾讯在人工智能领域的技术能力持续提升。此次升级涵盖了多个方面,包括旗舰快思考模型混元TurboS、深度思考模型混元T1的升级,以及基于TurboS基座新推出的视觉深度推理模型T1-Vision和端到端语音通话模型混元Voice。此外,腾讯还同步更新了混元图像2.0、混元3D v2.5及混元游戏视觉生成等一系列多模态模型。
在全球公认的权威大语言模型评测平台Chatbot Arena上,混元TurboS的排名已攀升至全球前八,国内仅次于DeepSeek。这一成就得益于预训练阶段的tokens增训以及后训练阶段引入的长短思维链融合技术,使得TurboS在理科推理、代码能力和竞赛数学成绩上均取得了显著提升。年初发布的混元TurboS作为业界首款大规模混合Mamba-MoE模型,在效果与性能上已展现出显著优势。
深度思考模型混元T1自年初上线后持续快速迭代,近期也迎来了新升级,在竞赛数学、常识问答和复杂任务的Agent能力上均实现了提升。基于TurboS的基座模型,混元进一步拓展了图片和音频的多模态理解能力。新发布的混元视觉深度推理模型T1-Vision支持多图输入,具备原生长思维链,能够轻松实现“边看图边思考”,整体效果和理解速度相比此前的级联方案都有显著提升。端到端语音通话模型混元Voice实现了低延迟语音通话,响应速度提升超过30%,拟人性和情绪应用能力也有明显提升,目前已在腾讯元宝App灰度上线。
在多模态生成领域,混元图像2.0率先实现“毫秒级”生图,GenEval基准测试准确率超95%,在主观画面质量和美学层面的人工测评中表现出色。混元3D v2.5凭借业界首创的稀疏3D原生架构,实现了可控性与超高清生成能力的代际飞跃,几何模型精度提升10倍,纹理贴图达4K。在端到端评测中,混元文生3D和图生3D均取得了优异成绩。
在游戏领域,混元推出了精通游戏美术与术语的混元游戏视觉生成模型,涵盖游戏技能特效生成、角色动态立绘、实时交互游戏世界模型、角色多视图等五大子模型。混元游戏视觉生成平台也正式上线,面向工业级游戏资产生成,让游戏美术设计效率提升数十倍。近期,混元还将推出首个大规模、可漫游3D场景生成模型,支持沉浸式交互、多样风格场景生成及360°全景漫游体验,助力游戏、具身智能等行业创新。
腾讯云副总裁、腾讯混元大模型技术负责人王迪表示,混元正加速向智能化的深度与广度迈进,为AI普惠与产业升级提供坚实支撑。混元坚定拥抱开源,持续推进多尺寸、多场景的全系模型开源。目前,混元已实现图像、视频、3D、文本等在内的全模态开源,其中混元3D模型Hugging Face下载量超过160万。未来,混元计划推出多尺寸混合推理模型,适配企业与端侧不同需求,并持续开源混元图像、视频、3D等多模态基础模型及配套插件模型。
2025年5月21日,腾讯在“2025腾讯云AI产业应用峰会”上宣布其混元大模型矩阵全面升级,其大模型战略首次全景亮相。此次升级涵盖了多个方面,包括旗舰快思考模型混元Turbo S、深度思考模型混元T1的升级,以及基于Turbo S基座新推出的视觉深度推理模型T1-Vision和端到端语音通话模型混元Voice。
Turbo S模型升级
- 性能提升:混元Turbo S在全球公认的权威大语言模型评测平台Chatbot Arena上排名攀升至全球前八,国内仅次于DeepSeek。在代码、数学等理科能力方面,混元Turbo S也进入全球前十。这一成就得益于预训练阶段的tokens增训以及后训练阶段引入的长短思维链融合技术,使得Turbo S在理科推理、代码能力和竞赛数学成绩上均取得了显著提升。
- 技术优势:作为业界首款大规模混合Mamba-MoE模型,Turbo S在效果与性能上展现出显著优势。其吐字速度提升了一倍,首字时延降低了44%,能够实现“秒回”,适合需要AI快速响应的简单应用场景。
- 未来规划:未来,Turbo S将成为腾讯混元系列衍生模型的核心基座,为推理、长文、代码等衍生模型提供基础能力。
T1模型升级
- 能力提升:深度思考模型混元T1自年初上线后持续快速迭代,近期也迎来了新升级,在竞赛数学、常识问答和复杂任务的Agent能力上均实现了提升,其中竞赛数学成绩提升了8%,复杂任务的Agent能力提升了13%。
- 技术特点:T1基于Turbo S基座模型,通过引入长思维链、检索增强和强化学习等技术,进一步强化了纯推理能力,并提升了对人类偏好的对齐水平。
- 应用场景:T1模型已在腾讯元宝上线,用户可以选择DeepSeek-R1或腾讯混元T1模型进行回答。
多模态模型拓展
- 视觉深度推理模型T1-Vision:新发布的T1-Vision模型具备原生长思维链,支持多图输入,使得模型在理解图像时更加高效,整体效果比之前的级联方案提高了5.3%,理解速度也提升了50%。
- 端到端语音通话模型混元Voice:实现了低延迟语音通话,响应速度提升超过30%,拟人性和情绪应用能力也有明显提升,目前已在腾讯元宝App灰度上线。
- 其他多模态模型:混元图像2.0率先实现“毫秒级”生图,GenEval基准测试准确率超95%;混元3D v2.5凭借业界首创的稀疏3D原生架构,实现了可控性与超高清生成能力的代际飞跃,几何模型精度提升10倍,纹理贴图达4K。
开源与生态构建
- 多模态开源:目前,腾讯混元已实现图像、视频、3D、文本等在内的全模态开源,其中混元3D模型Hugging Face下载量超过160万。
- 未来开源计划:未来,混元计划推出多尺寸混合推理模型,适配企业与端侧不同需求,并持续开源混元图像、视频、3D等多模态基础模型及配套插件模型。
本网站(https://aigc.izzi.cn)刊载的所有内容,包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏,以及其他非商业性或非盈利性用途,但同时应遵守著作权法及其他相关法律的规定,不得侵犯本网站及相关权利人的合法权利。除此以外,将本网站任何内容或服务用于其他用途时,须征得本网站及相关权利人的书面许可,并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容,请及时通知本站,予以删除。
上一篇: ai数字人短视频带货能赚钱吗?
下一篇: ai数字人短视频怎么制作?