首页 > 快讯 > 腾讯公开轻便混元-A13B模型:仅需1片中低端GPU即可运行

腾讯公开轻便混元-A13B模型:仅需1片中低端GPU即可运行

发布时间:2025-06-27 16:29:01 | 责任编辑:吴昊 | 浏览量:8 次

腾讯正式发布并开源混元大模型家族的新成员——混元-A13B模型。该模型采用基于专家混合(MoE)架构,总参数规模达800亿,激活参数为130亿,在保持顶尖开源模型效果的同时,大幅降低了推理延迟与计算开销,为个人开发者和中小企业提供了更具性价比的AI解决方案。
据腾讯方面介绍,混元-A13B模型在极端条件下仅需1张中低端GPU卡即可部署,用户可通过Github、HuggingFace等技术社区下载使用,模型API也已在腾讯云官网上线。这一特性使得更多开发者能够以较低成本接入前沿AI技术,推动创新应用落地。
在性能表现上,混元-A13B模型在数学、科学和逻辑推理任务中展现出领先效果。例如,在数学推理测试中,模型能够准确完成小数比较并展现分步解析能力。此外,该模型还支持调用工具生成复杂指令响应,如出行攻略、数据文件分析等,为智能体(Agent)应用开发提供了有力支持。
技术层面,混元-A13B模型通过预训练中使用20万亿高质量网络词元语料库,提升了模型推理能力的上限,并完善了MoE架构的Scaling Law理论体系,为模型设计提供了可量化的工程化指导。同时,模型支持用户按需选择思考模式,快思考模式提供简洁高效输出,慢思考模式则涉及更深推理步骤,兼顾了效率与准确性。
为进一步推动AI开源生态发展,腾讯还开源了两个新数据集。其中,ArtifactsBench主要用于代码评估,构建了包含1825个任务的新基准;C3-Bench则针对Agent场景模型评估,设计了1024条测试数据,以发现模型能力的不足。
此次混元-A13B模型的开源,是腾讯在AI领域持续投入的又一成果。未来,腾讯混元大模型家族还将推出更多尺寸、更多特色的模型,与社区共享实践技术,共同促进开源生态的繁荣。
体验入口:https://hunyuan.tencent.com/
开源地址:https://github.com/Tencent-Hunyuan

腾讯公开轻便混元-A13B模型:仅需1片中低端GPU即可运行

腾讯开源的轻量级混元-A13B模型具有低算力需求的特点,仅需1张中低端GPU卡即可部署。这使得个人开发者和中小企业在资源有限的情况下也能轻松使用该模型。此外,该模型在数学、科学和逻辑推理任务中展现出领先效果。

©️版权声明:
本网站(https://aigc.izzi.cn)刊载的所有内容,包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏,以及其他非商业性或非盈利性用途,但同时应遵守著作权法及其他相关法律的规定,不得侵犯本网站及相关权利人的合法权利。除此以外,将本网站任何内容或服务用于其他用途时,须征得本网站及相关权利人的书面许可,并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容,请及时通知本站,予以删除。

最新Ai信息

最新Ai工具

发表回复