首页 > 快讯 > 腾讯推出 Hunyuan-A13B 开源项目:小巧设计蕴含强大 AI 能力

腾讯推出 Hunyuan-A13B 开源项目:小巧设计蕴含强大 AI 能力

发布时间:2025-06-30 09:57:36 | 责任编辑:张毅 | 浏览量:11 次

Hunyuan-A13B 是一个由腾讯最新开源的大语言模型,它以创新的设计理念,在相对较小的活跃参数规模下,实现了强大的性能表现,特别适用于资源受限的环境。
这款模型采用了细粒度 MoE(Mixture-of-Experts)架构,拥有130亿活跃参数,但总参数量高达800亿。这种设计让它在保持高效和可扩展性的同时,能够提供前沿的推理能力和通用应用支持。
Hunyuan-A13B 的核心功能亮点包括:
支持快慢思维的混合推理模式:这种独特的推理机制让模型能够根据任务需求灵活调整思考深度,提升处理复杂问题的效率。
原生256K 超长上下文理解能力:这意味着模型可以处理极长的文本输入,使其在需要大量背景信息的任务中表现出色。
在智能体任务上的卓越表现:Hunyuan-A13B 在执行各类智能体(Agent)相关任务时展现出强大的能力。
为了实现高效推理,Hunyuan-A13B 采用了 Grouped Query Attention (GQA) 技术,并支持多种量化格式。目前,该模型已开源预训练、指令微调、FP8和 INT4量化版本,方便开发者使用。
在多项基准测试中,Hunyuan-A13B 都展现出强大的竞争力,尤其是在数学、科学、编码、推理和智能体领域。
腾讯为开发者提供了全面的支持,包括使用 Hugging Face Transformers 进行交互和模型训练的详细指南。同时,对于模型部署,Hunyuan-A13B 也提供了通过 TensorRT-LLM、vLLM 和 SGLang 的支持,并提供了预构建的 Docker 镜像和量化模型部署方案,大大简化了部署流程。
Hunyuan-A13B 的开源,无疑为大模型在资源受限环境下的应用开辟了新的可能性,也为 AI 社区带来了新的创新动力。
开源地址:https://huggingface.co/tencent/Hunyuan-A13B-Instruct
github:https://github.com/Tencent-Hunyuan/Hunyuan-A13B?tab=readme-ov-file

腾讯推出 Hunyuan-A13B 开源项目:小巧设计蕴含强大 AI 能力

腾讯开源的 Hunyuan-A13B 是一款具有“小尺寸,大智慧”特点的 AI 模型,以下是其详细介绍:

基本信息

  • 参数规模:总参数量达800亿,激活参数仅为130亿。

  • 开源时间:2025年6月27日。

  • 开源平台:模型已经在 Github 和 Huggingface 等开源社区上线,同时模型API也在腾讯云官网正式上线。

技术优势

  • 高性能低参数:以小参数实现了比肩同等架构领先开源模型的成绩,在多个业内权威数据测试集上表现出色,推理速度更快,性价比更高。

  • 混合推理支持:支持快思考和慢思考两种模式,快思考模式适合追求速度和最小计算开销的简单任务,慢思考模式则涉及更深、更全面的推理步骤。

  • 长文本处理能力:原生支持256K上下文窗口,在多个长文数据集中取得了优异的成绩,能够处理几十页材料、一整本说明书等长文本内容。

  • Agent能力优化:通过建设多Agent数据合成框架,接入多种环境进行强化学习,能够根据用户指令调用多种查询工具,提供定制化服务。

  • 高效推理:采用分组查询注意力(GQA)策略,支持多种量化格式,整体吞吐是前沿开源模型的2倍以上。

训练与优化

  • 预训练:训练了20万亿tokens的语料,覆盖多个领域,显著提升了模型通用能力。构建了适用于MoE架构的Scaling Law联合公式,完善了MoE架构的Scaling Law理论体系,为模型设计提供量化指导。

  • 后训练:采用多阶段训练方式,包括监督微调(SFT)和强化学习(RL),使用高质量的指令-响应数据集,涵盖数学、代码、逻辑和科学推理等任务,进一步提升模型性能。

应用场景

  • 智能体场景:能够根据用户指令自动分解步骤,选用合适工具完成任务,如提供定制化的旅行行程规划。

  • 数据分析场景:通过调用编码工具,完成数据分析工作,并支持生成新的excel表格文件。

  • 长文本处理场景:可处理长文本材料,回答问题更准确且有逻辑。

部署与使用

  • 硬件要求低:对个人开发者较为友好,在严格条件下,只需要1张中低端GPU卡即可部署。

  • 生态融合好:已经融入开源主流推理框架生态,无损支持多种量化格式。

Hunyuan-A13B的开源,是腾讯在大模型领域的又一重要动作,其小参数、高性能的特点,将为开发者提供更高效、更经济的AI解决方案。

©️版权声明:
本网站(https://aigc.izzi.cn)刊载的所有内容,包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏,以及其他非商业性或非盈利性用途,但同时应遵守著作权法及其他相关法律的规定,不得侵犯本网站及相关权利人的合法权利。除此以外,将本网站任何内容或服务用于其他用途时,须征得本网站及相关权利人的书面许可,并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容,请及时通知本站,予以删除。

最新Ai信息

最新Ai工具

发表回复