首页 > 快讯 > 华为推出盘古大模型最新版本5.5：五大核心模型全面升级深度思考功能即将发布

华为推出盘古大模型最新版本5.5：五大核心模型全面升级深度思考功能即将发布

发布时间：2025-06-20 17:13:51 | 责任编辑：张毅 | 浏览量：385 次

在今日下午举行的华为开发者大会HDC2025主题演讲中，华为常务董事、华为云计算CEO张平安宣布正式发布盘古大模型5.5，标志着自然语言处理（NLP）、计算机视觉(CV)、多模态、预测、科学计算五大基础模型迎来全面升级。
盘古自然语言处理NLP大模型方面，全新的718B深度思考模型作为由256个专家组成的MoE大模型，在知识推理、工具调用、数学等领域的能力实现大幅提升，处于行业领先地位。盘古大模型基于昇腾云的全栈软硬件训练而成，彰显了昇腾架构打造世界一流大模型的实力。此外，盘古大模型5.5在高效长序列、低幻觉、快慢思考融合、Agent等特性上进行了升级，通过自适应快慢思考合一技术，使模型能根据问题难易程度自动切换思考模式，整体推理效率提升8倍。盘古深度研究DeepDiver借助长链难题合成、渐进式奖励等技术，在网页搜索、常识性问答等应用上展现出高效执行能力，如5分钟内完成超过10跳的复杂问答、生成万字以上专业调研报告，显著提升了工作效率。
在盘古预测大模型领域，采用业界首创的triplet transformer统一预训练架构，对不同行业的数据进行统一编码和处理，极大提升了预测精度和跨行业、跨场景的泛化性。
盘古科学计算大模型方面，华为云持续深化其与科学应用领域的结合。深圳气象局基于盘古升级了“智霁”大模型，实现AI集合预报，更直观地反映天气系统演变可能性，减少预报误差。重庆市气象局针对成渝地区降水特点，打造了“天资・12h”气象大模型，提升灾害天气日内预报预警能力。深圳能源则采用盘古进行中短期风光水发电量预测，减少弃电现象，提升能源开发效率。
盘古计算机视觉CV大模型方面，华为云发布了全新MoE架构的300亿参数视觉大模型，这是目前业界最大的视觉模型，全面支持多维度、泛视觉的感知、分析与决策。同时，盘古CV大模型通过跨维度生成模型，构建了工业场景稀缺的泛视觉故障样本库，极大提升了业务场景的可识别种类与精度。
盘古多模态大模型方面，全新发布了基于盘古多模态大模型的世界模型，为智能驾驶、具身智能机器人的训练构建数字物理空间，实现持续优化迭代。在智能驾驶领域，盘古世界模型能生成大量训练数据，无需依赖高成本的路采，为智能驾驶的发展提供了有力支持。
此外，在华为云盘古大模型5.5发布后，其进一步拓展应用场景，推出了五款具备深度思考能力的行业自然语言大模型。这五款大模型分别为盘古医学Thinking大模型、盘古金融Thinking大模型、盘古政务Thinking大模型、盘古工业Thinking大模型以及盘古汽车Thinking大模型，旨在为不同行业提供更专业、更智能的自然语言处理解决方案。据悉，这五款大模型很快将正式上线，届时将为各行业带来更加高效、精准的自然语言处理体验。

6月20日下午，在华为开发者大会2025上，华为常务董事、华为云计算CEO张平安正式发布盘古大模型5.5，其五大基础模型全面升级，具体情况如下：

自然语言处理（NLP）大模型

发布718B MoE混合专家模型，由256个专家组成，在知识推理、工具调用、数学等领域大幅增强，达到业界第一梯队。
在高效长序列、低幻觉、快慢思考融合、Agent等特性上进行升级。例如，盘古提出了自适应快慢思考合一的技术，通过构建难度感知的快慢思考数据和两阶段渐进训练，实现模型根据问题难易程度自适应地切换快慢思考，简单问题敏捷回复，复杂问题深度思考，整体模型推理效率提升8倍。
盘古深度研究DeepDiver通过长链难题合成、渐进式奖励等关键技术，可以在网页搜索、常识性问答等应用上获得很高的执行效率，如可以在5分钟内完成超过10跳的复杂问答、生成万字以上的专业调研报告等，大幅提升工作效率。

计算机视觉（CV）大模型

发布全新MoE架构的300亿参数视觉大模型，是目前业界最大的视觉模型。
全面支持图像、红外、激光点云、光谱、雷达等多维度、泛视觉的感知、分析与决策。
通过跨维度生成模型，构建油气、交通、煤矿等工业场景稀缺的泛视觉故障样本库，极大地提升了业务场景的可识别种类与精度。

多模态大模型

基于该模型，华为云创新发布盘古世界模型，为智能驾驶、具身智能等构建可探索的数字训练空间。汽车企业借此高效生成复杂场景数据，支撑端到端模型快速迭代，为端到端模型“两天一个版本”的高效迭代提供了强力支撑。
盘古世界模型还有望用于火星车的避障训练，通过数百张火星照片的增训，加上模拟的深度信息，盘古生成了火星的数字物理空间，火星车可以通过对数字空间中岩石的抓取模拟，提升机械臂的操作能力。

预测大模型

采用业界首创的triplet transformer统一预训练架构，将不同行业的数据，包括工艺参数的表格数据，设备运行日志的时间序列数据，产品检测的图片数据进行统一的三元组编码，并在同一框架内高效处理和预训练。
极大地提升预测大模型的精度，并大幅提升跨行业、跨场景的泛化性。

科学计算大模型

华为云持续拓展盘古科学计算大模型与更多科学应用领域的结合。例如，深圳气象局基于盘古，进一步升级了“智霁”大模型，首次实现AI集合预报，能更直观地反映天气系统的演变可能性，减少单一预报模型的误差；重庆市气象局针对成渝地区降水局地性强，且降水强度大的特点，基于盘古打造了“天资·12h“气象大模型，提升灾害天气的日内预报预警能力；深圳能源采用盘古进行中短期风光水发电量预测，减少发电侧弃电，提升能源开发效率。

此外，会上华为云还发布了盘古医学、金融、政务、工业、汽车五个具备深度思考能力的行业自然语言大模型，加速行业智能化，并将在6月底正式上线。在过去的一年中，盘古大模型持续深耕行业，已在30多个行业、500多个场景中落地，在政务、金融、制造、医疗、煤矿、钢铁、铁路、自动驾驶、气象等领域发挥巨大价值，重塑千行万业。

©️版权声明：
本网站(https://aigc.izzi.cn)刊载的所有内容，包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏，以及其他非商业性或非盈利性用途，但同时应遵守著作权法及其他相关法律的规定，不得侵犯本网站及相关权利人的合法权利。除此以外，将本网站任何内容或服务用于其他用途时，须征得本网站及相关权利人的书面许可，并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容，请及时通知本站，予以删除。