DeepSeek-R1-Safe 大模型:浙大和华为联袂推出,实现AI安全与效能双重优化
发布时间:2025-09-22 11:07:32 | 责任编辑:吴昊 | 浏览量:1 次
在刚刚结束的华为全联接大会上,华为技术有限公司联合浙江大学推出了国内首个基于昇腾千卡算力平台的基础大模型 ——DeepSeek-R1-Safe。这一创新性产品旨在解决当前 AI 领域面临的安全与性能问题,开创了智能科技的新篇章。
浙江大学计算机科学与技术学院的院长任奎在会上详细介绍了这一模型的核心创新。DeepSeek-R1-Safe 是通过一个全流程的安全后训练框架构建而成,涵盖了高质量的安全语料库、平衡优化的安全训练以及自主创新的软硬件平台。这一框架的设计旨在从底层解决 AI 模型在安全训练中的关键问题。
值得一提的是,DeepSeek-R1-Safe 在千亿级参数的安全训练中实现了突破,其防御能力表现惊人。测试数据显示,该模型在对抗有毒有害言论、政治敏感内容及违法行为教唆等 14 个维度的有害信息时,整体防御成功率接近 100%。而在多种越狱模式的防御上,成功率也超过了 40%。综合安全防御能力高达 83%,在与同类模型 Qwen-235B 和 DeepSeek-R1-671B 的对比中,表现优越,超出 8% 至 15%。
此外,在 MMLU、GSM8K、CEVAL 等通用能力基准测试中,DeepSeek-R1-Safe 的性能损耗控制在 1% 以内,这表明其不仅提高了安全防护能力,同时也确保了模型的可用性,成功达成了安全与性能的平衡。
华为昇腾计算业务总裁张迪煊在会上表示,华为正在积极推动基础软件创新与 AI 安全能力建设,通过开放协作与高校和产业伙伴共同推动技术进步。同时,该模型也已在 ModelZoo、GitCode、GitHub、Gitee 等社区全面开源,让更多开发者和研究人员能够参与其中。
这一里程碑式的发布不仅为 AI 安全领域带来了新的希望,更为未来的 AI 产业生态协同发展铺平了道路。
这是一篇关于华为与浙大携手发布 DeepSeek-R1-Safe 大模型:AI安全与性能完美平衡的文章,内容值得关注。
本网站(https://aigc.izzi.cn)刊载的所有内容,包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏,以及其他非商业性或非盈利性用途,但同时应遵守著作权法及其他相关法律的规定,不得侵犯本网站及相关权利人的合法权利。除此以外,将本网站任何内容或服务用于其他用途时,须征得本网站及相关权利人的书面许可,并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容,请及时通知本站,予以删除。