首页 > 快讯 > 微软推出全新开源模型 MAI-DS-R1：改进敏感话题回应，减少安全隐患

微软推出全新开源模型 MAI-DS-R1：改进敏感话题回应，减少安全隐患

发布时间：2025-04-18 17:25:54 | 责任编辑：字母汇 | 浏览量：579 次

微软在其官网上正式开源了 DeepSeek-R1的魔改版 ——MAI-DS-R1。这一新模型在保留原有推理性能的基础上，进行了显著的增强，尤其在对敏感话题的响应能力上取得了巨大的突破。
MAI-DS-R1的响应能力达到了99.3%，是原版 R1的两倍多。这一进步将对政治学、社会问题以及伦理道德的研究提供极大的支持。尽管其响应了更多的敏感话题，但在安全风险方面，MAI-DS-R1的有害内容降低了50%，展现出良好的安全控制能力。因此，渴望体验 “放飞自我” 版的用户可以尝试这一模型，探索新的可能性。
在模型的训练过程中，微软收集了约350，000个被屏蔽的主题示例，并筛选出相关的查询关键词。这些关键词被转化为多个问题并翻译成不同语言，进一步提升了模型的多语言适应性。此外，微软利用 DeepSeek R1及内部模型生成了相关问题的答案和思维链。训练数据还包括来自 Tulu3SFT 数据集的110，000个安全和违规示例，确保了模型在多种情况下的有效性。
经过全面评估，MAI-DS-R1在敏感话题的响应能力上表现出色，远超 DeepSeek R1及其衍生版本。在安全性评估中，MAI-DS-R1在 HarmBench 测试中表现不俗，显示出能够有效减少有害内容的能力，确保安全性和响应能力之间的良好平衡。
在推理能力方面，MAI-DS-R1与 DeepSeek R1保持一致，在常识、推理、数学和编程的基准测试中均表现优异。与此同时，该模型在处理不合法或不道德的请求时更加谨慎，拒绝生成任何有害或不当内容。
此外，MAI-DS-R1在后续的训练过程中将问题翻译成多种语言，使其能更好地满足国际组织、跨国企业及教育机构等多语言需求的场景。微软已在 huggingface 开源了该模型，并在 Azure AI Foundry 进行了发布，为广大用户提供了更多的选择。
huggingface:https://huggingface.co/microsoft/MAI-DS-R1
Azure地址:https://ai.azure.com/explore/models/MAI-DS-R1/version/1/registry/azureml
划重点:
🌟 MAI-DS-R1的敏感话题响应能力提升至99.3%，是原版 R1的两倍多。
🔒 安全风险大幅降低，有害内容减少50%，确保使用安全。
🌍 多语言支持能力强，更适应国际组织和跨国企业的需求。

微软于2025年4月18日开源了DeepSeek-R1的魔改版MAI-DS-R1，这一新模型在多个方面进行了显著增强：

敏感话题响应能力提升

响应率：MAI-DS-R1能够响应99.3%的敏感话题提示，相比原版R1提升了2倍。这使得它在政治学术研究、社会问题、伦理道德研究等领域具有巨大价值。
训练方法：微软从约35万个被屏蔽的主题示例中收集和筛选查询关键词，转化为多个问题并翻译成不同语言，还通过DeepSeek R1和内部模型为这些问题生成答案和思维链。此外，训练数据中纳入了来自Tulu3 SFT数据集的11万个安全和违规示例，涵盖CoCoNot、WildJailbreak和WildGuardMix等内容。

安全风险降低

风险降低程度：MAI-DS-R1在安全性评估中，有害内容的风险降低了50%。在HarmBench评估中表现出色，相比DeepSeek R1和R1-1776，在减少有害内容方面降低了50%风险。
安全性表现：该模型在处理非法或不道德的请求时更加谨慎，拒绝生成有害或不当的内容。

推理能力保持不变

MAI-DS-R1保持了与DeepSeek R1相同的推理能力，在一般知识、推理、数学和编程基准测试中表现非常出色。

多语言支持

在后训练过程中，微软将问题翻译成多种语言，使MAI-DS-R1能够更好地适应不同语言环境下的需求。这使得它在国际组织、跨国企业、教育机构等需要多语言支持的领域，能够提供高质量的多语言回答。

开源与发布

目前，微软已经在Hugging Face开源了该模型，同时在Azure AI Foundry进行了发布。开源地址为：https://huggingface.co/microsoft/MAI-DS-R1，Azure地址为：https://ai.azure.com/explore/models/MAI-DS-R1/version/1/registry/azureml。

©️版权声明：
本网站(https://aigc.izzi.cn)刊载的所有内容，包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏，以及其他非商业性或非盈利性用途，但同时应遵守著作权法及其他相关法律的规定，不得侵犯本网站及相关权利人的合法权利。除此以外，将本网站任何内容或服务用于其他用途时，须征得本网站及相关权利人的书面许可，并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容，请及时通知本站，予以删除。