首页 > 快讯 > 谨防AI数据污染！区区0.01%的伪造内容可致AI危害输出上升至11.2%

谨防AI数据污染！区区0.01%的伪造内容可致AI危害输出上升至11.2%

发布时间：2025-08-05 09:08:12 | 责任编辑：吴昊 | 浏览量：101 次

近期，国家安全部发布警告，提醒公众注意人工智能领域的数据污染问题。随着人工智能技术在社会经济中扮演越来越重要的角色，训练数据的质量显得尤为关键。国家安全部指出，虚假信息、偏见观点以及其他不良数据正严重影响 AI 的性能，给社会带来了新的安全隐患。
人工智能的核心要素包括算法、算力和数据，其中数据是训练 AI 模型的重要基础。大量高质量的数据能够帮助 AI 更好地学习内在规律，实现智能决策与内容生成。然而，当数据中掺杂了虚假信息时，就会对 AI 模型产生严重的负面影响。研究表明，仅有0.01% 的虚假文本就能导致 AI 系统输出有害内容的概率增加11.2%。即便是0.001% 的虚假文本，也会导致有害输出上升7.2%。
数据污染不仅会影响 AI 模型的准确性和性能，还可能导致一系列现实风险。例如，在金融领域，不法分子可能利用 AI 生成的虚假信息来操纵市场，导致股价异常波动。在公共安全方面，数据污染可能误导舆论，甚至引发社会恐慌。而在医疗健康领域，虚假的数据可能导致错误的诊疗建议，危害患者的生命安全。
为了应对数据污染带来的威胁，国家安全部建议加强源头监管，防止污染数据的产生。依据《网络安全法》《数据安全法》和《个人信息保护法》等法律，建立 AI 数据的分类分级保护制度，确保数据的安全性。同时，还需强化风险评估，保障数据在全生命周期内的安全流通。此外，定期对受污染的数据进行清洗和修复，以构建有效的数据治理框架，从根本上提高 AI 的数据安全能力。
国家安全部的发文提醒我们，面对人工智能快速发展的时代，确保数据的真实与安全是维护社会各领域安全的重要一环。
划重点:
🔍 仅0.01% 的虚假文本就会导致 AI 有害输出增加11.2%，提醒公众注意数据质量。
⚠️ 数据污染可能在金融、公共安全和医疗等领域引发重大风险，影响社会稳定。
🛡️ 国家安全部呼吁加强数据监管与清洗，确保 AI 技术的健康发展与应用安全。

国家安全部及多家媒体近日提醒，警惕人工智能“数据投毒”风险：当训练数据集中仅有0.01%的虚假文本时，模型输出的有害内容会增加11.2%；即使是0.001%的虚假文本，有害输出也会上升7.2%。数据投毒通过篡改、虚构等污染训练数据，干扰模型参数调整，削弱其性能，甚至诱发有害输出。此外，受污染的AI生成虚假内容可能成为后续训练数据源，形成“污染遗留效应”，导致错误信息逐代累积，扭曲模型认知能力。数据污染还可能引发金融市场操纵风险、公共安全隐患及医疗健康错误诊疗建议等现实风险。

©️版权声明：
本网站(https://aigc.izzi.cn)刊载的所有内容，包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏，以及其他非商业性或非盈利性用途，但同时应遵守著作权法及其他相关法律的规定，不得侵犯本网站及相关权利人的合法权利。除此以外，将本网站任何内容或服务用于其他用途时，须征得本网站及相关权利人的书面许可，并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容，请及时通知本站，予以删除。

上一篇：阿里巴巴通义千问推出开源新图像生成模型Qwen-Image

下一篇： ChatGPT用户量激增，突破7亿创历史记录，OpenAI年营收预计达120亿美元新高

谨防AI数据污染！区区0.01%的伪造内容可致AI危害输出上升至11.2%

最新Ai信息

最新Ai工具

热门AI推荐