首页 > 快讯 > 杜绝信息泄露!OpenAI 发布 Privacy Filter,支持12.8万超长上下文及8类隐私识别

杜绝信息泄露!OpenAI 发布 Privacy Filter,支持12.8万超长上下文及8类隐私识别

发布时间:2026-04-28 09:59:29 | 责任编辑:张毅 | 浏览量:5 次

OpenAI 近日宣布推出一款前沿的个人身份信息(PII)脱敏模型——Privacy Filter。该模型目前已通过 Apache2.0协议在 Hugging Face 和 GitHub 同步开源,旨在为开发者提供一个可本地运行、支持高度定制的隐私保护工具。
区别于传统的规则匹配工具,Privacy Filter 具备深层的语言理解能力。它能根据上下文语境,精准识别非结构化文本中的敏感信息。这意味着它在有效遮盖个体私密数据的同时,能够最大限度地保留文本中的公开有用信息。
在技术架构上,该模型展现了极高的灵活性与效率:
混合专家(MoE)设计: 虽然总参数规模达 15亿,但每次推理仅激活约 5000万个参数。这使得它可以在笔记本电脑甚至浏览器等资源受限的边缘设备上流畅运行。
超长上下文支持: 具备 12.8万 Token 的上下文窗口,利用双向 Token 分类架构和受限维特比算法,确保了长文本处理的连贯性与准确性。
高精度识别: 在 PII-Masking-300k 基准测试修正版中,该模型取得了 97.43% 的 F1分数,其中召回率高达98.08%。
Privacy Filter 能够精准识别并标注八类核心敏感信息:
基础身份: 姓名、地址、电子邮箱、电话号码。
网络资产: URL 链接。
金融安全: 账号信息(含银行卡、信用卡等)。
机密凭证: 密码、API 密钥等。
时间敏感: 日期信息。
OpenAI 将其定位为预过滤层。用户在将文本发送至云端大模型前,数据可先在本地完成 PII 检测与脱敏。这种“数据不离设备”的处理方式,有效解决了用户误将隐私信息粘贴至 AI 工具的风险。
虽然该工具功能强大且支持微调,但 OpenAI 同时也提醒,在医疗、法律、金融等高敏感领域,人工审核与领域特定的微调依然不可或缺。

杜绝信息泄露!OpenAI 发布 Privacy Filter,支持12.8万超长上下文及8类隐私识别

这是一篇关于告别信息泄露!OpenAI 推出 Privacy Filter,支持12.8万超长上下文与8类隐私识别的文章,内容值得关注。

©️版权声明:
本网站(https://aigc.izzi.cn)刊载的所有内容,包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏,以及其他非商业性或非盈利性用途,但同时应遵守著作权法及其他相关法律的规定,不得侵犯本网站及相关权利人的合法权利。除此以外,将本网站任何内容或服务用于其他用途时,须征得本网站及相关权利人的书面许可,并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容,请及时通知本站,予以删除。

最新Ai信息

最新Ai工具

热门AI推荐