

OpenAI近日正式发布名为“隐私过滤器”的开源人工智能模型,专用于自动识别文本中包含的个人身份信息,并实施精准匿名化处理。该系统具备对姓名、住址、电子邮箱、电话号码、网址、日期、账户信息及密钥等八类敏感数据的高精度检测能力。
该模型基于15亿总参数量与5000万活跃参数设计,支持长达12.8万个标记的上下文处理,采用双向标记分类结构。在PII-Masking-300k测试集上,其F1得分高达96%,展现出卓越的识别准确率与泛化能力。
此次开源被视为强化数字时代隐私治理的关键一步。通过提供可本地运行且支持微调的解决方案,该工具显著降低企业在数据处理环节的技术门槛,加速满足GDPR、CCPA等全球主流数据保护法规的合规要求。
声明:文章不代表币圈网立场和观点,不构成本站任何投资建议。内容仅供参考!
免责声明:本站所有内容仅供用户学习和研究,不构成任何投资建议.不对任何信息而导致的任何损失负责.谨慎使用相关数据和内容,并自行承担所带来的一切风险.