
隐私过滤器:本地化数据脱敏助手,AI 辅助前的安全护航
Privacy Filter 是一款本地化的个人隐私信息识别与脱敏工具,旨在保护敏感数据在分享或发送至 AI 工具前不被泄露。它通过智能识别姓名、电话、邮箱等敏感信息,并一键生成占位符,确保数据安全。
Privacy Filter 是一款浏览器端的 PII 识别与脱敏工具,用于在文本或截图分享前识别并隐藏姓名、邮箱、电话、地址、账号、URL、日期和密钥等敏感信息。
对于开发者、运营和客服人员来说,将含有敏感信息的文本粘贴到 ChatGPT、Claude 或论坛和工单系统中已成为日常操作。然而,这些内容一旦发送出去,就可能超出控制范围。

Privacy Filter(隐私过滤器)就是为了解决这种“数据泄露焦虑”而设计的。它不需要将敏感文本上传到云端服务进行处理,而是在本地设备上完成识别和脱敏过程。它可以被视为发送给 AI 或公开分享前的“数据清洗站”,在发送前清除敏感字段。
本地隐私脱敏工具:它和普通查找替换的区别在哪?
如果你只需要隐藏一两个具体的手机号,使用记事本的 Ctrl+F 查找替换就足够了。但面对几百行杂乱无章的报错日志,手动删除不仅费时费力,还容易遗漏。
Privacy Filter 并非简单的规则和正则匹配,它底层调用的是 OpenAI 开源的 openai/privacy-filter 模型,并通过 Transformers.js 在浏览器本地完成推理。它能结合上下文,智能侦测出 8 类个人隐私信息(PII):

- 姓名、电话、邮箱、物理地址
- 账号/卡号、日期、URL 链接
- 开发者最容易手滑泄露的 API Key 和 Token(密钥凭证)
识别出来后,它会一键生成类似 [EMAIL]、[KEY] 这样的占位符,既保留了日志的上下文逻辑,又隐藏了关键数据。此外,它还内置了 Tesseract.js,可以将聊天截图丢进去,在本地完成 OCR 识别并给敏感词打上马赛克。

Privacy Filter 的识别过程主要发生在你的设备上。第一次打开时,浏览器需要从 Hugging Face 下载约 50MB 的模型文件,加载完成后会缓存在本地。后面再处理文本时,就不需要把内容发到服务器上跑一遍。浏览器支持 WebGPU 时速度会更快,不支持也能退回 WebAssembly,只是处理时间可能长一点。
适合哪些场景:AI 提示词、日志和截图脱敏
Privacy Filter 几乎没有上手门槛,打开网页、等待模型加载完成后,就可以直接粘贴文本或上传截图处理。它更适合那些经常需要把真实业务内容发给外部系统的人。
- 开发者和运维:在 GitHub Issue、论坛求助或团队协作前,先清理 Bug 报告、服务器日志里的 Token、URL、账号和连接参数。
- 重度 AI 用户:把会议纪要、客户反馈、合同摘要或内部文档发给 ChatGPT、Claude 之前,先做一次本地脱敏检查。
- 客服、运营和行政人员:处理聊天记录、用户反馈、订单截图或表格内容时,先遮盖姓名、电话、邮箱和地址等字段。
如果团队希望把这类流程固定下来,也可以参考项目源码部署成内部使用的轻量脱敏辅助页面。它支持部署到 Cloudflare Pages、Vercel 等静态平台,但实际使用前仍要确认模型文件加载、浏览器兼容性和团队操作规范。

使用前要知道:它不能替代企业级 DLP
Privacy Filter 适合作为分享文本前的辅助检查工具,但不要把它理解成“万能合规保险”。它依赖模型识别敏感字段,面对极其口语化的人名、非标准格式的自建密钥、复杂的多语言混排,仍然可能出现漏报或误报。
生产环境主密码、客户原始数据、合同全文、财务信息这类内容,即使用 Privacy Filter 处理过,也建议再人工检查一遍。它更适合日常共享前的轻量脱敏,不能替代企业级 DLP、权限管理和合规审核。
Privacy Filter 的定位不复杂:它不是完整的数据安全方案,而是一个发出去之前的本地检查步骤。对经常使用 AI 工具、公开求助或跨团队共享资料的人来说,它能把敏感信息检查这一步做得更省事,也更容易形成习惯。
