ScanTools 是一套基于 Python 的文档处理系统,包含2个核心模块:
1、scantool: 文档敏感信息扫描工具,基于敏感规则对终端上各类办公文档进行内容检测,识别其中敏感信息,结果提供脱敏和快照功能
2、docsearch: 本地文档全文检索工具,用于办公终端上文件名以及文件内容查找功能。
系统需求来源于安全行业中个人隐私保护检查要求。本公司拥有全部知识产权。
系统前后历时3个月时间开发完毕,包括完整的需求分析、设计、编码、测试流程。
平台中:
采用开源doctotext,提供统一的文档内容提取接口。产品支持主流办公文档内容提取,监测敏感内容(身份证、手机号等)、支持OCR功能,支持建立索引。提供授权控制能力。