本地离线 PDF 全能处理桌面工具-DocPdf Toolbox
立项背景和目标: 日常处理财务报表、政务文件等敏感文档时,在线转换工具存在隐私泄露风险,商业PDF软件(如Adobe)收费高昂且功能臃肿。目标是做一款「零网络连接、双击即用」的本地桌面PDF处理工具,所有计算在用户硬件完成,杜绝数据外传。
核心功能(4大模块,16项原子功能):
①全格式双向转换:集成 LibreOffice Headless 引擎,支持 doc/docx/xls/xlsx/ppt/pptx/txt → PDF 高保真转换;逆向支持 PDF → Word(还原排版)、PDF → Excel(智能表格提取)、PDF → PPT(页面无缝转幻灯片)、PDF → 300DPI PNG序列;②PDF深度处理:无损合并、按页拆分、批量旋转、极限压缩(PyMuPDF garbage=4 + Deflate双重清理)、批量中文水印、精准选页重排(支持逻辑字符串如 1,3,5-10)、原始图像无损剥离(扫描内部二进制流提取原图,非截图);③本地OCR识别:集成Tesseract 5.4,2倍高清渲染矩阵(fitz.Matrix(2,2))提升中文识别率,支持单张图片识别和多页扫描版PDF全文提取,chi_sim+eng双语配置;④安全保护:AES-256加密/解密,支持密码设置与归档解锁。
业务流程: 用户拖入文件 → 左侧导航选择功能模块 → 核心引擎(DocumentConverter / PDFManager / OCREngine)处理 → 输出到本地指定目录,全程无网络请求,支持深色/浅色主题切换。
工业互联网