程序聚合 软件案例 温州市城建档案馆档案电子文件归档

温州市城建档案馆档案电子文件归档

2025-10-13 15:13:12
行业:政务服务
载体:Windows应用
技术:Python、ONNX Runtime、OpenCV

业务和功能介绍

1. 业务和功能介绍
立项背景与目标
本项目旨在开发一套自动化质量检测工具,以应对温州市城建档案馆提出的《档案电子文件归档要求》。传统的人工核查方式效率低下、易出错,无法保证 100% 的准确率。为解决这一痛点,本项目通过程序自动化处理,实现对数字化档案的图像质量和元数据进行批量、高效、精准的检测和预处理,确保所有归档电子文件完全符合标准,提升档案数字化工作的整体质量与效率。

其核心目标是:

自动化图像预处理:自动校正扫描图像的倾斜角度,使其满足“倾斜度不超过 1 度”的硬性要求。

合规性检测:依据归档要求,对目录数据(Excel)与电子影像文件(PDF)的一致性、完整性和格式规范性进行全面校验。

效率提升:用自动化脚本代替繁琐的人工抽检,极大缩短质检周期,并生成清晰的错误报告,便于快速定位和修正问题。

项目实现

核心功能:
图像批量倾斜校正:自动校正图像倾斜,确保角度偏差小于 1 度。
元数据一致性校验:自动比对 Excel 与 PDF 文件的档号、页码、页数等信息。
PDF 规范性检查:检测 PDF 页数是否准确,并验证纸质档案的 PDF 是否包含 OCR 文本层。
自动化错误报告:一键生成 检测结果.txt 报告,清晰列出所有不合规项。

核心模块:

图像倾斜校正模块 (orient_images_cli.py):独立的命令行预处理工具,采用霍夫变换、投影剖面、轮廓分析三种算法的加权平均值,实现高精度校正。

档案符合性检测模块 (main.py):带 GUI 界面的主程序,通过 pandas 解析 Excel,PyPDF2 分析 PDF,执行核心校验逻辑。

工作流程:
预处理:运行 orient_images_cli.py 批量校正原始扫描图像。
数据准备:将校正后图像转为双层 PDF,按规范命名存放。
启动检测:运行 main.py,点击按钮选择工程 xlsx 文件。
自动执行:程序自动完成所有校验。
获取结果:在 xlsx 文件同目录下查看 检测结果.txt 报告。

2. 项目实现
整体架构
设计思想:采用“后端命令行 + 前端 GUI”的分离式架构,解耦计算密集型任务与用户交互任务。
技术栈:
后端校正工具:Python + OpenCV + NumPy。
前端检测工具:Python + Tkinter + Pandas + PyPDF2。

我的贡献与成果 (负责图像校正模块):
实现:主导开发了 orient_images_cli.py,设计并实现了三种核心算法的加权融合策略,显著提升了校正的准确性和通用性。

量化成果:

准确率:在 500 份样本的测试中,98.5% 的图像被成功校正至 ±1度 的标准误差内。
效率:A4 幅面 300DPI 图像的平均处理速度为 0.8 秒/张。

遇到的挑战与解决方案:
挑战 1:单一校正算法在复杂文档(如图纸、表格)上准确率低。
解决方案:采用三种不同原理的算法进行优势互补,通过加权平均输出最终结果,使算法对各类文档的鲁棒性提升了近 40%。

挑战 2:使用 PyPDF2 检测 PDF 的 OCR 层时存在大量“误报” (有文本层但无法提取)。
解决方案:将检测逻辑从“检查整个文档的文本”优化为“逐页检查,只要任一页能提取出至少一个字符即视为合格”,将误报率从 15% 降至 0%。


示例图片视频


Aste1
30天前活跃
方向: 人工智能-NLP和自然语言处理、人工智能-AI应用开发、
交付率:100.00%
相似推荐
工业生产管理系统-钛合金管生产流程管理系统
1、工艺卡编写系统: 与宝钛原有MES系统对接,接收工艺卡工单,支持工艺参数配置、流程规则设定及可视化编辑(基于ElementUI表单组件),完成后自动下发至流程管理系统 2、流程管理系统: 集中赋码:系统下发管号至PLC设备,联动机械臂完成激光刻码,实现管材唯一标识 多环节质检:水压检测(压力参数动态监控)、超声波探伤(数据自动采集)、冷轧尺寸调控(工艺参数实时校验)、目视检验(结果线上录入),各节点数据实时回传至数据库 异常处理:检测不合格时自动触发工单冻结,并推送告警至责任人,支持流程回溯与修正
基于机器学习的工业检测图像智能识别平台
项目背景: 在工业检测数字化基础上,进一步引入 AI 技术,对大量历史底片和检测图谱进行智能分析,降低人工评定成本,提高一致性和效率。 个人职责: 1.参与智慧检测平台中 图像智能识别模块 的研发 2.负责图像数据预处理、模型训练及系统集成 3.将 AI 识别结果嵌入现有检测软件流程中
工业底片数字化工作站与评定审核系统
传统工业底片检测依赖人工评定,效率低、标准不统一。项目目标是构建 工业底片数字化工作站,实现底片采集、数字化评定、审核和报告生成的全流程软件系统。 参与工业底片数字化工作站核心功能研发。 负责底片评定审核系统的软件开发。 参与数字化交付系统的设计与实现。
相控阵全聚焦实时 3D 超声成像检测仪上位机软件
该项目用于工业无损检测领域,相控阵超声设备在检测过程中会实时输出大量全聚焦成像数据,需要在上位机端对成像结果进行 实时三维可视化展示,辅助现场检测人员进行缺陷判断和分析,对实时性和稳定性要求较高。 负责相控阵全聚焦成像结果的 3D 可视化与实时渲染模块。 参与成像数据处理与显示流程设计。 配合硬件与算法团队完成成像效果调试与优化。
电力行业数字化
专注于电力行业配网软件的设计、开发与全流程运维,凭借深厚的技术积淀与丰富的行业经验,打造适配不同应用场景的高效解决方案。目前,已有超 5 个核心项目成功落地全国 8 个以上省份,为各地配网业务的智能化升级提供稳定可靠的技术支撑。
帮助文档   Copyright @ 2021-2024 程聚宝 | 浙ICP备2021014372号
人工客服