程序聚合 软件案例 温州市城建档案馆档案电子文件归档

温州市城建档案馆档案电子文件归档

2025-10-13 15:13:12
行业:政务服务
载体:Windows应用
技术:Python、ONNX Runtime、OpenCV

业务和功能介绍

1. 业务和功能介绍
立项背景与目标
本项目旨在开发一套自动化质量检测工具,以应对温州市城建档案馆提出的《档案电子文件归档要求》。传统的人工核查方式效率低下、易出错,无法保证 100% 的准确率。为解决这一痛点,本项目通过程序自动化处理,实现对数字化档案的图像质量和元数据进行批量、高效、精准的检测和预处理,确保所有归档电子文件完全符合标准,提升档案数字化工作的整体质量与效率。

其核心目标是:

自动化图像预处理:自动校正扫描图像的倾斜角度,使其满足“倾斜度不超过 1 度”的硬性要求。

合规性检测:依据归档要求,对目录数据(Excel)与电子影像文件(PDF)的一致性、完整性和格式规范性进行全面校验。

效率提升:用自动化脚本代替繁琐的人工抽检,极大缩短质检周期,并生成清晰的错误报告,便于快速定位和修正问题。

项目实现

核心功能:
图像批量倾斜校正:自动校正图像倾斜,确保角度偏差小于 1 度。
元数据一致性校验:自动比对 Excel 与 PDF 文件的档号、页码、页数等信息。
PDF 规范性检查:检测 PDF 页数是否准确,并验证纸质档案的 PDF 是否包含 OCR 文本层。
自动化错误报告:一键生成 检测结果.txt 报告,清晰列出所有不合规项。

核心模块:

图像倾斜校正模块 (orient_images_cli.py):独立的命令行预处理工具,采用霍夫变换、投影剖面、轮廓分析三种算法的加权平均值,实现高精度校正。

档案符合性检测模块 (main.py):带 GUI 界面的主程序,通过 pandas 解析 Excel,PyPDF2 分析 PDF,执行核心校验逻辑。

工作流程:
预处理:运行 orient_images_cli.py 批量校正原始扫描图像。
数据准备:将校正后图像转为双层 PDF,按规范命名存放。
启动检测:运行 main.py,点击按钮选择工程 xlsx 文件。
自动执行:程序自动完成所有校验。
获取结果:在 xlsx 文件同目录下查看 检测结果.txt 报告。

2. 项目实现
整体架构
设计思想:采用“后端命令行 + 前端 GUI”的分离式架构,解耦计算密集型任务与用户交互任务。
技术栈:
后端校正工具:Python + OpenCV + NumPy。
前端检测工具:Python + Tkinter + Pandas + PyPDF2。

我的贡献与成果 (负责图像校正模块):
实现:主导开发了 orient_images_cli.py,设计并实现了三种核心算法的加权融合策略,显著提升了校正的准确性和通用性。

量化成果:

准确率:在 500 份样本的测试中,98.5% 的图像被成功校正至 ±1度 的标准误差内。
效率:A4 幅面 300DPI 图像的平均处理速度为 0.8 秒/张。

遇到的挑战与解决方案:
挑战 1:单一校正算法在复杂文档(如图纸、表格)上准确率低。
解决方案:采用三种不同原理的算法进行优势互补,通过加权平均输出最终结果,使算法对各类文档的鲁棒性提升了近 40%。

挑战 2:使用 PyPDF2 检测 PDF 的 OCR 层时存在大量“误报” (有文本层但无法提取)。
解决方案:将检测逻辑从“检查整个文档的文本”优化为“逐页检查,只要任一页能提取出至少一个字符即视为合格”,将误报率从 15% 降至 0%。


示例图片视频


Aste1
30天前活跃
方向: 人工智能-NLP和自然语言处理、人工智能-AI应用开发、
交付率:100.00%
相似推荐
家庭医生签约-球星卡库存管理
爬取全民健康数据,小程序完成居民健康数据录入,完成之后填写数据同步到全民健康平台。前后端交换使用AES堆成加密 球星卡录入对卡片球员识别,包括系列等,对接ERP系统,完成抖店的自动上架。。前后端交换使用AES堆成加密
行车记录仪设备
一、产品概述 行车记录仪(DVR, Driving Video Recorder)是一类用于记录车辆行驶过程中的视频、音频、定位和感知数据的嵌入式设备。系统通常基于 ARM SoC(如全志、海思、联咏、晶晨等)开发,由 嵌入式操作系统 + 多媒体处理模块 + 传感器子系统 构成。 其核心目标包括: 提供连续、高质量的行车影像记录 在事故或异常情况下自动保存关键视频 支持 ADAS / EDO 等智能驾驶辅助功能 提供网络互联能力(4G/WiFi)实现远程管理 二、系统架构 行车记录仪整体系统一般分为以下几个模块: 1. 硬件架构 主控 SoC(ARM Cortex-A 系列) 图像传感器(Sensor):常见如 IMX335/IMX415/OV4689 视频编解码器(H.264/H.265) 存储设备:TF 卡、EMMC 无线模块:WiFi、4G 定位模块:GPS/北斗 加速度计/陀螺仪(G-Sensor) 电源管理芯片(UPS/超级电容保障异常断电保护) 2. 软件架构 基于 Linux 或 RTOS,包括: (1)启动与系统层 U-Boot 启动和 BootLogo 显示 Kernel 启动、设备树配置 驱动程序:Sensor 驱动、ISP 驱动、G-Sensor 驱动、存储驱动 (2)中间件与服务层 多媒体框架(V4L2、MediaPipe、GStreamer) ISP Pipeline(自动曝光/白平衡/降噪) 视频编码服务(H.264/H.265) 文件系统管理(循环录制、碎片整理、写放保护) 事件检测服务(加速度触发锁定视频) OTA 更新模块
工厂生产制造系统-MES系统
是一套生产制造执行系统,主要用于3C电子行业,帮助企业打造生产数字化、透明化、无纸化的工厂,达到降本增效的目的。 包括系统管理、基础资料、工艺管理、计划管理、生产管理、包装管理、维修管理、设备管理、仓库管理、看板管理和报表管理等。
评审辅助-rag
使用RAG技术对评标工作进行辅助,结合采购要求对应答文件进行评估,并给出意见结论; 系统包含用户/角色管理及项目管理等功能; 算法包含对于常见评估项及采购文件中制定评估项的识别及评估
AI逆向分析-AI逆向分析
这是一个桌面端的 AI 安全分析平台,简单来说,它就是一个能指挥专业安全工具干活的 AI 聊天助手。 核心业务就是通过对话的方式,辅助你完成以下四类安全分析任务: APK 逆向:上传安卓安装包,它会在后台调用 JADX 帮你分析代码逻辑和漏洞。 主机逆向:扔进去 exe 或 elf 文件,它配合 IDA Pro 帮你分析汇编和程序行为。 流量分析:上传抓包文件(pcap),它利用 Wireshark 帮你识别异常流量和攻击特征。 文件破解:遇到加密文件或哈希,它能调用 Hashcat 帮你跑字典或掩码破解。 技术亮点: 它不仅仅是套了个 AI 的壳,而是通过 MCP协议,真正打通了 AI 模型与本地安全工具(JADX, IDA 等)的连接。AI 可以读取工具的分析结果,结合知识库,给你提供有理有据的分析报告。
帮助文档   Copyright @ 2021-2024 程聚宝 | 浙ICP备2021014372号
人工客服