为解决财务人员手工录入发票信息繁琐的问题,开发的一款桌面辅助工具。用户上传发票图片或PDF,系统自动识别发票代码、号码、金额、日期等关键字段,并与Excel台账进行比对查重,最后将结构化数据导出为标准财务报表格式。该工具极大地减少了人工录入错误,将单张票据处理时间从3分钟缩短至10秒。
采用Python Flask搭建本地服务,前端使用简单的HTML/JS或PyQt做界面。图像预处理使用OpenCV进行去噪和二值化,文字识别调用第三方OCR接口并结合正则表达式提取关键信息。我负责核心识别算法的调优和数据校验逻辑。遇到的难点是倾斜图片和复杂背景的识别率低,通过引入图像矫正算法和边缘检测技术,将关键字段的识别准确率提升到了95%以上。