本项目为中小企业打造了一套从发票识别到报销审批到财务记账的全流程自动化系统。立项背景是传统报销流程中,员工手动填单耗时、财务手工录入易出错、审批流转靠群消息催办,一张报销单平均耗时2-3天。
核心功能:
1. AI发票识别:PaddleOCR + AI校验双引擎,自动提取发票号、金额、日期、销售方、税号等字段,置信度>95%自动通过,低置信度人工复核。
2. 自动填单:OCR识别结果自动写入报销表单,员工只需确认和补充事由。
3. 审批流转:对接钉钉/企业微信审批接口,按金额分级(<5000主管审批,>5000经理审批)自动推送。
4. 金蝶财务同步:审批通过后自动调用金蝶API生成凭证和会计分录。
5. 归档管理:发票PDF原件上传腾讯云COS冷存储,保留10年,支持按发票号/日期/金额多维检索。
6. 统计看板:本月处理单据数、总金额、平均审批耗时等KPI实时展示。
系统采用前后端分离架构,后端Python为核心,前端React展示审批界面和统计面板。
- OCR层:PaddleOCR进行文字检测和识别,自定义后处理正则提取发票关键字段,AI二次校验发票号码校验位和金额格式。
- 流程引擎层:自研轻量级状态机管理报销单生命周期(待识别→待审批→审批中→已通过/已驳回→已记账→已归档)。
- 集成层:钉钉开放平台API实现审批消息推送和回调;金蝶云星空WebAPI实现凭证自动生成;腾讯云COS SDK实现文件归档。
- 我独立完成全栈开发。核心难点是发票OCR准确率——不同地区/行业的发票版式差异大,通过收集200+真实发票样本微调PaddleOCR模型,将字段提取准确率从78%提升至95%+。另一个难点是金蝶API文档不全,通过抓包逆向补充了完整接口参数。系统已处理870+张发票,平均处理时间从2.1天降至2.1小时。