项目需求包括判断文件图像属于什么类型的文件(标题识别),以及判断文件是否需要签字,如果需要签字则还需要判断是否签字,以及判断是否盖章,从而实现文件信息自动化核查。以接口的形式部署为服务器接口供网站端以及app端调用,模型输入为图像的base64编码,结果以json形式返回
   1、使用X-Anylabeling对文件区域进行标注;文件图像方向判断数据集准备;使用X-Anylabeling对文件标题、印章、签字标志以及签字进行目标检测数据标注
2、训练DBNet++实现文件区域裁剪并使用opencv进行仿射变换
3、训练VAN对文本图像进行方向判断并进行方向矫正,提高后续识别准确率
4、训练RT-DETR/yolov11检测标题、盖章、签字标志以及签字
5、基于PPOCRV5识别文件标题
6、将各模型导出为onnx模式,并使用ONNXRuntime进行加速推理,进行逻辑串联使用Flask提供服务接口