该项目的主要需求为实现户口本以及营业执照上所有信息的准确识别,同时保证识别速度,通过Flask部署为服务接口,供网站以及app端调用。用户拍照或上传包含户口本以及营业执照的图片,服务器端接受base64编码,模型推理后返回json形式的解析结果
   1、户口本/营业执照目标区域标注、kie文本区域信息标注、文本方向分类数据集构建
2、基于DBNet++搭建户口本&营业执照区域检测以及文本区域检测,同时进行仿射变换
3、基于VAN搭建文本图像方向分类模型并进行方向矫正,方便后续识别
4、使用PPOCRV5进行文字识别
5、基于Layoutxlm搭建语义实体识别模型对识别的文本区域进行分类
6、基于Openvino实现PTQ量化与推理加速,基于Flask提供服务接口