私有化部署PaddleOCR、FunAsr框架。
PaddleOCR负责图片文字识别,PDF转换可编辑文档。
FunASR框架下配合TTS模型实现语音识别和文字转语音的能力。
以上均可以通过网页、手机APP获取服务,所有数据都储存在企业内部,推理和输出也都在企业内部完成,实现保密需求。
使以下资源能在企业内部形成数字文档,便于管理和再应用:
1.企业内部开会记录。
2.日常内部照片文字识别,如税票、生产过程的返图等。
3.日常通话记录的转化。
4.整理归档企业日常产生的数据。
5.整理形成报表供管理层查看