程序聚合 软件案例 yolo+RCNN OCR识别

yolo+RCNN OCR识别

2025-06-04 09:56:02
行业:人工智能
载体:算法模型
技术:PyTorch

业务和功能介绍

要求对含有文字得图片中对文字进行提取。考虑到图片过大,文字占比过小的原因,采取了在网上下载的数据集,并加上自己的标注。使用yolo提取目标文字。从而对文字进行识别。
yolo先将图片上的文字提取出来,并对文字部分进行裁剪。将裁剪之后的图片送入到RCNN网络中对裁剪后的图片进行文字提取。并封装成后端接口,供前端调用。能够实现图片上传,图片裁剪以及文字提取。

项目实现

yolo先将图片上的文字提取出来,并对文字部分进行裁剪。将裁剪之后的图片送入到RCNN网络中对裁剪后的图片进行文字提取。并封装成后端接口,使用fastapi对前端的post和get请求进行处理,返回识别的文字结果。

示例图片视频


半个石头
30天前活跃
方向: 人工智能-计算机视觉与图像处理、
交付率:100.00%
相似推荐
数据库智能管理与可视化平台
实现针对达梦(Dameng)和Oracle数据库的跨平台可视化管理,核心提供多数据源动态切换、智能数据冲突分析与处理、表结构ER图自动化生成、大字段(LOB)可视化处理以及各类数据库高级对象(用户、角色、存储过程、表空间)的管理功能。
智慧矿山
依托Python开发技术,结合Flask、Django框架及pandas、requests等核心库,重点完成以下开发内容,兼顾实用性与可扩展性,适配中小矿山数字化转型需求: 依托Python开源库,降低开发成本,同时通过自动化脚本替代人工重复性工作,大幅减少人工投入,快速实现降本增效;
公司内部工具
根据需求,快速整理生成统计图表。其中包括基础的数据查找、导出功能。包括基础资料查询,各种类型的统计数据,图表生成。作为wps智能表格数据来源的中间缓存服务等等。主要需求是辅助公司内部人员处理个性化需求。
车辆监控平台
本平台面向工业互联网与大数据场景,为企业车队提供全流程车辆智能管控服务,核心解决车辆实时监管、安全风险预警、运营效率低下等痛点,实现从 “被动追溯” 到 “主动防控” 的管理升级。 核心功能路径:实时监控大屏→实时报文→轨迹追溯→数据报表分析等。具体包含:1. 实时定位,地图可视化展示车辆位置、车速、车况;2. 实时报文查询,历史报文查询,车辆状态展示,设备预警等;3. 行驶轨迹回放,支持事件溯源;4. 多维度运营报表,为车队调度、成本管控提供数据支。
toB数字孪生项目-仓储AGV孪生平台
1、一比一实时数字孪生,接入wms和mcs等系统,实现数据互通 2、数据统计,预测产量、仓储流量、动态报警等 3、三维场景漫游,交互,支持固定以及漫游相机操作,旋转,拖拽,缩放等 4、场景动画与生产过程实时联动 5、实现了双端部署,即PC客户端与BS端
帮助文档   Copyright @ 2021-2024 程聚宝 | 浙ICP备2021014372号
人工客服