程序聚合 软件案例 yolo+RCNN OCR识别

yolo+RCNN OCR识别

2025-06-04 09:56:02
行业:人工智能
载体:算法模型
技术:PyTorch

业务背景

要求对含有文字得图片中对文字进行提取。考虑到图片过大,文字占比过小的原因,采取了在网上下载的数据集,并加上自己的标注。使用yolo提取目标文字。从而对文字进行识别。

功能介绍

yolo先将图片上的文字提取出来,并对文字部分进行裁剪。将裁剪之后的图片送入到RCNN网络中对裁剪后的图片进行文字提取。并封装成后端接口,供前端调用。能够实现图片上传,图片裁剪以及文字提取。

项目实现

yolo先将图片上的文字提取出来,并对文字部分进行裁剪。将裁剪之后的图片送入到RCNN网络中对裁剪后的图片进行文字提取。并封装成后端接口,使用fastapi对前端的post和get请求进行处理,返回识别的文字结果。

示例图片视频


半个石头
30天前活跃
方向: 人工智能-计算机视觉与图像处理、
交付率:100.00%
相似推荐
ccgis
基于Vue的quasar框架编写,使用supermap iserver提供的地图服务和数据服务,实现了长春市地图的展示和查询功能。网址如下。https://gitee.com/its-hard-to-be-distracted/ccgis 1,地图展示与测量。使用leaflet等其他技术栈实现。 2,地图路径规划。 3,地图旅游景点规划。 4,实现了天气查询以及天气帮助别人提出建议
中国海影城-奔跑吧乐园-奔跑吧乐园
1、门票服务:支持乐园门票在线购买、订单查询、二维码核销入园,同步展示特惠活动及有效期。 2、地图导览:手绘乐园地图可视化展示,标注项目、餐饮、住宿、卫生间等点位,支持定位导航与项目详情查看。 3、游玩指南:园区公告实时更新(如设备检修、活动通知),提供项目开放时间、排队预估等实用信息。 4、个人中心:订单管理、消费记录、发票申请等功能,方便用户追踪行程及售后需求。
汽车制动系统零部件自动化检测上位机软件
系统首先利用外部激振源对待测工件进行激振,激振发出0--20KHZ的声共振信号,对声共振信号进行检测分析后,再结合工业视觉检测算法识别出工件轮廓的形变情况,整体评价出工件的质量检测结果。
农村有限空间-微信小程序
该项目主要有危险源视频实时监控、危险源告警信息推送、告警信息可进行人工处理(包含历史记录)、危险源现场作业审批功能(申请作业、审批作业、在线签字、作业记录查看)、告警信息短信推送等主要功能
基于国产32位芯片的DTU模块-自制DTU
4G全网通通信 串口设备免布线直连云平台 Modbus从机协议 兼容90%工业设备,无需改造原有系统 双路IO输入检测 实时监测设备启停/故障信号(如急停按钮) 双路继电器输出 远程控制设备通断(如重启故障电机) 多种LED以表征设备运行状态 (如联网状态灯,程序运行灯,电源灯等) 业务逻辑如下: 设备上电时先启动硬件自检(若自检失败则设备故障灯报警),后从单片机Flash存储空间读取掉电数据并使用(免去了用户需要多次配置的时间),由移远模块自主联网(自带移动运营商物联网卡,若联网失败则尝试重连连接超次后,写入485寄存器联网状态为异常可通过485指令读取),485作为从机时刻等待总线数据,当处理到来自4G网络端/485总线上的命令后即时处理(如使能输出IO1通道,读取IO输入IO1通道返回对应处理结果)
帮助文档   Copyright @ 2021-2024 程序聚合 | 浙ICP备2021014372号
人工客服