程序聚合 软件案例 基于hand-graph-cnn的手部姿态估计-3D试衣镜

基于hand-graph-cnn的手部姿态估计-3D试衣镜

2025-07-29 15:05:40
行业:人工智能
载体:Windows应用
技术:C++、ONNX Runtime、PyTorch、TensorFlow Lite

业务背景

该项目属于公司的自研项目,希望通过拓展更多样化的三维检测功能,以提高自研产品的核心竞争力。

功能介绍

当前方案是rgb-based算法,模型共有三个网络。第一个网络检测21个骨骼点的uv坐标并提取深度特征信息。第二个网络利用特征信息估计出三维手部模型的所有顶点深度,然后经过第三个网络回归出21个骨骼点的深度。然后结合第一个网络的uv坐标及相机内参,将像素坐标转换到相机坐标系中。最后将预测出来的骨骼点坐标与初始姿态对齐后,再逐一计算局部旋转量,并以四元数的形式返回。运行耗时30ms(标准卷积,未压缩),经过训练后,可支持不同深度不同拍摄角度(能区分正对及背对姿势)的手部骨骼点检测。

项目实现

● 实现了实时手部驱动功能
● 实现了pytorch到tensorflow再到c++工程的商业部署过程
● 复现了训练代码,可支持不同深度不同角度的手势检测
● 封装了一个直接求解旋转量的接口,将求解旋转量的耗时降低将近4倍
● 参与生成了大批量的手部合成数据集(含合成彩图、骨骼点坐标、顶点坐标、三角面顶点索引)
● 构建了一个可供平面检测模型训练的手部数据集,数据量约1万张左右(不同尺寸、不同角度)

示例图片视频


智仝障
1天前活跃
方向: 人工智能-计算机视觉与图像处理、人工智能-机器学习与深度学习、
交付率:100.00%
相似推荐
校表自动化软件
提供直观友好的操作界面。 集成与电表协议通讯,设备控制,并配合数据平台,上传相关数据,配合嵌入式软件进行系统集成和测试, 并持续优化软件性能和稳定性, 使用多线程处理和数据缓存机制, 封装设备类,向服务端上报生产数据。
中国跨境电商交易会
1. 官方小程序(面向服务商与供货商)​ 核心交互功能:涵盖供采对接与即时沟通,支持服务商发布服务能力、供货商展示商品信息,双方可通过聊天功能实时洽谈;提供展位预约功能,用户可查看展位布局并在线预约意向展位。​ 信息展示功能:包含企业展示模块,支持上传企业资质、核心业务等信息;整合展会信息板块,实时更新展会日程、活动安排、参展企业名录等内容。​ 交易与工具功能:集成支付功能,满足展位预订、服务采购等场景的线上支付需求;设置工作台模块,用户可查看个人预约记录、沟通消息、交易订单等信息,实现业务集中管理。​ 2. 后台管理系统(面向展会主办方)​ 基础管理功能:支持展位管理(展位信息维护、布局设计、预约状态监控)、订单管理(支付订单审核、交易记录查询)、企业信息管理(参展企业资质审核、信息维护)。​ 数据与运营功能:通过 Echarts 实现数据统计可视化,展示参展人数、展位预订率、交易金额等核心数据;提供商品管理功能,审核供货商上架商品信息;支持展会活动信息发布与更新,保障展会运营顺畅。
全国土壤风蚀模型软件设计-土壤风蚀模型系统
能够综合考虑气象资料、土壤质地、地块形态和大小等多方面数据,计算输出模型所需的各参数。基于北方风沙区不同地区的实际情况进行精细调整,模型能够在小时级尺度的时间步长内估算风蚀量及风蚀尘量(PM10)。其中,WEPS模型设定当每天10m高度处最大风速超过8 m/s时,开始调用风蚀子模块。涉及计算:土壤风蚀量计算、摩阻风速u*、气象站摩阻风速计算、观测地点无植被时,摩阻风速计算、观测地点有植被时,摩阻风速计算、临界摩阻风速u*t、光滑平坦地表摩阻风速裸露地表、地表有倒放植物引起的临界起动摩阻风速增加量、含水率引起的临界摩阻风速增加、风蚀量粒径分选计算、悬移量计算步骤 、PM10计算步骤。 可以自定义绘制计算区域,进行交叉运算。 对计算结果进行不同颜色渲染。
springboot+vue后台系统
商城基本功能+后端管理系统开发。前端包括商品展示首页、分类中心、购物车功能、个人中心、实现基本商城功能和商品展示,后台包括商品上下架管理、用户管理、订单管理、商城管理等功能实现数据的管理。
爆破专业大模型系统
1数据整合与语料库构建​ 数据收集:全面收集爆破行业标准、工程案例、专利成果及外部数据源,确保数据的完整性与专业性。​ 结构化处理:对工程案例参数(如孔网参数、炸药类型等)、监测数据(振动速度、飞石距离等)进行结构化处理,设计数据存储架构,建立数据清洗与校验机制。​ 非结构化数据处理:对施工方案文本、专利技术图纸、专家经验视频等非结构化数据进行分析、提取关键信息并分类存储,运用光学字符识别(OCR)技术处理图纸,视频转文字技术处理专家经验视频。​ 实时数据接入:开发接口实现传感器振动波形、无人机影像流等实时数据的接入与存储,建立数据传输与处理的稳定性保障机制。​ 语料库构建:整合上述数据,构建包含10万+专业文本、图文、音视频的语料库,设计语料库管理系统,实现数据的高效检索与维护。 2检索系统搭建​ 文本向量化:基于 BGE-large-zh 模型对语料库中的文本进行向量化处理,优化模型参数以提高向量化精度。​ FAISS 检索系统搭建:搭建 FAISS 检索系统,实现语义匹配与多模态检索功能,设计检索算法,进行系统性能测试与优化。​ 混合检索策略实现:基于BM25+语义向量混合检索,开发意图理解模块,实现对用户提问背后安全规范需求的识别;构建上下文推理模块,根据工程环境自动过滤不适用案例;建立动态权重机制,确保最新规范条款优先检索 2垂类大模型训练​ 2.2.1语料库构建与标注​ 语料收集与筛选:收集10万+学术论文、施工方案、设备手册等专业文本,组织专业人员进行筛选,确保语料的高质量。​ 标注工作:制定标注规则,对筛选后的语料进行标注,包括专业术语标注、知识点标注等,建立标注质量审核机制。​ 2.2.2预训练模型优化​ 模型架构分析:深入分析 BERT 架构,结合爆破领域特点,确定领域适配方向。​ 模型训练与优化:基于适配方向对 BERT 模型进行训练,强化岩石力学、起爆网路设计等专业知识理解能力,调整模型超参数,进行多轮训练与验证。​ 2.2.3模型评估体系建立​ 指标设计:开发包含爆破振动预测误差率、参数优化效率等指标的行业专用评估基准,组织专家论证指标的合理性与科学性。​ 评估工具开发:开发模型评估工具,实现对训练后模型的自动化评估,设计评估报告生成功能。
帮助文档   Copyright @ 2021-2024 程序聚合 | 浙ICP备2021014372号
人工客服