业务一: 实现对人的身份、姿态、行为及意图的精准、实时理解,为上层应用提供可靠的结构化数据。
关键技术与功能:
高精度人脸/人体姿态追踪: 基于深度学习模型,在复杂光照和遮挡条件下,实现亚像素级的人脸关键点检测与2D/3D全身骨骼关键点追踪。功能包括头部姿态估计(Pitch/Yaw/Roll)、肢体动作捕捉、手势识别等。
移动端优化与部署: 针对资源受限的移动设备(iOS/Android),采用模型剪枝、量化(INT8/FP16)及神经网络架构搜索(NAS)等技术,将大型模型压缩至数MB级别,在保证精度的同时实现45FPS以上的实时推理性能,成功应用于AR互动、智能健身、远程协作等场景。
以人为中心的活动识别: 融合时空上下文信息,利用卷积神经网络或Transformer架构,对视频流中的人体行为进行细粒度分类与预测。可识别从简单动作到复杂交互等多种活动,服务于智慧医疗、工业安全与智能家居。
业务二: 应用最前沿的3D重建与渲染技术,降低高质量3D内容创作门槛,赋能元宇宙、数字人、电商等新兴领域。
关键技术与功能:
3D高斯泼溅 : 相较于传统的NeRF(神经辐射场),3D高斯泼溅通过数百万个可学习的3D高斯椭球体来表现场景,实现了无需训练即可实时渲染(>90 FPS)的突破,构建照片级真实感的虚拟数字人、商品3D展示及沉浸式AR/VR环境,显著提升了建模效率与交互体验。
端云协同架构: 设计并实现“轻量端侧+强大云侧”的混合架构。移动端负责实时数据采集与初步处理,云端则承担复杂的模型训练、大规模3D重建等计算密集型任务,兼顾了实时性、成本与功能上限。
全栈技术能力: 具备从底层算法创新、模型训练调优、到跨平台工程部署及API服务封装的完整闭环能力。
隐私与安全优先: 在涉及生物特征识别的项目中,严格遵循数据隐私规范,支持本地化处理方案,确保用户敏感信息不被上传。