程序聚合 软件案例 即时在线数字人

即时在线数字人

2025-06-12 17:49:29
行业:社交、人工智能
载体:H5
技术:Python、OpenCV、PaddlePaddle、PyTorch

业务背景

现在市面上常的数字人是静态渲染成视频的。
项目立项的时候就希望做成可以直播的数字人,响应速度即快,同时可以通过大语言模型实时回答问题。

功能介绍

1、前端语音或者文字输入问题
2、后端接受到语音,通过asr转化成文本,输入给大模型,大模型推理出结果后,发送给TTS模块,tts模块将文本转化成wav语音,口型模块加载底图(视频)和wav波形,生成序列帧,后端把序列帧发送给客户端完成语音+视频的结果反馈。

项目实现

全部我一个人做的。
TTS文本转语音的性能优化,口型模块性能优化,这是两个最核心的需求点,如果速度不快,就会卡住不流畅。

示例图片视频


雷r
30天前活跃
方向: 人工智能-语音识别与合成、人工智能-计算机视觉与图像处理、
交付率:100.00%
相似推荐
WIC绘图
拥有一组统一的图像编码/解码器并支持扩展 用户可根据需要在原有基础上扩展图像编码、解码器或使用自定义编码、解码器对图像进行加密 用户可直接操作图像的元数据 用户可将同一纹理数据通过不同的CMake参数在不同的DirectX引擎中使用
旅行消了个消
该游戏是一个融合了核心三消引擎、主题化关卡场景、资源经济系统、收集成就体系、角色成长(装备升级)和玩家数据管理的综合应用。各模块协同工作,为玩家提供了沉浸式的环球旅行主题消除体验,并通过目标驱动、收集系统和成长机制维持长期吸引力。技术实现上需关注引擎效率、数据管理、资源加载和模块间的解耦。
怀旧游戏聚合平台-91soyo
主要是提供java游戏的展示和下载,这些java游戏因为年代久远,慢慢就没有网站提供下载,但是爱好者还是很多。还提供了上传服务,让小伙伴们能有平台上传自己收藏的游戏。更重要的是有类似贴吧的交流社区,畅所欲言对java游戏的喜爱。还能描述自己已经忘记名字到还有些零碎记忆,群策群力找回当年属于自己的感动
基于LightGBM的游戏商品推荐-火元素西游2
在新的大数据处理流水线中,整合了数据日志采集、队列数据同步数仓、实时/离线统计、用户画像、用户留存预测、用户真实性别预测、用户真实年龄预测、用户商品推荐等功能,并为以上功能统一了接口规范(包括数据同步、数据统计、模型的训练和预测),便于日后业务拓展需要。
资源管理
本项目由Win32、菜单栏、树视图、快捷菜单以及右侧绘图区组成 使用者可以根据自己所需新建或修改已有的文件(并加以保存) 可以在树视图上呼出快捷菜单进行插入结点以及删除结点。 可对树视图项名称进行编辑。 有复选框供将来扩展 对树视图项进行拖拽功能 "修改树视图项背景"功能
帮助文档   Copyright @ 2021-2024 程序聚合 | 浙ICP备2021014372号
人工客服