30天前活跃

雷r

• UID:13201
综合评分 33
方向: 人工智能-语音识别与合成 人工智能-计算机视觉与图像处理
上海市
500元/8h
10年以上经验
求职意愿:接单·(30天前更新)

个人简介

AI大模型知识库RAG,大模型推理性能优化.TTS语音训练,ASR,口型,在线翻译模型等。face detection

技能

核心技能: Python
其他技能: JavaScript
交流语言: 英语( 借助工具可书面交流 ) 普通话( 母语水平 )
行业经验: 电商 游戏/电竞 人工智能

项目案例

即时在线数字人
1、前端语音或者文字输入问题 2、后端接受到语音,通过asr转化成文本,输入给大模型,大模型推理出结果后,发送给TTS模块,tts模块将文本转化成wav语音,口型模块加载底图(视频)和wav波形,生成序列帧,后端把序列帧发送给客户端完成语音+视频的结果反馈。
社交 人工智能

工作经历

自由职业
  
5人以下
自由职业
2001.03 - 2025.05
AI大模型知识库RAG,推理性能优化.TTS语音训练,ASR,口型,在线翻译模型等。

教育经历

安徽理工大学
1997.09 - 2001.07
环境工程
本科
相似推荐
上海市
人工智能-计算机视觉与图像处理、前端-Web前端
技能:C++、C/C++、Python、JavaScript
杭州市
人工智能-计算机视觉与图像处理、人工智能-AI应用开发
技能:Python、MATLAB、C、C++
杭州市
后端-C++、人工智能-计算机视觉与图像处理
技能:OpenCV、C++、C#
宁波市
人工智能-计算机视觉与图像处理、桌面端-Qt
技能:Python、C++
成都市
人工智能-计算机视觉与图像处理
技能:PyTorch
帮助文档   Copyright @ 2021-2024 程聚宝 | 浙ICP备2021014372号
人工客服