24小时内活跃

ZzzT

• UID:14739
综合分:42
北京市
兼职
1-3年经验
方向: 人工智能-语音识别与合成 后端-C

技能

核心技能: C
其他技能: Python、C++、C/C++、PyTorch、Adobe Photoshop
交流语言: 普通话( 母语水平 ) 英语( 无需工具可书面交流 ) 俄语( 借助工具可书面交流 ) 法语( 借助工具可书面交流 )
行业经验: 音视频 人工智能

项目案例

DRC动态控制算法
压缩器:压缩器是一种音频处理工具,用于减小音频信号的动态范围。它通过降低信号峰值幅度,使弱信号更明显,增强整体声音的一致性和控制感。 扩展器:扩展器与压缩器相反,用于增加音频信号的动态范围。它可以减少背景噪音,使得音轨中的安静部分更加安静,主要用于改善音频清晰度和减少不想要的噪音。 噪声门:噪声门是一款专门设计用来消除背景噪音的效果器。当输入信号低于设定阈值时,噪声门会关闭,阻止任何声音通过,从而有效地消除无声期间的噪音。 门限器:门限器是一种特殊的压缩器,其作用是当信号电平超过或低于某个设定阈值时,对信号进行截断处理,确保输出电平保持在固定的范围内,常用于防止过载和保护音响设备。
音视频
VALPSOLA语音变调算法
VALPSOLA语音变调算法能够在不损害语音自然度的前提下,独立调节语速与音调,广泛适用于实时通讯场景。该算法可有效抑制啸叫、实现变调变声功能,提升通话质量与用户体验,同时具备低延迟特性,端到端延迟控制在80ms左右,满足实时交互需求。
音视频
Multicomp多段压缩算法
多段压缩算法通过将音频信号划分为多个频段,针对性调节各频段动态范围、增益,并且可以自主划分频段,适应不同采样率语音流,提升音质和清晰度,广泛应用于专业音频处理和通信领域,满足高质量音频需求,具有重要研究价值和应用前景。
音视频
DTMF音实时监测
该功能实现对语音流中DTMF信号的实时检测与解析,支持多种采样率和编码格式,具备高识别准确率和强抗干扰能力,识别率达到99%以上。通过精准捕捉和解码DTMF信号,满足通信设备对信令控制的严格需求,确保系统稳定可靠运行,有效提升通信系统的智能化水平和交互效率,增强用户体验和业务响应速度,适用于网关、IP电话及其他通信终端设备的广泛应用场景。
音视频
语音流3A算法
语音流3A算法集成自动增益控制、回声消除和噪声抑制三大核心技术。AGC动态调节麦克风输入音量,确保语音信号稳定;AEC通过识别并消除扬声器反馈的回声,避免声音重叠干扰;ANS则有效抑制环境噪声,提升语音清晰度。该算法支持多采样率及多平台,具备低延迟和高兼容性,满足视频会议、语音通话和智能助手等场景需求,极大改善用户通话体验。
音视频

工作经历

XX通讯设备有限公司
  
501-1000人
语音算法开发工程师
2023.06 - 2025.07
语音算法开发、语音功能开发、编解码开发、AI算法开发、大模型Agent开发

教育经历

中国民航大学
2015.09 - 2019.06
电子信息工程
本科
北京信息科技大学
2020.09 - 2023.06
电子信息工程
硕士

个人简介

熟练C、C++、python语言,精通嵌入式设备的语音传统算法设计、实现和落地。熟悉AI AGENT开发及API数据收发开发。
成功交付率
100%
相似推荐
成都市
后端-C
技能:C
贵阳市
后端-C、人工智能-具身智能与机器人
技能:C
北京市
后端-C、网络-网络
技能:C、C++、Redis、Docker Network
西安市
后端-C、后端-后端其他
技能:C、C/C++、MySQL Workbench、CMake、Linux Driver
南宁市
后端-C
技能:C
帮助文档   Copyright @ 2021-2024 程序聚合 | 浙ICP备2021014372号
人工客服