ZzzT

• UID:14739

综合评分 39

方向：人工智能-语音识别与合成、后端-C

北京市

1000元/8h

1-3年经验

求职意愿：接单·(30天前更新)

个人简介

熟练C、C++、python语言，精通嵌入式设备的语音传统算法设计、实现和落地。熟悉AI AGENT开发及API数据收发开发。

技能

核心技能： C

其他技能： Python、C++、C/C++、PyTorch、Adobe Photoshop

交流语言：普通话（母语水平）、英语（无需工具可书面交流）、俄语（借助工具可书面交流）、法语（借助工具可书面交流）

行业经验：音视频、人工智能

项目案例

DRC动态控制算法

压缩器：压缩器是一种音频处理工具，用于减小音频信号的动态范围。它通过降低信号峰值幅度，使弱信号更明显，增强整体声音的一致性和控制感。扩展器：扩展器与压缩器相反，用于增加音频信号的动态范围。它可以减少背景噪音，使得音轨中的安静部分更加安静，主要用于改善音频清晰度和减少不想要的噪音。噪声门：噪声门是一款专门设计用来消除背景噪音的效果器。当输入信号低于设定阈值时，噪声门会关闭，阻止任何声音通过，从而有效地消除无声期间的噪音。门限器：门限器是一种特殊的压缩器，其作用是当信号电平超过或低于某个设定阈值时，对信号进行截断处理，确保输出电平保持在固定的范围内，常用于防止过载和保护音响设备。

音视频

VALPSOLA语音变调算法

VALPSOLA语音变调算法能够在不损害语音自然度的前提下，独立调节语速与音调，广泛适用于实时通讯场景。该算法可有效抑制啸叫、实现变调变声功能，提升通话质量与用户体验，同时具备低延迟特性，端到端延迟控制在80ms左右，满足实时交互需求。

音视频

Multicomp多段压缩算法

多段压缩算法通过将音频信号划分为多个频段，针对性调节各频段动态范围、增益，并且可以自主划分频段，适应不同采样率语音流，提升音质和清晰度，广泛应用于专业音频处理和通信领域，满足高质量音频需求，具有重要研究价值和应用前景。

音视频

DTMF音实时监测

该功能实现对语音流中DTMF信号的实时检测与解析，支持多种采样率和编码格式，具备高识别准确率和强抗干扰能力，识别率达到99%以上。通过精准捕捉和解码DTMF信号，满足通信设备对信令控制的严格需求，确保系统稳定可靠运行，有效提升通信系统的智能化水平和交互效率，增强用户体验和业务响应速度，适用于网关、IP电话及其他通信终端设备的广泛应用场景。

音视频

语音流3A算法

语音流3A算法集成自动增益控制、回声消除和噪声抑制三大核心技术。AGC动态调节麦克风输入音量，确保语音信号稳定；AEC通过识别并消除扬声器反馈的回声，避免声音重叠干扰；ANS则有效抑制环境噪声，提升语音清晰度。该算法支持多采样率及多平台，具备低延迟和高兼容性，满足视频会议、语音通话和智能助手等场景需求，极大改善用户通话体验。

音视频