1.面向:需要私有化的,个人定制的,具有专业深化的口语锻炼需求的人群
2.可以在PC或者手机端网页或者是微信小程序打开,选择通话或者发消息录音的方式和AI口语助理进行英文对话。学习标准的英式/美式口语发音,或者让AI给出特定场景的口语锻炼进行模仿训练,纠正自身发音和口语错误
3.提供本地部署或者上云两种方式
使用阿里生态,通过部署千问3Omni模型作为核心推理引擎,结合vad和asr技术来实现实时语音交互。使用开源生态的TTS服务作为额外接口,解决模型半开源导致的音频输出问题。
本地部署方案:越需要100g显存 和16c 32g
也可以使用阿里云接口:无需显存但是每月产生一定api调用费用