该子项目聚焦家庭、政企、教育场景,解决大屏操作复杂痛点,提供远场语音控制、智能播报、口语化问数交互,支持定制唤醒词与离线使用,赋能大屏智能交互,提升便捷性与用户体验。
业务场景:聚焦政企场景,解决大屏操作复杂痛点,推动大屏从单向展示向双向智能交互升级。
核心功能:提供远场语音控制、智能播报、口语化问数,支持定制唤醒词与离线使用,赋能大屏便捷交互。
硬件适配:针对大屏远距离交互,采用 6+1 麦克风阵列优化拾音范围(3-5 米),通过波束成形技术抑制环境噪音;
指令设计:简化语音指令(如 “切换到数据大屏”“放大图表”),适配大屏操作场景,减少歧义;
反馈同步:语音合成采用高响度、慢语速(1.2 倍常规速度),配合大屏 UI 动效(如指令接收弹窗),强化操作确认;
系统协同:与大屏操作系统(如 Linux)深度集成,优化音频驱动延迟(控制在 200ms 内),确保指令执行与画面反馈同步。