在三坐标测量工作中,任务繁重,每分每秒都显得极为宝贵,因此有效地利用时间、合
理地安排计划对于每个测量员来说是必不可少的。围绕着这点,需要开发一个以语音输入代
替键盘\鼠标操作以提高效率为目标的测量工作系统。
开发一个完全离线运行的语音助手系统,应用于工业三坐标测量软件的辅助控制,实现语音指令控制替代传统鼠标键盘操作,提高操作效率。该系统以语音输入为主体,集语音操作、手动操作等功能于一体,为测量员提供一个高效的平台。
集成 Whisper 模型,优化中英文语音识别效果,并使用 faster-whisper 提升推理速度
实现语音合成模块(基于 TTS),将识别结果和系统反馈语音播报
封装自然语言指令解析模块,实现60+常用操作指令的模糊匹配与意图识别
使用多线程,实现了非阻塞的语音识别控制流程,提升用户交互体验与程序响应速度
使用 win32com.client 调用三坐标测量软件 COM 接口,控制实际测量流程
使用tkinter构建语音助手图形界面,实现按钮控制状态显示执行反馈,集成系统托盘图标与最小化窗口功能,支持后台驻留
与状态监控
使用 PyInstaller 打包为单文件可执行程序,并集成图标、模型资源打包与安装器制作
完全脱离网络、模型本地运行,适配工业设备部署环境
模块化设计,扩展AI大模型、数据库存储测量数据等功能
项目已具备产品雏形,可作为语音人机交互的工程化实践案例