该项目主要为将用于ai模型训练的各类音视频内容进行人工标注和审核,以优化ai识别的准确性。项目分为语音识别标注、语音合成标注和视频标注三大模块,平台需求包括音视频内容的可视化显示和操作,基于可视化音视频工具的点击、拖拽标注功能,以及质检模式下标注内容的核准、批注和修改。
项目使用vue3框架搭建,整体分为音视频工具组件、标注内容组件、质检及结果组件和操作工具组件。利用canvas实现音频波形图的可视化显示及拖拽标注工具的开发,通过读取音频文件数据并转换为像素信息以实现波形图的绘制,同时利用堆栈结构实现操作的撤销与恢复功能。