程序聚合 软件案例 听词 https://www.voicute.com/

听词 https://www.voicute.com/

2026-06-10 17:54:49
行业:人工智能
载体:网站
技术:Java、Python

业务和功能介绍

用户在线输入自定义唤醒词、命令词,平台全自动完成训练量化,几秒内输出适配端侧设备的轻量模型;同步支持声纹核验模型生成,附带可直接集成的 SDK,全程无需人工干预,自助完成整套语音方案获取。

1、项目有哪些具体功能模块
包含用户注册登录、关键词提交、自动化模型训练、模型文件打包下载、配套 SDK 分发、声纹模型定制、订单自动交付、后台订单管理八大模块。
2、项目的主要功能描述
用户在线输入自定义唤醒词、命令词,平台全自动完成训练量化,几秒内输出适配端侧设备的轻量模型;同步支持声纹核验模型生成,附带可直接集成的 SDK,全程无需人工干预,自助完成整套语音方案获取。

项目实现

1、个人负责任务
全程独立负责产品构思、前后端编码、训练调度服务搭建、自动化交付流程开发、服务器部署运维、站点上线运营,全程单人完成从 0 到 1 搭建并持续运营 voicute 官网。
2、技术栈、架构,亮点难点
采用前后端分离架构,训练链路自研调度逻辑;大量借助 Claude Code 辅助算法调试、代码编写优化;适配低算力端侧设备量化压缩;难点在于多唤醒词区分防误触、自动化训练稳定性,亮点是全流程无人值守交付、无门槛适配零散小单客户。

示例图片视频


蚂蚁
24小时内活跃
方向: 人工智能-语音识别与合成、后端-Java、
交付率:100.00%
相似推荐
视频问诊app-健康咨询
这是一个医疗在线问诊系统,核心功能是医生与患者通过视频进行远程咨询。前端(App) UniApp(Android原生插件),后端 (Spring Boot 3)视频会议SDK,Android原生插件集成,患者提交咨询 → 后端创建云屋会议号 → 保存到患者表 ↓ 医生收到咨询(已预先绑定独立账号)→ 进入会议 ↓ 患者凭会议号进入同一会议 → 视频通话开始。关键业务规则:一医一患:每个会议号最多 2 人(1 医生 + 1 患者),第 3 人会被踢出 会议号隔离:不同会议号之间互不影响 医生优先:医生先入会,患者后入会 每咨一议:每次咨询创建新会议号(非复用),患者在提交咨询时即生成。
热榜视频分析创作系统-热榜视频分析创作系统
1、用户根据关键词,检索选择抖音垂类热榜视频,获取垂类热榜视频粉丝画像详细数据。根据粉丝画像详细数据,选择要参考的热榜视频。 2、选择扣子工作流,进行二次创作,如视频详情解析、视频文案解析、视频文案改写、视频二次创作等等。 3、热榜视频一站式分析和创作,极大提升视频创作效率。
高性能 QUIC 通信框架设计与实现 (AI 辅助全栈实现)
项目背景:该系统适用于弱网、高丢包、高抖动等复杂网络环境下的实时数据与音 视频传输场景,涵盖多人会议、直播连麦、在线教育、远程协作、工业采集、车载回传、 安防监控及物联网边缘上传等业务。同时,该系统可作为中心转发与媒体中继节点,承 担上行流的接入、解析、转发、路由和分发能力,并支持视频流与结构化业务数据在服 务端的统一接入、存储与后续处理,从而提升整体传输效率、系统稳定性与用户体验。
车载智能座舱音视频娱乐系统-车机影音平台-车机音影平台
立项背景:随着智能汽车普及,车主对车内影音播放、多媒体交互需求提升,项目目标搭建适配小米座舱的一体化音视频播放底座。核心模块包含多路音视频解码、车载多媒体播放器、蓝牙音源接入、音效均衡调节。车机识别U盘/蓝牙/车联网流媒体音源,调用FFmpeg完成多格式音视频硬软解,用户通过中控屏切换音源、调节环绕音效,系统适配车载降噪算法,同步联动车内扬声器分区发声,满足行车影音娱乐需求。
安防集成平台
安防集成平台开发(C#、WPF、C++,MFC,VS2019,BOOST,FFMPEG,LIVE555, MPEG4,H.264,GB28181,SQLSERVER2016,插件) 集成接入各厂家视频相关平台、设备、协议,提供统一对外接口SDK,给上层应用或第三方客户二次开发使用。 实现功能:实时视频播放、远程录像播放、本地文件播放、播放控制、PTZ操作、数字PTZ操作、图像显示调整、本地抓取图像、本地抓取录像、录像查询、录像下载、音视频原始码流、标准码流、解码后码流输出、报警、电视墙视频切换等。
帮助文档   Copyright @ 2021-2024 程聚宝 | 浙ICP备2021014372号
人工客服