程序聚合 软件案例 基于eino的agent对接平台

基于eino的agent对接平台

2025-10-13 16:42:48
行业:人工智能
载体:云服务/云平台、网站
技术:Go、Gin

业务和功能介绍

公司推出AI眼镜等边缘设备,需要为设备提供实时语音交互能力。市面上存在多家AI服务提供商(OpenAI、阿里云、火山引擎等),但各家API协议不统一,且单一厂商存在可用性风险。目标是构建统一的AI能力聚合平台,屏蔽底层厂商差异,实现端到端低延迟(首句响应小于500ms)的多模态对话体验,支持千级并发设备连接,并为边缘设备赋能MCP工具调用能力,使AI具备文件系统、IoT设备、传感器等外部能力扩展。
多协议AI Provider统一抽象层:封装7种TTS提供商、3种ASR提供商、多种LLM提供商,通过统一接口加工厂模式实现业务层无感知厂商切换。
全链路流式处理架构:智能分句引擎按标点符号实时切割LLM输出,每个完整句子立即送TTS合成无需等待完整响应;Context级联取消机制确保用户打断时20ms内停止所有任务;定速音频发送避免设备缓冲区溢出。
MCP工具协议集成层:基于Eino框架实现MCP Host,支持全局工具(SSE协议)与设备专属工具(WebSocket协议)动态注册,打通LLM的Function Calling能力,使大模型可调用文件系统、IoT设备控制等外部工具,支持工具调用结果自动回注LLM实现多轮交互。
多传输层适配:支持WebSocket(控制与文本)、MQTT(信令通道)、UDP(低延迟音频流)混合协议,UDP音频传输采用AES-GCM加密加Nonce防重放,确保弱网环境下低延迟(小于50ms)与安全性。
对话状态机与会话管理:为每个设备创建独立ChatManager实例,封装ASRManager、LLMManager、TTSManager三大管理器,状态机驱动任务切换,资源池复用VAD检测、ASR连接、TTS连接。

项目实现

整体架构基于Go-Zero微服务框架的清洁架构(Clean Architecture),分为传输层、会话管理层、业务处理层、Provider抽象层、基础设施层。传输层使用Gorilla WebSocket进行长连接管理、MQTT Client作为信令通道、UDP Server加AES-GCM加密实现低延迟音频流传输。会话管理层为每设备创建独立ChatManager实例实现状态隔离,通过Context生命周期管理实现资源自动回收。业务处理层包含ASRManager负责语音识别、LLMManager负责大模型推理、TTSManager负责语音合成、ServerTransport负责消息发送,各Manager独立运行互不阻塞。Provider抽象层封装多厂商适配,AsrProvider支持FunASR、阿里ASR、豆包ASR,LLMProvider基于Eino框架封装OpenAI、通义千问、豆包、Ollama,TTSProvider支持阿里、豆包、Edge、Cosyvoice、Xiaozhi等,AgentProvider支持阿里智能体、FastGPT。基础设施层使用Redis存储对话历史、设备配置和热更新,MySQL存储应用配置、设备管理、日志,gRPC与sys、agt微服务通信,MCP通过SSE或WebSocket连接工具服务器。
核心技术栈包括音频编解码使用Opus Codec和PCM Float32转换,VAD检测使用WebRTC VAD和Silero VAD(ONNX推理),ASR使用各厂商WebSocket流式API,LLM使用Eino框架统一接口,TTS使用各厂商WebSocket或HTTP流式API,MCP协议基于Eino Tool接口加自研SSE或WebSocket客户端,并发控制使用Go Context、Goroutine、Channel、sync.Map,资源池自实现WebSocket连接复用,配置管理使用Viper加Redis Pub/Sub实现热更新,日志追踪使用Logrus加轮转日志。设计模式运用包括适配器模式统一Provider接口、工厂模式动态创建Provider实例、管道模式通过Channel串联ASR到LLM到TTS异步非阻塞、观察者模式实现Context级联取消、对象池模式复用WebSocket连接和VAD实例、策略模式实现智能分句。

示例图片视频


誛誠
30天前活跃
方向: 后端-Go、人工智能-NLP和自然语言处理、
交付率:100.00%
相似推荐
数据库智能管理与可视化平台
实现针对达梦(Dameng)和Oracle数据库的跨平台可视化管理,核心提供多数据源动态切换、智能数据冲突分析与处理、表结构ER图自动化生成、大字段(LOB)可视化处理以及各类数据库高级对象(用户、角色、存储过程、表空间)的管理功能。
智慧矿山
依托Python开发技术,结合Flask、Django框架及pandas、requests等核心库,重点完成以下开发内容,兼顾实用性与可扩展性,适配中小矿山数字化转型需求: 依托Python开源库,降低开发成本,同时通过自动化脚本替代人工重复性工作,大幅减少人工投入,快速实现降本增效;
公司内部工具
根据需求,快速整理生成统计图表。其中包括基础的数据查找、导出功能。包括基础资料查询,各种类型的统计数据,图表生成。作为wps智能表格数据来源的中间缓存服务等等。主要需求是辅助公司内部人员处理个性化需求。
车辆监控平台
本平台面向工业互联网与大数据场景,为企业车队提供全流程车辆智能管控服务,核心解决车辆实时监管、安全风险预警、运营效率低下等痛点,实现从 “被动追溯” 到 “主动防控” 的管理升级。 核心功能路径:实时监控大屏→实时报文→轨迹追溯→数据报表分析等。具体包含:1. 实时定位,地图可视化展示车辆位置、车速、车况;2. 实时报文查询,历史报文查询,车辆状态展示,设备预警等;3. 行驶轨迹回放,支持事件溯源;4. 多维度运营报表,为车队调度、成本管控提供数据支。
toB数字孪生项目-仓储AGV孪生平台
1、一比一实时数字孪生,接入wms和mcs等系统,实现数据互通 2、数据统计,预测产量、仓储流量、动态报警等 3、三维场景漫游,交互,支持固定以及漫游相机操作,旋转,拖拽,缩放等 4、场景动画与生产过程实时联动 5、实现了双端部署,即PC客户端与BS端
帮助文档   Copyright @ 2021-2024 程聚宝 | 浙ICP备2021014372号
人工客服