程序聚合 软件案例 基于eino的agent对接平台

基于eino的agent对接平台

2025-10-13 16:42:48
行业:人工智能
载体:云服务/云平台、网站
技术:Go、Gin

业务和功能介绍

公司推出AI眼镜等边缘设备,需要为设备提供实时语音交互能力。市面上存在多家AI服务提供商(OpenAI、阿里云、火山引擎等),但各家API协议不统一,且单一厂商存在可用性风险。目标是构建统一的AI能力聚合平台,屏蔽底层厂商差异,实现端到端低延迟(首句响应小于500ms)的多模态对话体验,支持千级并发设备连接,并为边缘设备赋能MCP工具调用能力,使AI具备文件系统、IoT设备、传感器等外部能力扩展。
多协议AI Provider统一抽象层:封装7种TTS提供商、3种ASR提供商、多种LLM提供商,通过统一接口加工厂模式实现业务层无感知厂商切换。
全链路流式处理架构:智能分句引擎按标点符号实时切割LLM输出,每个完整句子立即送TTS合成无需等待完整响应;Context级联取消机制确保用户打断时20ms内停止所有任务;定速音频发送避免设备缓冲区溢出。
MCP工具协议集成层:基于Eino框架实现MCP Host,支持全局工具(SSE协议)与设备专属工具(WebSocket协议)动态注册,打通LLM的Function Calling能力,使大模型可调用文件系统、IoT设备控制等外部工具,支持工具调用结果自动回注LLM实现多轮交互。
多传输层适配:支持WebSocket(控制与文本)、MQTT(信令通道)、UDP(低延迟音频流)混合协议,UDP音频传输采用AES-GCM加密加Nonce防重放,确保弱网环境下低延迟(小于50ms)与安全性。
对话状态机与会话管理:为每个设备创建独立ChatManager实例,封装ASRManager、LLMManager、TTSManager三大管理器,状态机驱动任务切换,资源池复用VAD检测、ASR连接、TTS连接。

项目实现

整体架构基于Go-Zero微服务框架的清洁架构(Clean Architecture),分为传输层、会话管理层、业务处理层、Provider抽象层、基础设施层。传输层使用Gorilla WebSocket进行长连接管理、MQTT Client作为信令通道、UDP Server加AES-GCM加密实现低延迟音频流传输。会话管理层为每设备创建独立ChatManager实例实现状态隔离,通过Context生命周期管理实现资源自动回收。业务处理层包含ASRManager负责语音识别、LLMManager负责大模型推理、TTSManager负责语音合成、ServerTransport负责消息发送,各Manager独立运行互不阻塞。Provider抽象层封装多厂商适配,AsrProvider支持FunASR、阿里ASR、豆包ASR,LLMProvider基于Eino框架封装OpenAI、通义千问、豆包、Ollama,TTSProvider支持阿里、豆包、Edge、Cosyvoice、Xiaozhi等,AgentProvider支持阿里智能体、FastGPT。基础设施层使用Redis存储对话历史、设备配置和热更新,MySQL存储应用配置、设备管理、日志,gRPC与sys、agt微服务通信,MCP通过SSE或WebSocket连接工具服务器。
核心技术栈包括音频编解码使用Opus Codec和PCM Float32转换,VAD检测使用WebRTC VAD和Silero VAD(ONNX推理),ASR使用各厂商WebSocket流式API,LLM使用Eino框架统一接口,TTS使用各厂商WebSocket或HTTP流式API,MCP协议基于Eino Tool接口加自研SSE或WebSocket客户端,并发控制使用Go Context、Goroutine、Channel、sync.Map,资源池自实现WebSocket连接复用,配置管理使用Viper加Redis Pub/Sub实现热更新,日志追踪使用Logrus加轮转日志。设计模式运用包括适配器模式统一Provider接口、工厂模式动态创建Provider实例、管道模式通过Channel串联ASR到LLM到TTS异步非阻塞、观察者模式实现Context级联取消、对象池模式复用WebSocket连接和VAD实例、策略模式实现智能分句。

示例图片视频


誛誠
30天前活跃
方向: 后端-Go、人工智能-NLP和自然语言处理、
交付率:100.00%
相似推荐
家庭医生签约-球星卡库存管理
爬取全民健康数据,小程序完成居民健康数据录入,完成之后填写数据同步到全民健康平台。前后端交换使用AES堆成加密 球星卡录入对卡片球员识别,包括系列等,对接ERP系统,完成抖店的自动上架。。前后端交换使用AES堆成加密
行车记录仪设备
一、产品概述 行车记录仪(DVR, Driving Video Recorder)是一类用于记录车辆行驶过程中的视频、音频、定位和感知数据的嵌入式设备。系统通常基于 ARM SoC(如全志、海思、联咏、晶晨等)开发,由 嵌入式操作系统 + 多媒体处理模块 + 传感器子系统 构成。 其核心目标包括: 提供连续、高质量的行车影像记录 在事故或异常情况下自动保存关键视频 支持 ADAS / EDO 等智能驾驶辅助功能 提供网络互联能力(4G/WiFi)实现远程管理 二、系统架构 行车记录仪整体系统一般分为以下几个模块: 1. 硬件架构 主控 SoC(ARM Cortex-A 系列) 图像传感器(Sensor):常见如 IMX335/IMX415/OV4689 视频编解码器(H.264/H.265) 存储设备:TF 卡、EMMC 无线模块:WiFi、4G 定位模块:GPS/北斗 加速度计/陀螺仪(G-Sensor) 电源管理芯片(UPS/超级电容保障异常断电保护) 2. 软件架构 基于 Linux 或 RTOS,包括: (1)启动与系统层 U-Boot 启动和 BootLogo 显示 Kernel 启动、设备树配置 驱动程序:Sensor 驱动、ISP 驱动、G-Sensor 驱动、存储驱动 (2)中间件与服务层 多媒体框架(V4L2、MediaPipe、GStreamer) ISP Pipeline(自动曝光/白平衡/降噪) 视频编码服务(H.264/H.265) 文件系统管理(循环录制、碎片整理、写放保护) 事件检测服务(加速度触发锁定视频) OTA 更新模块
工厂生产制造系统-MES系统
是一套生产制造执行系统,主要用于3C电子行业,帮助企业打造生产数字化、透明化、无纸化的工厂,达到降本增效的目的。 包括系统管理、基础资料、工艺管理、计划管理、生产管理、包装管理、维修管理、设备管理、仓库管理、看板管理和报表管理等。
评审辅助-rag
使用RAG技术对评标工作进行辅助,结合采购要求对应答文件进行评估,并给出意见结论; 系统包含用户/角色管理及项目管理等功能; 算法包含对于常见评估项及采购文件中制定评估项的识别及评估
AI逆向分析-AI逆向分析
这是一个桌面端的 AI 安全分析平台,简单来说,它就是一个能指挥专业安全工具干活的 AI 聊天助手。 核心业务就是通过对话的方式,辅助你完成以下四类安全分析任务: APK 逆向:上传安卓安装包,它会在后台调用 JADX 帮你分析代码逻辑和漏洞。 主机逆向:扔进去 exe 或 elf 文件,它配合 IDA Pro 帮你分析汇编和程序行为。 流量分析:上传抓包文件(pcap),它利用 Wireshark 帮你识别异常流量和攻击特征。 文件破解:遇到加密文件或哈希,它能调用 Hashcat 帮你跑字典或掩码破解。 技术亮点: 它不仅仅是套了个 AI 的壳,而是通过 MCP协议,真正打通了 AI 模型与本地安全工具(JADX, IDA 等)的连接。AI 可以读取工具的分析结果,结合知识库,给你提供有理有据的分析报告。
帮助文档   Copyright @ 2021-2024 程聚宝 | 浙ICP备2021014372号
人工客服