一站式金融 AI 智能体平台,基于「Query → Skill → Tool」三层决策架构,集成多 Agent 协作、混合 RAG/GraphRAG 知识检索、MCP 工具协议等核心能力,支持智能投研分析、量化策略研究、合规审查等场景。平台覆盖行情数据查询、财报深度解读、技术面指标分析、K 线形态识别、知识图谱多跳推理全链路,内置 6 组 49 个金融工具,支持文档上传自动入库与引用溯源。架构上采用微服务拆分(主服务 + RAG + LLM Gateway + 评估),融合多模型降级链、熔断器、语义缓存等生产级稳定性保障,确保高可用与确定性输出。
一、基础设施
- ORM 迁移 :Prisma → Drizzle ORM,解决影子库 superuser 权限依赖、Rust 引擎构建慢、pgvector 兼容性不足三大痛点
- 通信层 :tRPC → Route Handlers + SSE,原生支持流式推送与中间件集成
二、Agent 分层编排
- 21 工具平铺导致 LLM 选择困惑、幻觉编造数据、8 轮超时无输出
- 引入「Query → Skill → Tool」三层决策架构,6 组 49 工具按投研工作流分组
- 13+ 声明式 Skill 固化高频任务,Prompt Token 减少 50%+
- Skill/Tool 双级向量检索动态匹配相关工具子集
- 多工具链式执行(5 轮→2 轮,省 30% Token)+ 重复调用检测 + 数据真实性校验
三、RAG 质量治理(Top-5 准确率提升 40%+)
- 清洗管线 :控制字符清理 → Markdown 噪声过滤 → 全半角归一化 → Unicode NFC 标准化
- 智能切片 :800 字符 + 128 重叠 + 句子边界感知 + 多级断点策略(512 硬截断丢失率从 36% 降至 <5%)
- 混合检索 :BM25 稀疏 + Dense 稠密 + RRF 融合;分离精排(文档 Top-5 + 图谱 Top-3)
- 查询增强 :HyDE 假设文档改写 + 金融同义词扩展
- 合规自动过期 :研报 90 天 / 年报 365 天 / 法规永不过期,全链路引用溯源
四、GraphRAG 知识图谱
- LLM 自动抽取 15+ 种金融关系三元组,Neo4j 多跳推理检索
- CDC 同步更新 Embedding / 图谱 / BM25 索引,图谱限流防噪声
五、金融视觉分析
- 双引擎策略:PaddleOCR-VL-1.6(本地 SOTA 96.3%,免费无限量)主力 → qwen3.5-plus 降级
- 3 个视觉 Skill:研报截图结构化、K 线形态识别、财报 OCR 指标计算
六、MCP 工具生态
- 6 组 49 工具(行情 / 基本面 / 技术 / 风控 / 模拟 / 知识)
- 工具描述增强(when_to_use / when_not_to_use / example_calls + few-shot)+ 调用校验层
七、生产级稳定性
- 多模型降级链(qwen-max → plus → turbo)+ 三状态熔断器 + 403 强制熔断
- 多级降级:Reranker 失败 → 原始排序;图谱失败 → 跳过;Redis 不可用 → 内存缓存;HNSW → 顺序扫描
- temperature=0 + seed=42 确定性输出;LLM 语义缓存;IP 限流 + 健康检查