程序聚合 软件案例 企业级多模态智能问答中台-Multimodal Agentic RAG (智能体检索增强系统)

企业级多模态智能问答中台-Multimodal Agentic RAG (智能体检索增强系统)

2026-02-04 11:50:51
行业:人工智能
载体:算法模型、框架或代码包
技术:Python、FastAPI、React、Redis

业务和功能介绍

立项背景与目标:
针对传统 RAG 系统在处理“图文混合文档”时无法识别图片内容,以及面对“复杂逻辑问题”时回答准确率低的痛点,本项目旨在构建一个生产级、多模态、具备推理能力**的企业知识问答中台,助力企业将非结构化文档(PDF/Word)转化为可交互的智能资产。

核心功能与业务流程:
1. Agentic RAG (智能体检索)**:基于 LangGraph 构建了具备“自我反思”能力的 Agent 状态机。
意图路由:精准区分闲聊/问答,避免资源浪费。
自我评估 (Self-Reflection):Agent 会对检索结果进行质量打分。如果发现相关性不足(Score < 0.8),会自动触发查询改写 (Query Rewrite) 并重新检索,直到找到满意答案或达到重试上限。
动态规划:针对复杂问题,自动拆解为多个子任务并行执行。
2. 多路混合检索 (Hybrid Search)**:
摒弃单一的向量检索,采用 Vector (语义) + BM25 (关键词) + Rerank (重排序)的黄金组合。
引入 Cross-Encoder 模型进行二次精排,像“阅卷老师”一样剔除伪相关文档,检索准确率提升至 89%。
3. 全链路多模态 (Multi-modal):
集成 VLM (视觉大模型),不仅能读懂文本,还能理解 PDF 中的图片、图表,实现真正的“图文跨模态检索”。
4. 生产级异步架构:
利用 Celery + Redis 构建高并发流水线,实现 GB 级大文件的异步解析与后台向量化,确保前端操作零卡顿。

项目实现

整体架构与设计思路:
项目采用前后端分离架构。后端基于 FastAPI + LangChain 生态,使用 Celery + Redis 处理耗时的文档解析任务(支持 500+ 页文档异步处理);前端采用 React + Ant Design Pro 构建响应式管理后台。核心检索层引入 ChromaDB 作为向量库,并集成了 Cross-Encoder 重排序模型以保障精度。

我负责的模块与成果(量化):
1. Agent 核心引擎开发:设计并实现了基于 LangGraph 的状态机,支持“意图识别-查询改写-HyDE增强-多路召回”的全链路思考过程。实测复杂问题拆解准确率提升 40%。
2. 检索策略优化:主导设计了“向量(Dense) + 关键词(Sparse) + 重排序(Rerank)”的三路混合检索算法,将 Top-5 召回率从 65% 提升至 89%。
3. 多模态融合:攻克了图片内容不可被检索的难题,引入视觉模型生成图片描述索引,实现了95% 准确率的图文混合检索。

遇到的难点、坑与解决方案:
难点 1:短查询语义匹配差。用户常问“推荐几款”这类短句,传统向量检索效果极差。
解决方案:引入 HyDE (假设性文档嵌入) 技术,先让 AI 生成一个“虚拟完美答案”,用该答案去匹配知识库,显著提升了语义相关性。
难点 2:大文档解析阻塞系统。解析几百页的 PDF 极其耗时,导致 Web 服务超时。
解决方案:重构为异步任务架构,使用 Celery 队列在后台 Worker 进程中处理解析任务,并通过 SSE (Server-Sent Events) 实时向前端推送进度条,彻底解决了卡顿问题。

示例图片视频


齐雨凡
15天前活跃
方向: 人工智能-NLP和自然语言处理、人工智能-机器学习与深度学习、
交付率:100.00%
相似推荐
超医助手
超医助手是由e转诊全新迭代升级的产品,产品定位为移动化医生执业平台。可以让医生进行在线医疗学术的交流和推广,使不同级别的医生获取如个人品牌推广、学术收益等需求满足医疗学术知识的传播以及实现了病人、医疗技术、医疗资源信息的实时互动。
B2B2C 多端宠物医生(源码不开放)
**解决方案:B2B2C平台 + AI赋能** 构建三端分离的SaaS平台,通过AI技术连接三方角色,形成商业闭环: **B端(医院/医生)**:提供AI诊疗助手降低误诊率30%,智能记忆系统自动记录病历,预约管理系统提升运营效率50%,客户管理系统提高留存率。 **C端(宠物主人)**:提供24小时AI健康咨询,解决80%的常见问题,降低就医成本。在线预约挂号,避免排队等待。社区互动增强用户粘性,提升平台活跃度。 **推广端(KOL/博主)**:提供分销工具和佣金系统(首次消费15%,复购5%),实现流量变现。
医院系统-潍坊市妇幼保健院
参与开发潍坊市妇幼保健院公众号、小程序、后台管理等开发工作,该项目旨在服务就医人群,提高患者使用体验,方便患者就医,目前项目正在使用中,可以搜索潍坊市妇幼保健院公众号或小程序查看。
基层医疗公卫智能AI助手-乐联AI
行业痛点: 1.业务操作繁琐,工作效率低下 2.多系统数据割裂,协同对接困难 3.数据录入依赖人工,准确、完整性难保障 4.基层服务资源紧张,专业能力承压 系统简介: 乐联AI是一款面向基层医疗的智能助理产品,深度对接乐康体检(老年体检)、乐豆体检(中小学生体检)、乐童体检(婴幼儿体检)、家庭医生签约服务平台、慢病随访服务平台等多类医疗业务系统,以“打破数据孤岛、简化操作流程”为核心目标,构建覆盖全场景的基层医疗服务智能解决方案。 依托语音交互与语义理解、数据校验融合、数据智能校验与融合分析、个性化智能推荐与生成、数据可视化与自动化报表、批量数据处理与模板生成六大核心技术,乐联AI创新采用自然语言对话交互模式,实现“说话即办事”。
定边县区域老年人体检平台-乐康体检
背景: 由于现有公共卫生服务平台与体检业务不匹配,导致医生需要手工填表并再次录入系统,增加了工作量并容易引起错误;基于以上问题建设的一款适合基层使用场景的体检业务软件系统,系统实现了基层医疗机构下乡体检全流程的信息化,包括老年人体检、健康体检等多个模块,解决了手工填表再录入系统、专业体检医生数量匮乏、信息不互通等痛点问题,以提高服务效率和质量。 APP端:目标用户为体检医生和责任医生; 体检医生主要用于下乡体检时使用APP登记体检、打印引导单、扫码体检、打印采样条码、建档、修改档案; 责任医生主要查看体检概况,调度体检、查看基本统计是数据等基本操作; PC客户端:目标用户为体检医生、责任医生和机构管理员; 体检医生用于院内体检时登记体检、打印引导单、扫码体检、打印采样条码、建档、修改档案; 责任医生主要批量诊断、查看体检概况,调度体检、查看基本统计数据、导出体检明细、生成汇报资料等基本操作; 机构管理员主要配置机构内给类型体检项目、体检项目分工、诊断标准、其它体检套餐、打印模板、预设模板管理、账号信息等; 数据驾驶舱:目标用户为各机构领导,省市区县各级部门领导 主要用于查看辖区内各个机构的体检统计数据,包含体检趋势、病情占比、体检工作量、体检反馈报告数量等 自助医疗机:目标用户是居民 居民在体检时,可在自医疗机上轻松查询/创建中医体质辨识、中医药保健指导、自理能力评估及肺结核筛查。此举既省时又便捷,让居民随时掌握自身健康状况。
帮助文档   Copyright @ 2021-2024 程聚宝 | 浙ICP备2021014372号
人工客服