RAG Agent

2026-05-28 22:05:37
行业:人工智能、大数据
载体:网站、算法模型
技术:Python、FastAPI、PyTorch、Transformers

业务和功能介绍

一、立项背景与目标
1. 立项背景
在传统的知识库问答系统中,普遍存在以下痛点:
- 流程混乱:通用ReAct Agent在处理复杂业务时,容易发生步骤跳跃或逻辑错乱,导致回答质量不稳定。
- 上下文断裂:多轮对话中,用户常使用代词(如“它多少钱?”),传统向量检索缺乏指代消解能力,导致检索失败。
- 意图混杂:闲聊式提问(如“你好”)与知识检索式提问(如“XX产品参数是多少”)被统一处理,浪费算力且影响用户体验。
- 状态丢失:用户刷新页面或稍后再访问时,对话历史无法延续,每次都是“新会话”。
2. 项目目标
- 构建一个流程可控、意图可分流、上下文可理解、状态可持久的智能知识助手。
- 实现复杂业务逻辑的结构化解耦,提升系统的可维护性与稳定性。
- 显著提升多轮对话场景下的检索命中率与回答准确率。

二、软件功能与核心模块
1.整体功能概述
本系统是一个基于LLM的智能对话式知识库问答助手,支持用户通过自然语言提问,从向量知识库中精准检索并生成回答。系统特别强化了多轮对话中的指代消解能力与流程可控性。
2.核心功能模块介绍
模块名称 功能说明
Planner(规划器) 基于LLM + 专用Prompt,硬编码业务流程。负责解析用户请求,按固定流程调度执行,防止逻辑跳跃。
语义路由器 基于LLM的分类工具,动态识别用户意图为“chat”(闲聊)或“retrieval”(知识检索),实现分支分流。
历史加载与写入模块 与Redis集成,自动追加对话历史,确保跨会话的上下文连续性。
查询重写模块 结合历史对话,将存在指代或省略的用户问题(如“它多少钱?”)改写为语义完整的独立问句。
混合检索引擎 同时执行向量语义检索与关键词检索,通过RRF算法融合排序,提升召回效果。
Executor(执行器) 根据Planner的指令,调用重写、检索、生成等环节,最终输出回答。
系统流程严格遵循:语义路由 → 历史加载 → (分支判断) → 查询改写/直接回答 → 知识库检索 → 最终生成

三、业务流程与功能路径
以下为用户与系统交互的完整功能路径描述:
场景一:用户进行知识检索(多轮对话)
场景二:用户发起闲聊
场景三:用户首次访问 / 会话恢复

项目实现

1. 构建Plan-Execute分层代理架构
- 将任务处理拆分为Planner和Executor两个阶段,实现了复杂业务逻辑的结构化解耦。
- 基于LLM-Planner定制专用Prompt,硬编码业务执行流程。强制Agent严格按照“语义路由 → 历史加载 → (分支判断) → 查询
改写/直接回答 → 知识库检索 → 最终生成”的顺序执行,避免了传统ReAct Agent在复杂流程中容易出现的步骤跳跃或逻辑混乱
问题。
2. 实现智能语义路由与分支处理
- 开发基于LLM的分类工具,动态识别用户意图为chat或retrieval。
3. 查询重写与混合检索
- 针对多轮对话中的指代消解难题(如用户追问“它多少钱?”),设计专用工具结合历史对话将碎片化问题改写为语义完整的独
立问句再送入向量库检索,显著解决了因上下文缺失导致的检索失效问题。
- 语义与关键词多路召回,由RRF算法排序知识片段,提高召回率
4. 工程化落地
- 实现对话历史的自动追加与Redis写入,确保用户下次访问时能无缝衔接上文。

示例图片视频


Owen
24小时内活跃
方向: 人工智能-NLP和自然语言处理、人工智能-大模型和多模态、
交付率:100.00%
相似推荐
创新无轨音乐游戏-NotaNote
当前主流音乐游戏多采用固定轨道交互模式,玩法同质化严重,玩家对更具沉浸感与自由度的音乐交互体验需求持续增长。本项目以“无轨表演式交互”为核心,打造了创新式无轨表演音乐游戏Notanote,目标是打破传统轨道限制,让玩家通过自由的点击、滑动操作跟随音乐节奏完成演奏,实现毫秒级判定精度、低延迟交互与多平台流畅运行。 游戏核心功能模块包括:1. 无轨节奏判定系统,支持自定义判定点位置与类型(点击、长按、滑动),脱离固定轨道限制,玩家可在屏幕任意位置完成交互;2. 多难度谱面系统,针对不同水平玩家设计分级难度谱面,支持谱面动态加载与难度自适应;3. 演出反馈与评分系统,实时根据玩家操作反馈特效、音效与评分,提供连击、完美判定等多维度评价;4. 谱面编辑器,支持用户自定义谱面创作,可导入音乐文件并编辑判定点,搭建社区内容生态。 业务流程清晰完整:玩家启动游戏后,可选择官方谱面游玩,进入游戏后加载音乐与判定数据,游戏过程中通过触摸/点击屏幕完成节奏交互,系统实时判定操作精度并给出反馈,游戏结束后生成评分与回放数据,支持分享至社区平台,满足玩家竞技与创作双重需求。
UERPG游戏
独立完成一款轻量级RPG Demo开发,覆盖角色战斗、背包管理等核心玩法,验证UE引擎 全流程开发能力,目标为模拟真实游戏项目的模块化设计与落地。 1. 关卡玩法设计与实现 战斗系统:基于UE5动画蓝图与状态机,设计角色连击机制——通过动画通知(Anim Notif y)精准触发攻击判定(如刀光碰撞检测),以及实现多段攻击的状态同步(如第一段命中 后触发第二段起手动画),最终完成3段连击的完整动作链。 2. UI逻辑开发与体验优化 背包 系统:基于UMG(UI Widget)搭建可视化背包界面,支持装备穿戴实时属性更新;通过数 据表存储物品基础信息(图标、属性、类型),结合蓝图变量绑定实现UI与背包数据的双向 同步(如道具数量变化时自动刷新列表)。 玩法辅助UI:设计血条/蓝条动态显示(受击时 红色闪烁)、快捷栏(支持键盘快捷键切换装备)、任务追踪面板(实时更新目标进度), 通过事件监听响应角色状态变化(如受伤时触发血条动画)。
游戏攻略网站-塔科夫助手
项目简介: 一款面向 Escape from Tarkov 游戏玩家的 Web 助手应用,提供任务追 踪、物品价格查询、交互式地图标注、数据同步等功能。 核心功能: - 任务管理:游戏任务追踪,支持条件筛选、排序,包含任务物品需求与 奖励展示 - 物品查询:物品/弹药/价格查询,支持以物易物(Barter)、合成(Craft )、转售(Resell)分析 - 交互地图:自定义标注点、划线,支持多人实时协作标注,监控游戏日志,根据日志在地图绘制玩家位置。 - 数据同步:每日自动同步游戏数据,支持价格快照历史追踪 - 社区功能:剧情攻略发布、评论互动系统 技术栈: - 前端:Vue 3 + TypeScript 5 + Vite + Pinia + ECharts - 后端:Python 3.11 + FastAPI + MongoDB (异步) + Redis + Celery - 部署:Docker Compose 全栈化部署,Nginx 反向代理 职责:独立完成全栈开发,包括需求分析、架构设计、前后端实现、数据 库设计、自动化部署。
中国象棋AI智能体-象棋菜刀
AlphaGo战胜人类围棋冠军已经好几年过去了,这个话题已经不热了,国内介绍这个项目 原理的技术文章也非常多。遗憾的是国内并没有出现几个类似的成功案例,这个问题值得玩味。是不是在实践的路上有很多隐形的关键问题没有公开出来,就算把AlphaGo的源码公开,我们拿过来也做不出一个成功的应用呢? 学以致用,为了做出一个能用的强化学习模型 必须动手实践。自动识别桌面上的棋盘窗口,自动识别棋子布局,然后调用神经网路模型计算最佳走法,自动连线下棋。 https://www.xqcd.top/
基于 Avalonia 架构的跨平台 RTS 游戏引擎 - StateOfHajimi
立项背景和目标:旨在从零构建一个轻量级、跨平台的即时战略(RTS)游戏引擎及前端编辑器,验证使用 Avalonia 框架结合 C# 在高性能复杂渲染与游戏底层逻辑开发中的可行性,打破常规 UI 框架的性能瓶颈。 核心功能模块:包含基于底层图形库重构的渲染引擎、基于 ECS(实体组件系统)的架构中枢、流场寻路与动态避让系统、基于精灵图与行为树的实体状态机、以及解耦的前后端命令派发中心。 业务流程/功能路径:玩家通过前端触发交互指令,经由自定义的鼠标/键盘状态机拦截,转化为命令快照;指令通过桥接器被发送至后端的 CommandDispatcherSystem 进行统一批处理与逻辑计算;最终 CollectSystem 收集帧数据,通过双缓冲机制交由前端高效渲染。
帮助文档   Copyright @ 2021-2024 程聚宝 | 浙ICP备2021014372号
人工客服