RAG Agent

2026-05-28 22:05:37

行业：人工智能、大数据

载体：网站、算法模型

技术：Python、FastAPI、PyTorch、Transformers

业务和功能介绍

一、立项背景与目标
1. 立项背景
在传统的知识库问答系统中，普遍存在以下痛点：
- 流程混乱：通用ReAct Agent在处理复杂业务时，容易发生步骤跳跃或逻辑错乱，导致回答质量不稳定。
- 上下文断裂：多轮对话中，用户常使用代词（如“它多少钱？”），传统向量检索缺乏指代消解能力，导致检索失败。
- 意图混杂：闲聊式提问（如“你好”）与知识检索式提问（如“XX产品参数是多少”）被统一处理，浪费算力且影响用户体验。
- 状态丢失：用户刷新页面或稍后再访问时，对话历史无法延续，每次都是“新会话”。
2. 项目目标
- 构建一个流程可控、意图可分流、上下文可理解、状态可持久的智能知识助手。
- 实现复杂业务逻辑的结构化解耦，提升系统的可维护性与稳定性。
- 显著提升多轮对话场景下的检索命中率与回答准确率。

二、软件功能与核心模块
1.整体功能概述
本系统是一个基于LLM的智能对话式知识库问答助手，支持用户通过自然语言提问，从向量知识库中精准检索并生成回答。系统特别强化了多轮对话中的指代消解能力与流程可控性。
2.核心功能模块介绍
模块名称功能说明
Planner（规划器）基于LLM + 专用Prompt，硬编码业务流程。负责解析用户请求，按固定流程调度执行，防止逻辑跳跃。
语义路由器基于LLM的分类工具，动态识别用户意图为“chat”（闲聊）或“retrieval”（知识检索），实现分支分流。
历史加载与写入模块与Redis集成，自动追加对话历史，确保跨会话的上下文连续性。
查询重写模块结合历史对话，将存在指代或省略的用户问题（如“它多少钱？”）改写为语义完整的独立问句。
混合检索引擎同时执行向量语义检索与关键词检索，通过RRF算法融合排序，提升召回效果。
Executor（执行器）根据Planner的指令，调用重写、检索、生成等环节，最终输出回答。
系统流程严格遵循：语义路由 → 历史加载 → (分支判断) → 查询改写/直接回答 → 知识库检索 → 最终生成

三、业务流程与功能路径
以下为用户与系统交互的完整功能路径描述：
场景一：用户进行知识检索（多轮对话）
场景二：用户发起闲聊
场景三：用户首次访问 / 会话恢复

项目实现

1. 构建Plan-Execute分层代理架构
- 将任务处理拆分为Planner和Executor两个阶段，实现了复杂业务逻辑的结构化解耦。
- 基于LLM-Planner定制专用Prompt，硬编码业务执行流程。强制Agent严格按照“语义路由 → 历史加载 → (分支判断) → 查询
改写/直接回答 → 知识库检索 → 最终生成”的顺序执行，避免了传统ReAct Agent在复杂流程中容易出现的步骤跳跃或逻辑混乱
问题。
2. 实现智能语义路由与分支处理
- 开发基于LLM的分类工具，动态识别用户意图为chat或retrieval。
3. 查询重写与混合检索
- 针对多轮对话中的指代消解难题（如用户追问“它多少钱？”），设计专用工具结合历史对话将碎片化问题改写为语义完整的独
立问句再送入向量库检索，显著解决了因上下文缺失导致的检索失效问题。
- 语义与关键词多路召回，由RRF算法排序知识片段，提高召回率
4. 工程化落地
- 实现对话历史的自动追加与Redis写入，确保用户下次访问时能无缝衔接上文。

示例图片视频

Owen

24小时内活跃

方向：人工智能-NLP和自然语言处理、人工智能-大模型和多模态、

交付率：100.00%

查看主页

相似推荐

创新无轨音乐游戏-NotaNote

当前主流音乐游戏多采用固定轨道交互模式，玩法同质化严重，玩家对更具沉浸感与自由度的音乐交互体验需求持续增长。本项目以“无轨表演式交互”为核心，打造了创新式无轨表演音乐游戏Notanote，目标是打破传统轨道限制，让玩家通过自由的点击、滑动操作跟随音乐节奏完成演奏，实现毫秒级判定精度、低延迟交互与多平台流畅运行。游戏核心功能模块包括：1. 无轨节奏判定系统，支持自定义判定点位置与类型（点击、长按、滑动），脱离固定轨道限制，玩家可在屏幕任意位置完成交互；2. 多难度谱面系统，针对不同水平玩家设计分级难度谱面，支持谱面动态加载与难度自适应；3. 演出反馈与评分系统，实时根据玩家操作反馈特效、音效与评分，提供连击、完美判定等多维度评价；4. 谱面编辑器，支持用户自定义谱面创作，可导入音乐文件并编辑判定点，搭建社区内容生态。业务流程清晰完整：玩家启动游戏后，可选择官方谱面游玩，进入游戏后加载音乐与判定数据，游戏过程中通过触摸/点击屏幕完成节奏交互，系统实时判定操作精度并给出反馈，游戏结束后生成评分与回放数据，支持分享至社区平台，满足玩家竞技与创作双重需求。

UERPG游戏

独立完成一款轻量级RPG Demo开发，覆盖角色战斗、背包管理等核心玩法，验证UE引擎全流程开发能力，目标为模拟真实游戏项目的模块化设计与落地。 1. 关卡玩法设计与实现战斗系统：基于UE5动画蓝图与状态机，设计角色连击机制——通过动画通知（Anim Notif y）精准触发攻击判定（如刀光碰撞检测），以及实现多段攻击的状态同步（如第一段命中后触发第二段起手动画），最终完成3段连击的完整动作链。 2. UI逻辑开发与体验优化背包系统：基于UMG（UI Widget）搭建可视化背包界面，支持装备穿戴实时属性更新；通过数据表存储物品基础信息（图标、属性、类型），结合蓝图变量绑定实现UI与背包数据的双向同步（如道具数量变化时自动刷新列表）。玩法辅助UI：设计血条/蓝条动态显示（受击时红色闪烁）、快捷栏（支持键盘快捷键切换装备）、任务追踪面板（实时更新目标进度），通过事件监听响应角色状态变化（如受伤时触发血条动画）。

游戏攻略网站-塔科夫助手

项目简介：一款面向 Escape from Tarkov 游戏玩家的 Web 助手应用，提供任务追踪、物品价格查询、交互式地图标注、数据同步等功能。核心功能： - 任务管理：游戏任务追踪，支持条件筛选、排序，包含任务物品需求与奖励展示 - 物品查询：物品/弹药/价格查询，支持以物易物(Barter)、合成(Craft )、转售(Resell)分析 - 交互地图：自定义标注点、划线，支持多人实时协作标注，监控游戏日志，根据日志在地图绘制玩家位置。 - 数据同步：每日自动同步游戏数据，支持价格快照历史追踪 - 社区功能：剧情攻略发布、评论互动系统技术栈： - 前端：Vue 3 + TypeScript 5 + Vite + Pinia + ECharts - 后端：Python 3.11 + FastAPI + MongoDB (异步) + Redis + Celery - 部署：Docker Compose 全栈化部署，Nginx 反向代理职责：独立完成全栈开发，包括需求分析、架构设计、前后端实现、数据库设计、自动化部署。

中国象棋AI智能体-象棋菜刀

AlphaGo战胜人类围棋冠军已经好几年过去了，这个话题已经不热了，国内介绍这个项目原理的技术文章也非常多。遗憾的是国内并没有出现几个类似的成功案例，这个问题值得玩味。是不是在实践的路上有很多隐形的关键问题没有公开出来，就算把AlphaGo的源码公开，我们拿过来也做不出一个成功的应用呢？学以致用，为了做出一个能用的强化学习模型必须动手实践。自动识别桌面上的棋盘窗口，自动识别棋子布局，然后调用神经网路模型计算最佳走法，自动连线下棋。 https://www.xqcd.top/

基于 Avalonia 架构的跨平台 RTS 游戏引擎 - StateOfHajimi

立项背景和目标:旨在从零构建一个轻量级、跨平台的即时战略（RTS）游戏引擎及前端编辑器，验证使用 Avalonia 框架结合 C# 在高性能复杂渲染与游戏底层逻辑开发中的可行性，打破常规 UI 框架的性能瓶颈。核心功能模块:包含基于底层图形库重构的渲染引擎、基于 ECS（实体组件系统）的架构中枢、流场寻路与动态避让系统、基于精灵图与行为树的实体状态机、以及解耦的前后端命令派发中心。业务流程/功能路径:玩家通过前端触发交互指令，经由自定义的鼠标/键盘状态机拦截，转化为命令快照；指令通过桥接器被发送至后端的 CommandDispatcherSystem 进行统一批处理与逻辑计算；最终 CollectSystem 收集帧数据，通过双缓冲机制交由前端高效渲染。