程序聚合软件案例大模型智能知识问答助手系统-ChatRAG 企业知识问答助手

大模型智能知识问答助手系统-ChatRAG 企业知识问答助手

2026-05-04 17:11:17

行业：企业服务(saas)、人工智能

载体：算法模型、网站

技术：Python、FastAPI、PyTorch、Transformers

业务和功能介绍

本项目面向企业内部知识检索与智能问答场景，目标是在文档分散、知识查找效率低、人工答疑成本较高的背景下，构建一套可落地的大模型知识库问答系统。系统支持企业制度、产品说明、操作手册、FAQ 文档等资料的导入与管理，并通过文本切分、向量化索引、语义检索和大语言模型生成，实现基于企业私有知识的智能问答。

用户可以在网页端输入自然语言问题，系统会先从知识库中召回相关文档片段，再对候选内容进行相关性排序，最后结合大语言模型生成回答。系统不仅能够完成普通问答，还支持多轮对话、答案参考来源展示、知识库管理、问答记录查看和基础数据统计等功能。相比传统关键词搜索，本项目能够更好地理解用户问题语义，并给出更完整、更符合上下文的回答，适合用于企业内部资料查询、客服辅助、产品知识问答和个人知识库管理等场景。

项目实现

项目整体采用“文档处理层 + 检索增强层 + 模型服务层 + 应用展示层”的分层架构。文档处理层负责对上传文档进行清洗、分段、去重和格式化处理；检索增强层负责将文本片段转换为向量表示，并基于语义相似度完成 Top-K 召回和重排序；模型服务层基于开源大语言模型进行指令微调和推理接口封装；应用展示层通过 Web 页面提供问答交互、知识库管理、历史记录和数据看板等功能。

我主要负责数据预处理、问答样本构建、LoRA 微调、检索链路搭建和后端推理接口开发。在实现过程中，针对长文档切分后语义不完整、检索结果噪声较高、模型回答容易偏离知识库内容等问题，我对文本切片长度、重叠窗口、召回数量和提示词模板进行了多轮调整，并加入重排序策略提升上下文相关性。经过优化后，系统的 Top-3 召回率达到约 89%，回答准确率相比基础方案提升约 18%，平均响应时间控制在 1.6 秒左右，能够完成从文档导入、知识检索到大模型生成回答的完整闭环。

示例图片视频

咖咖

30天前活跃

方向：人工智能-NLP和自然语言处理、人工智能-大模型和多模态、

交付率：100.00%

查看主页

面向会议记录、工业对讲、人机交互及嵌入式智能终端在风扇、空调、键盘敲击和室内混响等噪声环境下的语音采集需求，设计并实现一套基于GD32H759IMT6微控制器的边缘语音降噪系统。系统通过ES7210音频采集模块、SAI和DMA连续获取48 kHz多通道音频，在本地完成通道选择、音量统计、短时傅里叶变换、频带特征提取、神经网络推理、频谱掩蔽和语音重建，无需依赖云端服务器。系统支持RAW原始音频、RNNoise对照降噪和自研CRN降噪三种工作模式，可通过触摸屏完成模式切换、输入通道选择、增益调整、开始或停止录音以及屏幕截图。LCD实时显示原始与降噪波形、音量、模型状态、录音时间、缓存状态和输出文件名；TF卡可保存原始WAV录音、CRN降噪音频及LCD截图，形成“音频采集—边缘推理—效果显示—文件保存”的完整闭环。

图片数据智能提取

本程序用于信息录入场景，可将截图内容整理为规范表格。先借助 OCR 识别提取截图内图文原始信息，再调用大模型 API，按预设规则完成数据筛选与结构化解析，属于专用数据格式提取脚本。支持自定义提取规则灵活适配不同业务需求，可按需调整输出模板，高效完成图片信息标准化导出，大幅减少人工录入整理工作量。

excel智能体

立项背景与目标：日常办公中，表格合并、文档处理、数据看板生成等重复性工作耗时且门槛高。雪球旨在利用大语言模型的自然语言理解能力，让用户通过一句话即可完成复杂办公任务，实现"对话即操作"的智能办公体验。软件功能与核心模块：平台围绕四大模块构建——表格处理引擎（JOIN联查、批量填充、分组聚合、拆分合并）、文档处理引擎（Word改写/模板填充、PDF提取/拆分/合并、PPT生成）、BI看板生成器（11种ECharts图表，支持HTML/PNG/PDF/PPT导出）和PPT自适应渲染引擎（四级降级策略）。所有工具通过DeepSeek Agent统一调度。业务流程与功能路径：用户自然语言输入 → Agent解析意图并编排步骤 → 自动调用工具链执行 → SSE流式返回执行进度与结果 → 任务快照持久化存档。全程支持审计日志脱敏和中断恢复，确保数据安全与操作可追溯。

基于多智能体与知识图谱的复杂知识分析平台

1. 立项背景和目标面向复杂知识问答、多步任务拆解和证据驱动分析场景，搭建统一的 AI Agent 平台。旨在解决传统问答系统在复杂任务中可分解性不足、证据链不可追溯、文档与图谱数据割裂、模型选型缺乏统一评测等痛点，降低知识密集型分析任务的人工操作成本。 2. 核心功能模块多智能体协作：采用 planner -> dispatcher -> summary 主链路，支持任务拆解、依赖编排和拓扑执行。知识检索与定位：集成文档多格式解析、片段级检索、页级定位及 Neo4j 知识图谱 Cypher 检索。评测与选型底座：支持对不同模型、提示词策略和子代理组合进行横向对比与流程稳定性观察。前端工作台：支持多会话聊天、模型参数配置、执行轨迹面板、知识图谱可视化及结果下载。 3. 业务流程与功能路径用户上传多格式文档或输入复杂分析任务 -> 系统提取分析并构建图谱 -> 多智能体协作编排并调度任务（子代理执行文档精读和图谱检索） -> 聚合生成可追溯、可信的结构化报告或演示文稿 -> 通过 SSE 流式反馈、渲染任务轨迹并展示给前端。

豪视界-AI 图像处理平台

AI 图像处理平台（"流行智能"后更名"豪视界"） —— 一个面向电商卖家的 SaaS 化 AI图像处理工具站。核心业务逻辑:卖家上传商品图,平台调用多个 AI引擎完成换背景、生成模特图、扩图/高清/去水印等处理,按张扣积分,处理结果存云端图库。支撑业务的系统能力 - 账户体系:邮箱/手机注册登录、JWT 鉴权、图形验证码、访客可浏览(登录才可下单) - 积分计费系统:注册赠送 100 积分、按任务类型差异化定价(可后台配置)、消费流水记录、积分套餐 - 异步任务系统:任务状态机(等待→处理中→完成/失败)、批量提交、全局任务列表、结果轮询 - 图库:处理结果云端存储(阿里云 OSS)、缩略图、任务详情回看 - 管理后台:用户管理(禁用/启用/改积分)、任务监控与重试、系统配置、积分规则/套餐配置、操作日志、仪表盘统计