程序聚合 软件案例 OCean AI-RAG企业知识库系统

OCean AI-RAG企业知识库系统

行业:企业内部管理
载体:网站
技术:Java、Spring Boot、Redis、Deeplearning4j

业务和功能介绍

项目描述:Ocean AI是基于RAG(检索增强生成)架构开发的企业级知识库系统,支持大文件分片上传、文档向量化处理和语义检索实现了从文档管理到智能问答的完整流程,打破了海洋环境数据、地理与地质等多源数据的管理孤岛,赋能科研智能应用。
核心职责:
1、基于Redis BitMap管理文件分片状态,结合MinIO实现大文件分片上传与断点续传,将1GB文件上传耗时由15s优化至3s。
2、构建基于RabbitMQ的文档处理异步流水线,解耦文件上传、解析和向量化过程,实现系统削峰,文档处理效率提升3倍。
3、集成 Elasticsearch +IK分词器构建多格式文档索引,融合通义干问Embedding模型实现2048维向量转换,结合 KNN向量召回与BM25重排序,实现关键词匹配与语义相似度的混合检索。
4、设计检索增强生成(RAG)流程,通过用户提问与检索结果生成增强Prompt,并结合上下文语义理解提升问答准确度。
5、基于WebSocket建立长连接,集成DeepSeek大模型Stream API实现流式响应,为用户提供"打字机式"逐字生成的对话体验。
6、基于Redis实现会话管理,支持7天对话历史存储,并在Embedding API调用失败时自动降级至文本搜索保障可用。

项目实现

Ocean AI 是基于 RAG 架构开发的企业级知识库系统,采用前后端分离设计,后端基于 Spring Boot 构建核心服务,以 Redis 为缓存与状态中心、RabbitMQ 实现异步解耦,搭配 MinIO 存储、Elasticsearch 全文检索与向量引擎,前端通过 WebSocket 实现流式交互,打造了从文档上传、解析向量化到智能问答的全链路流程,打破了海洋环境、地理地质等多源数据的管理孤岛,赋能科研智能应用。
我负责的核心模块包括:一是基于 Redis BitMap 管理文件分片状态,结合 MinIO 实现大文件分片上传与断点续传,将 1GB 文件上传耗时由 15s 优化至 3s;二是构建基于 RabbitMQ 的文档处理异步流水线,解耦文件上传、解析和向量化过程,实现系统削峰,文档处理效率提升 3 倍;三是集成 Elasticsearch + IK 分词器构建多格式文档索引,融合通义千问 Embedding 模型实现 2048 维向量转换,结合 KNN 向量召回与 BM25 重排序实现混合检索;四是设计 RAG 增强生成流程,通过用户提问与检索结果生成增强 Prompt,提升问答准确度;五是基于 WebSocket 集成 DeepSeek 大模型 Stream API 实现流式响应,同时基于 Redis 实现会话管理,支持 7 天对话历史存储,并在 Embedding API 调用失败时自动降级至文本搜索保障服务可用。
项目过程中,我遇到的难点与解决方案包括:大文件上传时的分片状态一致性问题,通过 Redis BitMap 原子操作标记分片状态,结合 MinIO 预合并接口解决;异步处理时的消息堆积与丢失问题,通过 RabbitMQ 持久化、死信队列与重试机制保障任务可靠执行;向量检索时的召回精度不足问题,通过调整 KNN 近邻数量、优化 BM25 权重实现关键词与语义的平衡;Embedding 服务依赖外部 API 的可用性问题,通过 Redis 缓存向量结果、实现文本搜索降级策略,确保服务在 API 故障时仍能正常使用。

示例图片视频


一个疯狂接单的程序员~
30天前活跃
方向: 后端-Java、人工智能-机器学习与深度学习、
交付率:100.00%
相似推荐
物联网-远程机械管理系统
此平台为针对特种设备(主要是起重机)传感器数据采集及监控的多租户平台,含pc端和小程序端;实现在线及历史数据可视化展示;同时引入大模型,搜索知识库,知识库基于国标和行标,以及生产实践积累的实施文档和技术文档;并可对设备故障预警及告警。
智慧校园问卷与环境监测系统 - 基于 Flask + MQTT 的校园数据采集与可视化平台
项目背景 在教育信息化快速发展的背景下,学校需要高效收集学生学习情况数据,同时对教学环境进行实时监测。本系统解决以下问题: 1. 问卷调查效率低:传统纸质问卷收集困难、统计耗时 2. 数据分析不直观:缺乏可视化的数据展示方式 3. 环境监测缺失:教室温湿度等环境数据无法实时掌握 核心功能模块 模块1:学习情况问卷调查系统 - 年级选择(高一/高二/高三) - 学习态度评估(主动进取/按部就班/佛系学习/抵触厌烦) - 学习主动性评价 - 学习负担感受 - 作业完成时间统计 - 教学参考书使用评价 - 最满意学科及原因 - 9大学科满意度评分(1-5分制):语文、数学、英语、物理、化学、生物、政治、历史、地理 - 教学建议提交 模块2:管理员数据管理后台 - 安全登录:账号密码认证,Session会话管理 - 数据统计:各年级问卷提交数量统计 - 数据详情:分页查看所有问卷记录 - 数据导出:一键导出Excel报表 - 密码管理:管理员密码修改功能 模块3:物联网环境监测系统 - 实时数据采集:通过MQTT协议接收IoT设备数据 - 数据存储:温度、湿度、设备名称、采集时间 - 可视化展示:实时折线图展示温湿度变化趋势 数据流向:IoT设备 → MQTT服务器(broker.emqx.io) → Flask后端 → 数据库 → Web前端(ECharts) 数据流程 学生用户填写问卷 → 数据验证 → 存入SQLite数据库 管理员用户登录认证 → 权限校验 → 数据查询 → 数据可视化(ECharts) → 报表导出(Excel)
植物灯智能控制APP-MaxGrow
作为多功能控制器的配套移动应用,本终端致力于构建一套闭环的智慧种植管理体系。通过对植物灯、空调、喷淋系统及土壤传感器等多品类设备的集中管控,实现了对种植环境关键参数的实时监测与自动化调控,推动种植流程的智能化与精细化。
安居宝智能家居
专门为家庭打造的视频监控、防盗报警、智能控制的网络摄像机软件。通过该软件可以实现手机实时远程监控、报警信息实时推送、报警录像云端存储、本地录像与截屏、双向语音清晰对讲、情境模式控制、窗帘灯光控制等功能。同时支持添加多个摄像头、传感器,无需专业知识即可轻松构建专业级家庭联动防盗报警系统、智能控制系统,满足用户对于远程移动端的监控报警、家庭智能控制需求。搭载空气监测功能,提醒室内空气质量情况。同时配备门窗磁、紧急按钮等智能设备,智慧环境及时感知,有效防止意外发生。该软件已经实现智能情景、智能安防、智能陪伴、健康看护、智能家电、智能照明、智能控制、智能感应等八大功能体系。可以自定义情景模式,添加智能控制面板如智能灯控面板、智能调光面板、智能窗帘面板等智能控制设备,一同构成情景模式。并且通过添加灯光控制、智能插座等各种家电控制面板,即可实现全屋家电智能控制、远程控制。
智能门店监控平台
系统面向无人零售场景,融合多路视频监控(支持海康威视、萤石云)、AI行为分析与远程人工客服。实时采集门店画面,智能识别异常滞留、漏扫等事件并告警;客服可通过音频对讲远程介入,为顾客提供即时帮助。同时支持门锁、灯光等硬件远程控制,实现“无人值守、有人服务”的运营模式,有效降本增效并强化风险防控。
帮助文档   Copyright @ 2021-2024 程聚宝 | 浙ICP备2021014372号
人工客服