程序聚合 软件案例 基于知识图谱增强的菜谱搜索RAG系统

基于知识图谱增强的菜谱搜索RAG系统

2025-11-13 10:43:02
行业:人工智能、大数据
载体:算法模型
技术:Python、PyTorch、MySQL Workbench

业务和功能介绍

通过引入知识图谱,我们的菜谱搜索系统将具备:
- 结构化知识表达:以图的形式显式编码实体间的语义关系
- 增强推理能力:支持多跳推理和复杂关系查询
- 智能查询路由:根据查询复杂度自动选择最适合的检索策略
- 事实性与可解释性:基于图结构的推理路径提供可追溯的答案
极大的拓展大语言模型的能力,用较小的模型+知识图谱就可以实现超大参数模型的推荐能力。而且通过对大语言模型的量化和部署,可实现本地快速的推理,而不依赖云端网络。

项目实现

关键技术
1. 图数据准备模块 (GraphDataPreparationModule)
- 功能:连接Neo4j数据库,加载图数据,构建结构化菜谱文档
- 特点:支持图数据到文档的智能转换,保持知识结构完整性
2. 向量索引模块 (MilvusIndexConstructionModule)
- 功能:构建和管理Milvus向量索引,支持语义相似度检索
- 特点:使用BGE-small-zh-v1.5模型,512维向量空间
3. 混合检索模块 (HybridRetrievalModule)
- 功能:传统的混合检索策略,结合向量检索和关键词查询
- 特点:双层(dual level)检索(实体级entity+主题级topic),向量检索
4. 图RAG检索模块 (GraphRAGRetrieval)
- 功能:基于图结构的高级检索
- 特点:支持多跳推理、子图提取、实体关系识别、相似实体聚类
5. 检索结果融合重排(Reranker):
- 功能:对检索结果按照与query的相关性排序
- 特点:使用bge-reranker-base模型
6. 智能查询路由 (IntelligentQueryRouter)
- 功能:分析查询特征,自动选择最适合的检索策略
- 特点:LLM驱动的查询分析,动态策略选择
7. 查询重写(QueryRewrite)
- 功能:对用户的问题重写,减少口语化和模糊的表达,增强检索效果
- 特点:LLM驱动
8. 生成集成模块 (GenerationIntegrationModule)
- 功能:基于检索结果生成最终答案
- 特点:支持llm api调用(e.g. kimi) 和 llm model(e.g. qwen25-7b-instruct)两种方式
我负责全项目整个模块的搭建和demo开发和测试

示例图片视频


Mcccc
30天前活跃
方向: 人工智能-大模型和多模态、
交付率:100.00%
相似推荐
网络安全领域大模型微调
基于网络安全领域的大模型微调 本项目聚焦网络安全领域大模型定制化微调,旨在解决通用大模型在安全场景下专业性不足的问题。核心基于Llama2等开源基座模型,依托包含漏洞分析、攻防对话、安全日志解析、恶意代码研判的专属数据集,通过Transformers框架实现模型微调。流程涵盖数据预处理(分词、截断、格式化)、训练参数配置(批次大小4、3轮训练、GPU加速)、模型训练与验证,最终输出适配网络安全场景的专用模型。微调后的模型可精准理解安全领域术语,高效完成漏洞研判、攻击行为分析、安全问答等任务,大幅提升网络安全运营与应急响应的智能化水平。
智能安防系统
实现智能安防系统,获取区域所有摄像头数据,调用算法实现区域人员防护,实现电子围栏,安全告警,并通过数字孪生技术进行全局显示。使用主要技术包括视觉目标识别、目标跟踪、目标定位、数字孪生技术。
python源代码加密混淆-python源代码加密混淆
(一)定制化Python爬虫开发 1. 全场景数据采集定制 ​ - 支持网页、APP接口、小程序、API接口等多源数据采集,适配静态页面、动态JavaScript渲染(Vue/React)、反爬机制(验证码、IP封锁、Cookie验证)等复杂场景。 ​ - 可定制数据字段提取、格式转换(Excel/CSV/JSON/数据库直连)、定时采集、增量更新等个性化需求。 ​ 2. 反爬策略深度适配 ​ - 内置IP池自动切换、User-Agent随机伪装、请求频率控制、Cookie池管理等基础反爬方案; ​ - 针对高难度反爬场景(滑块验证、短信验证、设备指纹识别),提供定制化破解方案,确保爬虫稳定运行。 ​ 3. 爬虫性能优化 ​ - 支持多线程、多进程、异步协程(aiohttp)优化,提升采集效率; ​ - 实现断点续爬、异常重试、日志监控功能,避免数据丢失,便于问题排查。 (二)高强度代码加密混淆 1. 多层级混淆防护 ​ - 基础混淆:变量名/函数名/类名随机替换(支持自定义规则)、代码逻辑打乱、冗余代码插入、注释清空; ​ - 进阶混淆:控制流扁平化(嵌套分支重构)、指令乱序、字符串加密(Base64/AES/RC4)、常量加密隐藏; ​ - 高强度混淆:虚拟机保护(将核心逻辑转为自定义字节码)、反调试(禁止断点调试、检测调试工具)、反编译防护(防止PyInstaller打包后被反编译)。 ​ 2. 爬虫专属混淆优化 ​ - 针对爬虫核心逻辑(请求参数构造、反爬策略、数据解析算法)重点加密,避免核心思路泄露; ​ - 保留爬虫运行效率,混淆后不影响采集速度与稳定性。 ​ 3. 多格式输出支持 ​ - 支持.py源码直接混淆、.pyc字节码加密、PyInstaller打包后exe/elf文件加固,适配Windows、Linux、Mac多系统。 (三)附加增值服务 1. 售后技术支持:提供1-3个月免费bug修复、爬虫反爬策略更新适配、混淆方案优化; ​ 2. 个性化定制:根据客户需求整合代理IP、验证码识别接口、云存储等第三方服务; ​ 3. 教程文档配套:提供混淆后代码使用说明、爬虫部署教程、常见问题排查手册。 三、服务优势 1. 技术专业性:深耕Python爬虫与代码安全领域,适配各类复杂场景,拒绝“通用化模板”,每单均为定制开发; ​ 2. 安全可靠性:加密混淆方案经过多轮反编译、反调试测试,确保代码难以破解,爬虫稳定抗封; ​ 3. 高效响应:快速对接需求,明确开发周期(简单需求1-3天,复杂需求3-7天),支持加急开发; ​ 4. 灵活合作:支持“爬虫开发+加密混淆”一站式服务,也可单独承接爬虫开发或代码混淆需求,按需求定价。 四、适用客户 - 开发者/编程爱好者:需要定制特定场景爬虫,或希望保护自己的爬虫代码不
智能表单助手系统(中国华能驻场项目)
立项原因:传统企业办公流程中,员工填写各类业务表单(如用车申请、物资领用)需反复查找字段、手动输入,耗时长、易出错,且流程割裂。 行业场景:在大型能源国企的数字化转型背景下,存在大量标准化业务流程需提效。本项目针对华能内部办公场景,通过对话式AI实现“口述即填表”,将传统纸质/电子表单流程升级为智能交互流程,提升员工体验与行政效率。
餐饮数据分析专家系统-Mobo
该产品定位为“餐饮数据分析专家系统”,背景是餐饮门店数据(菜品、利润、库存、指标波动等)分散且分析门槛高,依赖人工出报表效率低。目标是让经营人员用自然语言直接发起分析,系统自动生成专业提示词并调用数据接口获取结构化结果,再通过多模型分层分析输出可读的 Markdown 报告。核心模块包括:专家模式(提示词选择/自动生成、SSE实时日志、深度报告)、助理模式(多轮对话、历史保存、图片上传分析)、提示词库管理(prompt.json)、报告下载与展示。典型流程:前端选择/生成提示词→后端按ID加载prompt→调用报表API取数并做空结果重试→按菜品整合并分块并行分析→汇总生成报告→前端展示与保存对话
帮助文档   Copyright @ 2021-2024 程聚宝 | 浙ICP备2021014372号
人工客服