1立项背景
基于LLM技术为研究机构的冲突后重建学术研究提供一个可解释的决策支持工具,
2 项目目标
• 能够基于用户描述的场景自动生成结构化方案,包括方案、收益、风险等。
• 以工程化方式实现便于部署和后续扩展。
3 要解决的核心痛点
•人工检索和阅读大批文献成本极高,很难在有限时间内形成系统化方案。
•AI 答案缺乏证据支撑,普通聊天式问答难以给出证据来源以及结构化方案。
4 软件功能与核心模块
与外国团队合作的英文项目,这是一个基于 RAG 的场景化决策支持工具:
用户输入某个冲突后重建场景(例如“重建被破坏的电力基础设施并提升社区韧性”),系统在向量库中检索相关学术摘要片段,组合成上下文,通过大模型生成包含「事件、实施步骤、收益、风险、相关风险的缓解措施」的方案卡片。
核心功能模块包括:
•后端 RAG API 模块,接收查询请求,调用向量数据库检索 + OpenAI 生成,输出结构化 JSON。
•向量检索模块,存储由学术摘要构建的向量索引。
•大模型生成与处理模块,负责 Prompt 设计、上下文拼接,调用 OpenAI 模型生成结果,对输出进行结构化解析。
•前端交互与展示模块,包括输入查询页面,方案卡片组件展示与导出。
•数据预处理与向量库构建模块,从原始学术摘要数据进行清洗并写入 Pinecone。
5. 业务流程
•用户在前端界面中输入重建场景描述。
•前端通过 API 客户端向后端发送 POST请求:
•后端将场景文本通过 OpenAI Embedding API 转为向量并检索出相关的学术元数据。
• 将用户场景与检索到的摘要数据拼接成 Prompt,调用 OpenAI 模型,要求按照统一结构输出。
•对模型输出进行解析和校验,返回给前端。前端将 JSON 渲染为方案卡片列表。
1架构设计思路
•设计前后端分离且轻量后端API;
•基于RAG 经典链路的向量检索和大模型生成实现分析决策,确保输出事件,风险等内容间的相关性;
•独立数据预处理管道,建立向量库;
•用 OpenAI 模型实现生成,并约束输出结果为方案卡片的结构。
2 技术栈
•前端层:React + TypeScript + CSS,构建查询表单和方案卡片 UI;
•后端 API 层: Python + Flask;
•检索与生成层: Pinecone存储向量化后数据; Embedding OpenAI API:对用户检索和文献片段进行交互;Completion OpenAI API:生成结构化方案卡片。
3. 我负责的模块
•后端与RAG系统:开发基于 Flask 的API,集成 Pinecone 与 OpenAI,构建事件、风险、缓解措施等五个部分的关联递进检索增强生成(RAG)流程。
•前端开发:基于 React 搭建交互式界面,查询表单组件和方案卡片组件。
•数据工程与分析:设计数据预处理管道,将上千篇学术摘要转化为对应事件、风险等五个部分的向量数据库。通过脚本化流程保证数据处理过程可复现,支持后续新增/替换文献时的一键重建。
4. 结果
专家审阅和调研评分来评估结果,进行主题分析,调整后检索策略和 Prompt,生成的方案卡片在相关性方面得到明显提升。