本项目旨在依托国产开源大语言模型 Qwen3-32B,构建面向燃机专业领域的智能问答与数据分析能力,实现对燃机运行、维护及管理全过程的智能化支撑。项目以燃机知识问答与数据问答为核心应用场景,结合项目现有的工况数据、运行规程、设备手册及历史故障案例,通过高质量语料构建、预训练(PT)及监督微调(SFT)等技术手段,打造具备专业领域理解、数据分析与推理能力的行业专用模型。
在技术实现上,项目将 Qwen3-32B 作为训练基座模型,利用其在中文处理、长上下文理解、指令跟随及复杂推理等方面的优势,针对燃机领域特有任务进行定向优化。系统部署采用华为昇腾 910B 集群及高性能推理框架,实现高并发、低延迟的模型服务,满足现场实时交互需求。
项目建设完成后,将在以下方面实现突破:
专业化知识理解:精准解析燃机领域技术规程、诊断步骤及运行数据。
数据驱动决策支持:为运行调度、故障排查提供智能分析。
可扩展的技术架构:支持多场景扩展与持续模型迭代,保障系统在未来业务需求变化中的适应性。
本项目的实施将有效提升燃机运行管理的智能化水平,降低人工分析成本,缩短决策周期,为能源安全与运行效率提供坚实的技术保障。
1.基础训练环境搭建:
a)完成基础训练环境搭建
2.基座模型选型:
a)测试多个开源模型
b)选择效果最佳模型作为基座模型
3.语料知识库搭建
a)完成知识库搭建
b)处理后语料入库
4.构建训练语料
a)构建燃机专业词表用于知识库检索
b)完成CPT语料处理
c)构建SFT语料生成Prompt,完成SFT语料处理
d)人工审核语料内容
5.搭建训练框架:
a)完成Llama-factory训练框架搭建
6.模型训练:
a)完成模型CPT预训练
b)完成模型SFT微调
7.模型效果评估
a)构建主管与客观评估指标
b)评估训练后模型效果
8.完成 燃机专业大模型 的部署及接口开放
a)完成部署 燃机专业大模型 所需的昇腾软件栈环境搭建。
b)完成基于燃机专业大模型 的部署及服务化工作,开放接口供上层业务调用。