燃机专业大模型

2026-04-18 10:11:09

行业：人工智能

载体：算法模型

技术：Python

业务和功能介绍

本项目旨在依托国产开源大语言模型 Qwen3-32B，构建面向燃机专业领域的智能问答与数据分析能力，实现对燃机运行、维护及管理全过程的智能化支撑。项目以燃机知识问答与数据问答为核心应用场景，结合项目现有的工况数据、运行规程、设备手册及历史故障案例，通过高质量语料构建、预训练（PT）及监督微调（SFT）等技术手段，打造具备专业领域理解、数据分析与推理能力的行业专用模型。
在技术实现上，项目将 Qwen3-32B 作为训练基座模型，利用其在中文处理、长上下文理解、指令跟随及复杂推理等方面的优势，针对燃机领域特有任务进行定向优化。系统部署采用华为昇腾 910B 集群及高性能推理框架，实现高并发、低延迟的模型服务，满足现场实时交互需求。
项目建设完成后，将在以下方面实现突破：
专业化知识理解：精准解析燃机领域技术规程、诊断步骤及运行数据。
数据驱动决策支持：为运行调度、故障排查提供智能分析。
可扩展的技术架构：支持多场景扩展与持续模型迭代，保障系统在未来业务需求变化中的适应性。
本项目的实施将有效提升燃机运行管理的智能化水平，降低人工分析成本，缩短决策周期，为能源安全与运行效率提供坚实的技术保障。

项目实现

1.基础训练环境搭建:
a)完成基础训练环境搭建
2.基座模型选型:
a)测试多个开源模型
b)选择效果最佳模型作为基座模型
3.语料知识库搭建
a)完成知识库搭建
b)处理后语料入库
4.构建训练语料
a)构建燃机专业词表用于知识库检索
b)完成CPT语料处理
c)构建SFT语料生成Prompt，完成SFT语料处理
d)人工审核语料内容
5.搭建训练框架:
a)完成Llama-factory训练框架搭建
6.模型训练:
a)完成模型CPT预训练
b)完成模型SFT微调
7.模型效果评估
a)构建主管与客观评估指标
b)评估训练后模型效果
8.完成燃机专业大模型的部署及接口开放
a)完成部署燃机专业大模型所需的昇腾软件栈环境搭建。
b)完成基于燃机专业大模型的部署及服务化工作，开放接口供上层业务调用。

示例图片视频

尹子琦

30天前活跃

方向：人工智能-AI应用开发、人工智能-数据标注和训练支持、

交付率：100.00%

查看主页

相似推荐

宜昌慈善网络募捐平台采购项目

作为宜昌慈善总会官网的移动端延伸载体，以 “ 引流赋能、服务协同 ” 为核心理念，着力构建开放协同的移动慈善服务体系，全面拓展官网服务半径，推动慈善事业数字化转型。一是扩大慈善项目社会影响力，助力公众合规参与慈善捐赠；二是以轻量化服务提升用户参与体验，增强官网品牌感知度与公众信任度；三是强化官网服务的精准性与公信力；四是支撑官网运营优化与可持续发展。

宜昌市公办福利机构智能监管平台

当前，我市公办养老机构及其他公办福利机构，在“人、财、物”监管、食品安全及整体安全管理方面存在数据孤岛、监管手段滞后、风险预警不足等问题。面对“突击战”严峻形势，亟需通过定制化开发构建一个覆盖全市、统一高效的智慧监管平台，实现对公办福利机构（特别是农村福利院）的规范化、透明化、智能化监管。

WebServer

TinyWebServer 是一个用 C++14 从零构建的 Web 服务器，适用于学习 Linux 网络编程、I/O 多路复用、并发模型与 HTTP 协议实现。 ### 核心技术 | 技术点 | 实现 | |--------|------| | **I/O 多路复用** | epoll (ET/LT 可切换) | | **并发模型** | Reactor + 半同步/半反应堆 (HSHA) | | **线程池** | 固定大小线程池 + 条件变量 + shared_ptr 安全设计 | | **HTTP/1.1** | 手写状态机解析器 + Keep-Alive 长连接 | | **零拷贝** | mmap 内存映射文件传输 + writev 集中写 | | **定时器** | 小根堆 (二叉堆 + 哈希索引) O(log n) 超时管理 | | **数据库** | MySQL 连接池 + RAII 守卫 + SQL 注入防护 | | **日志** | 异步日志系统 (生产者-消费者 BlockDeque) + 日期/行数切分 | | **缓冲区** | 用户态 Buffer (readv 分散读 + 动态扩容 + 原子指针) |

spec-anchor — 基于AI自动标注的SPEC-Code追溯矩阵生成器

在AI辅助开发的SPEC-driven工作流中，开发者通过SPEC.md定义需求条目，并通过CLAUDE.md铁律约束AI在生成代码时自动带上@implements REQ-NNN注释标注。但传统追溯工具（IBM DOORS、Jama Connect等）太重型，需要手动标注，缺少一款轻量级的CLI工具来自动完成需求到代码的关联追溯。spec-anchor填補了这一空白，实现AI自动标注与自动追溯的闭环。核心功能模块： • trace命令：解析SPEC.md提取需求条目（REQ-NNN格式），递归扫描源代码目录，通过两层匹配策略（Layer 1: @implements精确匹配；Layer 2: 关键词启发式兜底）关联需求与代码实现，生成Markdown/JSON格式的追溯矩阵 • impact命令：支持git提交范围或diff文件的反向影响分析，展示代码变更影响了哪些需求条目及其变更行数 • check命令：缺口检查，列出未实现和仅启发式匹配的需求，提供覆盖率统计 • 支持8种语言（Python/JS/TS/Go/Java/Rust/PHP/Ruby/Elixir）的函数名提取与注释识别，内置中英文关键词映射和同义词扩展业务流程：开发者在SPEC.md中定义需求→AI生成代码时自动带@implements注释→运行spec-anchor trace生成追溯矩阵→运行spec-anchor impact查看变更影响→在PR中附上矩阵供reviewer审查

DWS数仓迁移工具MGC

内容：项目简介：是一款支持ORACLE、TERADATA、GUASSA、GREENPLUM、NETEZZA、DB2、POSTGRESQL、NETEZZA等数据库的数据迁移到DWS数据库以及对应的脚本语法转换的工具，可以进行大规模、快速的数据仓库、主机、容器、大数据等迁移作业软件架构：Sprinboot、SpringCloud、mybatis-plus、SSHD、Redis、Zmq、Nacos、Nginx 后端数据库：Gaussdb 我负责的功能模块：部分公共模块，主要负责数据仓库迁移服务 1、迁移工具的许可证License控制允许迁移数据量和SQL脚本转换数量 1、DWS数仓迁移工具的动态数据源框架和工具类 2、源端和目标端的数据连接 3、源端数据库的元数据获取 4、源端->目标端迁移工程创建 5、增量迁移、大表拆分条件控制 6、表结构、视图、索引转换 7、用户、角色、用户权限迁移 8、PG系列库元数据迁移 9、数据内容迁移 10、数据内容增量迁移 11、数据内容大表拆分迁移 12、数据内容迁移后的数据条目数量以及内容校验 13、校验完成后的迁移报告生成及下载业绩：国内外银行、通讯公司、政府组织、医疗组织以及各行业的数据仓库、容器、大数据迁移