程序聚合软件案例基于大规模预训练语言模型聊天机器人-qwen3

基于大规模预训练语言模型聊天机器人-qwen3

2025-07-17 22:05:00

行业：内容平台

载体：Windows应用、插件

技术：Python、PyTorch、Transformers

业务和功能介绍

工业软件使用手册较为复杂，上手门槛较高，结合大语言模型通过问答形式，帮助用户快速入门，查取功能的操作方式
建立企业知识库并基于此实现检索增强生成（RAG）系统，以实时与用户交互完成问答，可以分为以下几个步骤：

1. 建立企业知识库
文档收集与解析

收集企业内部的各类文档，包括但不限于产品手册、技术文档、FAQ、政策文件等。
使用合适的工具解析这些文档，确保它们能够被系统理解。例如，使用mineru进行版面分析，或者利用多模态大模型如qwen-vlm来处理复杂文档。
文档切分

将文档按照语义段落切分成适当大小的块（chunks），保证每个chunk都能包含完整的语义信息，同时适合后续处理。
向量化

对每个chunk应用嵌入模型（如jina-embeddings-v2或BAAI提供的模型）将其转换为向量表示，以便于后续的相似度计算和检索。
2. RAG检索与问答
问题重写与查询优化

针对用户的提问，可能需要对其进行重写或分解，以更好地匹配知识库中的内容。这可以通过多种策略实现，比如多重查询、RAG融合、查询分解等。
向量检索与BM25结合

在Elasticsearch或其他搜索引擎中，结合向量检索（基于嵌入的相似度搜索）和BM25检索（基于词频-逆文档频率的文本相似度评分算法），提供更加精确的结果。
召回与重排

根据检索结果，将最相关的文档chunks召回，并通过重排模型（如big-reranker-base/big-reranker-large）进一步优化排序，提高回答的相关性和准确性。
实时交互

使用Qwen基座模型作为后端的大语言模型，根据召回的文档chunks生成最终的回答。这个过程需要高效的处理机制来实现实时响应。

项目实现

项目持续三个月，我在其中负责的任务分为：
（1）基于PYQT5搭建完整的插件界面
（2）完成模型选型，以及核心流程
（3）对模型进行下游数据微调
（4）对pdf等文档进行切块等文字提取

示例图片视频

博嘉

30天前活跃

方向：人工智能-NLP和自然语言处理、人工智能-计算机视觉与图像处理、

交付率：100.00%

查看主页

相似推荐

基于Web的模拟电路三维虚拟实验与故障检测平台-模拟电路虚拟实验平台

面向电子信息、自动化等专业的模拟电路教学与实训，开发一套可在浏览器运行的三维虚拟实验平台。平台涵盖单管及多级放大、运算放大、滤波、比较、波形发生、振荡、整流稳压、功率放大等21类实验及多个子实验。用户可在三维实验板上选择端子完成交互连线，使用重置、故障检测和一键布线等功能；系统能够识别缺失连接和多余连接，并根据当前实际连线自动生成SPICE网表，调用ngspice完成电路仿真，再通过可缩放、平移和导出的示波器波形展示输入输出结果，适用于课前预习、课堂演示、实验训练和故障排查。

远程设备控制系统-设备控制

本远程设备控制系统面向物联网智能设备管控场景，配套网页管理端与微信小程序双载体，实现全流程设备远程可视化管控：设备数据实时采集：在线读取温湿度、电量、设备运行状态等传感数据，数据实时刷新展示；远程控制操作：支持远程开关设备、调节灯具亮度、继电器通断、参数阈值自定义配置；设备资产管理：设备分组管理、在线离线状态监测、历史运行数据存储与查询；告警提醒机制：设备异常、超温断电等场景自动推送消息提醒，方便运维人员及时处置；权限分级管控：区分管理员、普通操作员账号，限定设备操作与数据查看权限。

遥感影像处理软件框架搭建

底层架构与跨平台编译：独立负责软件整体框架的 CMake 构建系统配置，解决 Windows/Linux 下第三方库（Qt5、QGIS Core、GDAL）的依赖链接与版本冲突问题，实现了项目的自动化跨平台构建。基于Qt5开发软件框架，集成QGis进行二次开发，算法接口设计与解耦：针对后续算法人员（深度学习/点云处理）的需求，设计并封装了标准化的插件接口

面向中国星网打造的卫星运维一体化管控平台-中国星网综合管控平台

面向中国星网打造的卫星运维一体化管控平台，整体分为四大分系统，集成卫星运维管理、实时故障监测、故障溯源、AI 算法模型训练、数据管理等能力，服务卫星日常运维与智能研判工作，障知识图谱功能落地，大幅缩短卫星故障定位与排查耗时；综合管理模块采用配置化设计，支持算法、模型快速新增配置；解决大屏大数据渲染卡顿问题，系统稳定性与迭代效率显著提升。

无人机智巡智检系统

立项背景和目标随着我国电力线路总里程突破200万公里、光伏装机容量连年跃升，传统人工巡检模式已难以为继。巡检人员需翻山越岭、登高作业，不仅效率低下（人均每日仅能巡检5~8公里），更面临高空坠落、触电、中暑等严重安全风险。与此同时，存量设备老化加速，缺陷漏检、误检时有发生，导致非计划停运事件频发，经济损失巨大。国家“十四五”规划明确要求加快工业互联网与能源基础设施深度融合，推动巡检作业向无人化、智能化转型。无人机技术、5G通信、AI视觉识别和数字孪生等前沿技术的成熟，为这一转型提供了坚实的技术底座。基于此，本项目立项建设一套“无人机智巡智检系统”，总体目标如下：一是实现巡检作业全流程自动化，通过预设航线自主巡航，将单次巡检耗时从平均2小时压缩至20分钟以内，效率提升6倍；二是依托深度学习算法对可见光、红外热成像等多源数据进行实时分析，缺陷识别准确率不低于92%，误报率控制在5%以下；三是构建从任务规划、数据采集、智能诊断到工单派发、整改反馈的完整业务闭环，消除信息孤岛；四是利用数字孪生技术，在三维实景地图上叠加巡检数据，实现空间态势感知与历史数据对比分析，为运维决策提供直观支撑。最终，系统将覆盖输电线路、变电站、光伏场站、石油管道等多种场景，助力企业降本增效、本质安全。 2. 软件功能、核心功能模块介绍系统共包含六大核心功能模块，各模块协同运转，形成完整能力矩阵：（1）无人机飞控与航线管理模块：支持多品牌、多机型无人机设备的统一注册、健康状态监控及固件升级管理；内置航线库，支持KML/KMZ等标准格式导入，并提供可视化航点编辑工具，可在二维GIS或三维地球上进行航线规划，模拟飞行轨迹，预判碰撞风险。（2）巡检任务管理模块：提供日常巡检、特殊巡检、应急巡检等多种任务类型；支持单次、周期性、触发式任务调度；任务执行过程中实时接收无人机回传的经纬度、高度、电量、速度等遥测数据，并以动态仪表盘呈现；任务结束后自动归档影像、日志和识别结果。（3）AI智能识别与分析模块：基于YOLOv8和ResNet等深度网络模型，针对绝缘子破损、导线断股、销钉缺失、鸟巢、树障、异常发热等十余类典型缺陷进行自动检测；支持模型在线更新和增量学习；分析结果附带置信度分数和定位框，并支持人工复核标注，形成闭环优化数据。（4）数字孪生与三维可视化模块：基于倾斜摄影和激光点云技术构建巡检场景的高精度三维模型（厘米级），在地图上融合显示无人机实时位置、历史航迹、缺陷标注点；支持多期数据对比，通过卷帘工具直观展示设备前后变化；支持空间量测、剖面分析等高级功能。（5）缺陷管理与工单闭环模块：统一展示所有识别出的缺陷，按严重等级（危急、严重、一般）分级高亮；每个缺陷可一键生成工单，自动关联位置、影像和识别结果，派发给指定的运维班组；支持工单状态追踪（待处理、处理中、已完成）