程序聚合 软件案例 基于大规模预训练语言模型聊天机器人-qwen3

基于大规模预训练语言模型聊天机器人-qwen3

2025-07-17 22:05:00
行业:内容平台
载体:Windows应用、插件
技术:Python、PyTorch、Transformers

业务和功能介绍

工业软件使用手册较为复杂,上手门槛较高,结合大语言模型通过问答形式,帮助用户快速入门,查取功能的操作方式
建立企业知识库并基于此实现检索增强生成(RAG)系统,以实时与用户交互完成问答,可以分为以下几个步骤:

1. 建立企业知识库
文档收集与解析

收集企业内部的各类文档,包括但不限于产品手册、技术文档、FAQ、政策文件等。
使用合适的工具解析这些文档,确保它们能够被系统理解。例如,使用mineru进行版面分析,或者利用多模态大模型如qwen-vlm来处理复杂文档。
文档切分

将文档按照语义段落切分成适当大小的块(chunks),保证每个chunk都能包含完整的语义信息,同时适合后续处理。
向量化

对每个chunk应用嵌入模型(如jina-embeddings-v2或BAAI提供的模型)将其转换为向量表示,以便于后续的相似度计算和检索。
2. RAG检索与问答
问题重写与查询优化

针对用户的提问,可能需要对其进行重写或分解,以更好地匹配知识库中的内容。这可以通过多种策略实现,比如多重查询、RAG融合、查询分解等。
向量检索与BM25结合

在Elasticsearch或其他搜索引擎中,结合向量检索(基于嵌入的相似度搜索)和BM25检索(基于词频-逆文档频率的文本相似度评分算法),提供更加精确的结果。
召回与重排

根据检索结果,将最相关的文档chunks召回,并通过重排模型(如big-reranker-base/big-reranker-large)进一步优化排序,提高回答的相关性和准确性。
实时交互

使用Qwen基座模型作为后端的大语言模型,根据召回的文档chunks生成最终的回答。这个过程需要高效的处理机制来实现实时响应。

项目实现

项目持续三个月,我在其中负责的任务分为:
(1)基于PYQT5搭建完整的插件界面
(2)完成模型选型,以及核心流程
(3)对模型进行下游数据微调
(4)对pdf等文档进行切块等文字提取

示例图片视频


博嘉
30天前活跃
方向: 人工智能-NLP和自然语言处理、人工智能-计算机视觉与图像处理、
交付率:100.00%
相似推荐
Tres开发框架
数字孪生开发模板是一个开箱即用的数字孪生可视化前端开发框架。它基于 Vue 3 Composition API 和 TypeScript 构建,深度集成 TresJS(Three.js 的声明式封装)和 ECharts 数据可视化库。支持多语言,框架已开发多个数字孪生园区,并成功落地。可以为客户快速接入数字孪生系统。
网络安全策略平台
1.项目主要分为态势大屏和后台管理 2.对终端,服务器,路由器,防火墙等设备的在线采集信息及时发现风险并生成告警发送给用户 3.用户可在系统创建专项任务并在此专项任务中绘制和编辑当前单位的单位拓扑和设备拓扑 4.态势模块用户可在态势页面中的地球上开到各个区域内的单位,和部署的设备,并且可以在三维地球上手动对有关系的单位和单位,单位和设备,设备和设备进行连线绘制,以及可以查看单位和设备的信息
智慧运行知识平
负责海康,大华,宇视等厂家智能终端的sdk集成,使用rtsp协议+zlm+webrtc实现实时视频和回放,数据库维护,数据迁移,MySQL读写分离,MongoDB分片集群搭建,智能化巡视逻辑编写,前端页面逻辑编写,对接第三方api,第三方数据集成,ipc远程控制,集成第三方sdk,实现ipc的远程控制,支持云台控制,焦距,光圈等控制,手势控制,sdk抓图,支持守望配置,ipc邮箱配置,配置文件的导入导出,修改视频的编码格式。结合zlm实时视频,使用rtsp协议转webrtc协议进行播放,延时低200ms内,操作无感延时。提供api接口未第三方继承。
点云分割与分类项目
在 3D 视觉、自动驾驶、机器人感知、工业检测等领域,点云是核心环境数据载体。传统 PCL 库仅能实现基础点云分割与分类,规则依赖人工定义,开发成本高、鲁棒性差,难以应对复杂无序点云与密度不均场景。PointNet/PointNet++ 作为点云深度学习里程碑算法,可直接处理无序点云、捕捉局部结构、保持变换不变性,适用于 Ubuntu 环境下的点云智能识别、分割、分类任务,为机器人三维感知、自动驾驶环境理解、工业零件检测提供高效解决方案,是从传统点云处理迈向深度学习智能分析的关键技术。
智慧校园工作室管理平台
参与开发的校园工作室管理系统,这是一个基于springboot和vue的管理系统,使用采用前后端分离架构,为校园工作室提供空间预约、设备维修、成员管理等全流程数字化解决方案。 技术栈 后端:Spring Boot 2.5.15 + Spring Security + JWT MyBatis + PageHelper 分页插件 Redis 缓存 + Druid 数据库连接池 MySQL 数据库 Swagger3 接口文档 前端:Vue 2.6.12 + Element UI 2.15.14 Vuex + Vue Router Axios 异步通信 ECharts 数据可视化 开发工具: Maven 构建工具、Git 版本控制 IntelliJ IDEA、VS Code
帮助文档   Copyright @ 2021-2024 程聚宝 | 浙ICP备2021014372号
人工客服