程序聚合 软件案例 基于大规模预训练语言模型聊天机器人-qwen3

基于大规模预训练语言模型聊天机器人-qwen3

2025-07-17 22:05:00
行业:内容平台
载体:Windows应用、插件
技术:Python、PyTorch、Transformers

业务背景

工业软件使用手册较为复杂,上手门槛较高,结合大语言模型通过问答形式,帮助用户快速入门,查取功能的操作方式

功能介绍

建立企业知识库并基于此实现检索增强生成(RAG)系统,以实时与用户交互完成问答,可以分为以下几个步骤:

1. 建立企业知识库
文档收集与解析

收集企业内部的各类文档,包括但不限于产品手册、技术文档、FAQ、政策文件等。
使用合适的工具解析这些文档,确保它们能够被系统理解。例如,使用mineru进行版面分析,或者利用多模态大模型如qwen-vlm来处理复杂文档。
文档切分

将文档按照语义段落切分成适当大小的块(chunks),保证每个chunk都能包含完整的语义信息,同时适合后续处理。
向量化

对每个chunk应用嵌入模型(如jina-embeddings-v2或BAAI提供的模型)将其转换为向量表示,以便于后续的相似度计算和检索。
2. RAG检索与问答
问题重写与查询优化

针对用户的提问,可能需要对其进行重写或分解,以更好地匹配知识库中的内容。这可以通过多种策略实现,比如多重查询、RAG融合、查询分解等。
向量检索与BM25结合

在Elasticsearch或其他搜索引擎中,结合向量检索(基于嵌入的相似度搜索)和BM25检索(基于词频-逆文档频率的文本相似度评分算法),提供更加精确的结果。
召回与重排

根据检索结果,将最相关的文档chunks召回,并通过重排模型(如big-reranker-base/big-reranker-large)进一步优化排序,提高回答的相关性和准确性。
实时交互

使用Qwen基座模型作为后端的大语言模型,根据召回的文档chunks生成最终的回答。这个过程需要高效的处理机制来实现实时响应。

项目实现

项目持续三个月,我在其中负责的任务分为:
(1)基于PYQT5搭建完整的插件界面
(2)完成模型选型,以及核心流程
(3)对模型进行下游数据微调
(4)对pdf等文档进行切块等文字提取

示例图片视频


博嘉
1天前活跃
方向: 人工智能-自然语言处理、人工智能-计算机视觉与图像处理、
交付率:100.00%
相似推荐
智慧发改项目
智能辅助子系统为上层业务系统的高效运转与便捷操作提供技术支撑底座,建设综合知识图谱、智能服务引导、重点片区BIM应用服务、重点项目倾斜摄影建模及统一对象存储管理。知识图谱工具为用户智能检索和问答交互提供服务,建立产业政策、发展规划之间的关联图谱,为龙华区发改局的政策检索、政策制定等提供智库参考;智能服务引导模块为用户提供智能的操作指引,特别针对项目申报、专项资金申报等复杂业务流程,在相应环节给出流程指引,可以提高各项目环节的工作效率;重点片区BIM应用以全景视角建模进行展示地理空间信息,展示全区六大重点片区的发展全面及配套规划;重点项目的无人机倾斜摄影服务,对北站国际商务区内的重点项目进展定期进行航拍建模,辅助片区的可视管理与三维展示;多统一对象存储管理用于项目资料、过程审批文件等多媒体资料的集中存储、权限管理、版本管理和同步服务等,以便智能便捷地归档文件资料
违章台账管理、违章条例管理
该项目主要实现了违章管理的全流程功能。首先,提供了反馈信息提交功能,用户可以提交违章的相关信息,系统会保存反馈信息并更新违章台账状态为 “待处理”。其次,处理信息提交功能允许用户提交处理信息,系统会插入处理信息并将违章台账状态更新为 “待验证”。然后,验证信息提交功能会对验证信息进行业务校验,如检查违章台账是否存在且状态为 “待验证”、关联条例是否存在、扣分值是否在条例范围内等,校验通过后插入验证信息并更新台账状态为 “已完成”。此外,项目还支持文件的上传、删除和查询操作,方便用户管理相关文件资料。同时,提供了测试功能,可对数据库查询等操作进行测试。
青羊区青易处小程序
*.一个集成了各类事件统计、查看和处理的全方位平台 1.数据看板:对区级各类事件进行统计,并以详细信息的形式进行展示。 2.事件处置:提供发起、通过、回退、转交等多级子事件处理功能。 3.个人中心:提供个人信息查看和历史消息浏览等功能。
T-Office
1、工作台,包含考勤打卡,请求申请、会议安排等功能; 2、用户个人资料包含昵称、头像、岗位,联系等; 3、组织架构,包含企业员工的联系方式,岗位等信息; 4、会议记录,包含参与人员 记录人员,主持人等信息; 5、日历,包含今天将要参与的会议安排以及自己的工作安排;
企业生产设备数据采集与报警系统
1、通讯模块(工业互联网协议通讯),实时获取设备运行数据。 2、数据采集模块,根据设置采集频率,采集设备数据入库。 3、报警逻辑模块,根据配置参与阈值,触发报警,调用报警推送模块。 4、报警推送模块,控制通信模块,发送手机短信,并记录报警信息。 5、设备监控模块,以可视化方式呈现设备运行状态及运行参数,并提供交互操作。 6、报表分析模块,提供数据查询汇总分析,并以可视化图表呈现。
帮助文档   Copyright @ 2021-2024 程序聚合 | 浙ICP备2021014372号
人工客服