程序聚合 软件案例 基于大规模预训练语言模型聊天机器人-qwen3

基于大规模预训练语言模型聊天机器人-qwen3

2025-07-17 22:05:00
行业:内容平台
载体:Windows应用、插件
技术:Python、PyTorch、Transformers

业务和功能介绍

工业软件使用手册较为复杂,上手门槛较高,结合大语言模型通过问答形式,帮助用户快速入门,查取功能的操作方式
建立企业知识库并基于此实现检索增强生成(RAG)系统,以实时与用户交互完成问答,可以分为以下几个步骤:

1. 建立企业知识库
文档收集与解析

收集企业内部的各类文档,包括但不限于产品手册、技术文档、FAQ、政策文件等。
使用合适的工具解析这些文档,确保它们能够被系统理解。例如,使用mineru进行版面分析,或者利用多模态大模型如qwen-vlm来处理复杂文档。
文档切分

将文档按照语义段落切分成适当大小的块(chunks),保证每个chunk都能包含完整的语义信息,同时适合后续处理。
向量化

对每个chunk应用嵌入模型(如jina-embeddings-v2或BAAI提供的模型)将其转换为向量表示,以便于后续的相似度计算和检索。
2. RAG检索与问答
问题重写与查询优化

针对用户的提问,可能需要对其进行重写或分解,以更好地匹配知识库中的内容。这可以通过多种策略实现,比如多重查询、RAG融合、查询分解等。
向量检索与BM25结合

在Elasticsearch或其他搜索引擎中,结合向量检索(基于嵌入的相似度搜索)和BM25检索(基于词频-逆文档频率的文本相似度评分算法),提供更加精确的结果。
召回与重排

根据检索结果,将最相关的文档chunks召回,并通过重排模型(如big-reranker-base/big-reranker-large)进一步优化排序,提高回答的相关性和准确性。
实时交互

使用Qwen基座模型作为后端的大语言模型,根据召回的文档chunks生成最终的回答。这个过程需要高效的处理机制来实现实时响应。

项目实现

项目持续三个月,我在其中负责的任务分为:
(1)基于PYQT5搭建完整的插件界面
(2)完成模型选型,以及核心流程
(3)对模型进行下游数据微调
(4)对pdf等文档进行切块等文字提取

示例图片视频


博嘉
30天前活跃
方向: 人工智能-NLP和自然语言处理、人工智能-计算机视觉与图像处理、
交付率:100.00%
相似推荐
校园智慧管理中台
1、学校日常管理工作 2、课表查看、调代课、课堂点名及学生请假和老师请假 3、考试安排及自动生成考试 4、学校德育管理 5、学校资金管理 6、学校仓储管理 7、学生评教管理 8、同步钉钉或者企业微信用户和部门并发送工作通知
数字孪生
1.展厅,园区,产品,厂区,建筑等数字孪生建设 2.数字化管控,包括数据看板,工艺流程,管道线路,巡检系统,设备管理,人员定位,监控系统,漫游,vr应急演练等 3.框架设计,功能开发,数据对接,打包部署,bug修改,性能优化等 4.可对接http,websocket,mqtt,modbus等协议,也可直接对SQL接数据库 5.vr开发以及触屏设备开发
智慧园区平台
智慧园区管理平台是一套“集成化”、“智能化”的平台,通过接入视频监控、门禁、道闸、水电等系统的设备,实现安防信息化集成与联动。以电子地图为载体,融合各系统能力,实现丰富的智能应用。该平台适用于园区通用综合安防业务,对各系统资源进行了整合和集中管理,实现统一部署、统一配置、统一管理和统一调度。 聚焦园区管理、服务和运营,为物业、行政、人事等部门提供综合安防、物业后勤、行政办公、生产制造、招商租赁、运营中心等应用,实现园区整体智慧化和数字化。
火车票分析助手-Python可视化
一、业务和功能介绍 1. 立项背景和目标 随着铁路客运系统的日益普及,乘客对于车票信息的获取和分析需求不断提高。然而,市面上大多数购票平台仅提供基础的查询功能,缺乏对售票趋势、起售时间、卧铺余量等深度分析的支持。本项目“火车票分析助手”旨在开发一款集车票查询、卧铺售票分析、起售时间查询于一体的本地化工具,帮助用户更高效地获取和分析火车票信息,辅助出行决策。 2. 软件功能与核心功能模块 本系统主要包括三大功能模块: 车票查询模块:支持用户输入出发地、目的地及出发时间,实时查询并展示相关车次、座位类型、票价等信息。 卧铺售票分析模块:针对用户指定的路线,分析卧铺类车票的售票情况,辅助判断余票趋势。 车票起售时间查询模块:根据车站名称查询该站车票的官方起售时间,帮助用户掌握最佳购票时机。 3. 业务流程与功能路径 用户首先在“车票查询”界面输入查询条件,系统返回车票列表;若需进一步分析卧铺售票情况,可切换至“卧铺售票分析”模块进行专项查询;而“车票起售时间”模块则独立提供各车站的售票时间信息。整个流程清晰、模块耦合度低,用户可根据需求灵活切换功能路径。
基于立体书与小程序联动技术的科举文化Phygital互动产品-秦淮入砚
一、立项背景与目标 针对文旅文创产品“重展示、轻互动”的行业痛点,本项目立足南京科举文化,旨在打造一款首创“立体书+小程序”双核驱动的Phygital互动产品。目标用户为亲子家庭、学生及文化爱好者,通过游戏化体验打破传统观光的走马观花,实现文化的沉浸式传播与创新性转化。 二、核心功能模块 1. 立体书实体场景:可展开的3D夫子庙、江南贡院号舍等场景,内置NFC学子身份卡、道具卡等实体互动机关。 2. 小程序数字系统: · 角色与属性系统:创建角色,管理“学识、人脉、财力、心境”四大属性。 · 策略行动系统:每日有限行动点,可选择“闭门苦读”、“行卷社交”、“游览秦淮”等策略。 · 动态事件与成就系统:根据选择触发随机事件,最终生成个性化殿试榜文与数字游记。 三、业务流程与路径 用户打开立体书→扫描二维码激活小程序并创建角色→通过NFC绑定实体卡片→在每日循环中消耗行动点进行策略选择→触发事件并实时更新属性→直至殿试结局→综合属性生成专属榜文与游记→可打印收藏于立体书尾页,形成从实体到数字再回归实体的情感闭环。
帮助文档   Copyright @ 2021-2024 程聚宝 | 浙ICP备2021014372号
人工客服