程序聚合 软件案例 基于大规模预训练语言模型聊天机器人-qwen3

基于大规模预训练语言模型聊天机器人-qwen3

2025-07-17 22:05:00
行业:内容平台
载体:Windows应用、插件
技术:Python、PyTorch、Transformers

业务和功能介绍

工业软件使用手册较为复杂,上手门槛较高,结合大语言模型通过问答形式,帮助用户快速入门,查取功能的操作方式
建立企业知识库并基于此实现检索增强生成(RAG)系统,以实时与用户交互完成问答,可以分为以下几个步骤:

1. 建立企业知识库
文档收集与解析

收集企业内部的各类文档,包括但不限于产品手册、技术文档、FAQ、政策文件等。
使用合适的工具解析这些文档,确保它们能够被系统理解。例如,使用mineru进行版面分析,或者利用多模态大模型如qwen-vlm来处理复杂文档。
文档切分

将文档按照语义段落切分成适当大小的块(chunks),保证每个chunk都能包含完整的语义信息,同时适合后续处理。
向量化

对每个chunk应用嵌入模型(如jina-embeddings-v2或BAAI提供的模型)将其转换为向量表示,以便于后续的相似度计算和检索。
2. RAG检索与问答
问题重写与查询优化

针对用户的提问,可能需要对其进行重写或分解,以更好地匹配知识库中的内容。这可以通过多种策略实现,比如多重查询、RAG融合、查询分解等。
向量检索与BM25结合

在Elasticsearch或其他搜索引擎中,结合向量检索(基于嵌入的相似度搜索)和BM25检索(基于词频-逆文档频率的文本相似度评分算法),提供更加精确的结果。
召回与重排

根据检索结果,将最相关的文档chunks召回,并通过重排模型(如big-reranker-base/big-reranker-large)进一步优化排序,提高回答的相关性和准确性。
实时交互

使用Qwen基座模型作为后端的大语言模型,根据召回的文档chunks生成最终的回答。这个过程需要高效的处理机制来实现实时响应。

项目实现

项目持续三个月,我在其中负责的任务分为:
(1)基于PYQT5搭建完整的插件界面
(2)完成模型选型,以及核心流程
(3)对模型进行下游数据微调
(4)对pdf等文档进行切块等文字提取

示例图片视频


博嘉
30天前活跃
方向: 人工智能-NLP和自然语言处理、人工智能-计算机视觉与图像处理、
交付率:100.00%
相似推荐
toB数字孪生项目-仓储AGV孪生平台
1、一比一实时数字孪生,接入wms和mcs等系统,实现数据互通 2、数据统计,预测产量、仓储流量、动态报警等 3、三维场景漫游,交互,支持固定以及漫游相机操作,旋转,拖拽,缩放等 4、场景动画与生产过程实时联动 5、实现了双端部署,即PC客户端与BS端
牛肚村雪菜园-实时交互数字人一体机
本项目为牛肚村雪菜体验园定制了AI实时交互数字人一体机。系统基于FastGPT知识库构建,内置雪菜园及老港镇专属资料,回答准确率超95%。功能涵盖75寸/65寸高清竖屏展示、实时语音对话、口型同步驱动及摄像头互动。数字人作为智能导游,为游客提供展馆引导、政策讲解及趣味互动,显著提升了乡村旅游景点的科技感与服务效率。
智能心理健康管理系统-特色智能心理健康
基于AI的多角色心理健康管理平台,集成智能问答、情绪追踪、医患沟通与个性化推荐。独立完成全栈开发。 核心功能: 1. AI智能咨询:接入阿里DashScope大模型,支持多轮对话与AI综合评估报告生成 2. 情绪追踪体系:情绪日记+症状记录+天气匹配+7/30天趋势统计 3. 医患实时沟通:WebSocket在线咨询、患者公海机制、预约管理 4. 个性化推荐:协同过滤算法推送心理资源(文章/音频/视频) 5. 沉浸式体验:13+房间装饰、8套主题、时间胶囊、心情树洞 技术亮点:AI大模型集成(DashScope)生成个性化评估报告;WebSocket实时通信;协同过滤推荐算法;三角色(患者/医生/管理员)权限体系。
数字孪生-数字工业园区
项目描述: 该平台的核心功能是三维数据底座整合了地上地下空间数据,亮点功能是辅助工程选址决策,和土地全生命周期历史回溯。并且在安徽,山西等地进行了项目实施。 个人负责前端技术选型,并参与功能设计与部分功能开发。
B 端智能制造生产管控系统-工厂 MES 信息平台
项目定位:面向智能制造行业的 B 端 MES 信息平台,核心目标是实现生产全链路数字化管控,助力多家合作工厂通过省级信息化建设验收。 核心功能:覆盖 15 + 业务模块(人员 / 设备管理、安灯预警、产线报工、质量巡检、成品入库等),支持动态表单、PDF 预览、文件上传下载、数据大屏可视化及中英文切换。 业务价值:打通生产任务下发→开工报工→质量检测→成品入库全链路,通过实时数据流转提升生产协同效率与管理透明度。
帮助文档   Copyright @ 2021-2024 程聚宝 | 浙ICP备2021014372号
人工客服