1天前活跃

博嘉

• UID:15334
综合分:36
成都市
兼职
1-3年经验
方向: 人工智能-自然语言处理 人工智能-计算机视觉与图像处理

技能

核心技能: Python、PyTorch
其他技能:
交流语言: 普通话( 母语水平 ) 英语( 无需工具可书面交流 )
行业经验: 人工智能 产业互联网

项目案例

基于大规模预训练语言模型聊天机器人-qwen3
建立企业知识库并基于此实现检索增强生成(RAG)系统,以实时与用户交互完成问答,可以分为以下几个步骤: 1. 建立企业知识库 文档收集与解析 收集企业内部的各类文档,包括但不限于产品手册、技术文档、FAQ、政策文件等。 使用合适的工具解析这些文档,确保它们能够被系统理解。例如,使用mineru进行版面分析,或者利用多模态大模型如qwen-vlm来处理复杂文档。 文档切分 将文档按照语义段落切分成适当大小的块(chunks),保证每个chunk都能包含完整的语义信息,同时适合后续处理。 向量化 对每个chunk应用嵌入模型(如jina-embeddings-v2或BAAI提供的模型)将其转换为向量表示,以便于后续的相似度计算和检索。 2. RAG检索与问答 问题重写与查询优化 针对用户的提问,可能需要对其进行重写或分解,以更好地匹配知识库中的内容。这可以通过多种策略实现,比如多重查询、RAG融合、查询分解等。 向量检索与BM25结合 在Elasticsearch或其他搜索引擎中,结合向量检索(基于嵌入的相似度搜索)和BM25检索(基于词频-逆文档频率的文本相似度评分算法),提供更加精确的结果。 召回与重排 根据检索结果,将最相关的文档chunks召回,并通过重排模型(如big-reranker-base/big-reranker-large)进一步优化排序,提高回答的相关性和准确性。 实时交互 使用Qwen基座模型作为后端的大语言模型,根据召回的文档chunks生成最终的回答。这个过程需要高效的处理机制来实现实时响应。
内容平台

工作经历

某芯片企业
  
15-49人
算法工程师
2022.07 - 2025.07
负责芯片设计算法,包含布线布局,还负责公司的各种AI业务

教育经历

甘肃农业大学
2021.09 - 2024.06
智能检测
硕士

个人简介

熟悉强化学习,大语言模型训练,图像生成
成功交付率
100%
相似推荐
上海市
人工智能-计算机视觉与图像处理、后端-C++
技能:C++、OpenCV、Transformers
北京市
人工智能-计算机视觉与图像处理、后端-Python
技能:TensorFlow、PyTorch、OpenCV
天津市
人工智能-自然语言处理
技能:Python
深圳市
人工智能-自然语言处理、人工智能-计算机视觉与图像处理
技能:Python、Keras、SQL、PyTorch、OpenCV
郑州市
后端-Java、人工智能-计算机视觉与图像处理
技能:PyTorch、Spring Boot、Vue
帮助文档   Copyright @ 2021-2024 程序聚合 | 浙ICP备2021014372号
人工客服