30天前活跃

博嘉

• UID:15334
综合评分 34
方向: 人工智能-NLP和自然语言处理 人工智能-计算机视觉与图像处理
成都市
700元/8h
1-3年经验
求职意愿:接单·(30天前更新)

个人简介

熟悉强化学习,大语言模型训练,图像生成

技能

核心技能: Python、PyTorch
其他技能:
交流语言: 普通话( 母语水平 ) 英语( 无需工具可书面交流 )
行业经验: 人工智能 工业互联网

项目案例

基于大规模预训练语言模型聊天机器人-qwen3
建立企业知识库并基于此实现检索增强生成(RAG)系统,以实时与用户交互完成问答,可以分为以下几个步骤: 1. 建立企业知识库 文档收集与解析 收集企业内部的各类文档,包括但不限于产品手册、技术文档、FAQ、政策文件等。 使用合适的工具解析这些文档,确保它们能够被系统理解。例如,使用mineru进行版面分析,或者利用多模态大模型如qwen-vlm来处理复杂文档。 文档切分 将文档按照语义段落切分成适当大小的块(chunks),保证每个chunk都能包含完整的语义信息,同时适合后续处理。 向量化 对每个chunk应用嵌入模型(如jina-embeddings-v2或BAAI提供的模型)将其转换为向量表示,以便于后续的相似度计算和检索。 2. RAG检索与问答 问题重写与查询优化 针对用户的提问,可能需要对其进行重写或分解,以更好地匹配知识库中的内容。这可以通过多种策略实现,比如多重查询、RAG融合、查询分解等。 向量检索与BM25结合 在Elasticsearch或其他搜索引擎中,结合向量检索(基于嵌入的相似度搜索)和BM25检索(基于词频-逆文档频率的文本相似度评分算法),提供更加精确的结果。 召回与重排 根据检索结果,将最相关的文档chunks召回,并通过重排模型(如big-reranker-base/big-reranker-large)进一步优化排序,提高回答的相关性和准确性。 实时交互 使用Qwen基座模型作为后端的大语言模型,根据召回的文档chunks生成最终的回答。这个过程需要高效的处理机制来实现实时响应。
内容平台

工作经历

某芯片企业
  
15-49人
算法工程师
2022.07 - 2025.07
负责芯片设计算法,包含布线布局,还负责公司的各种AI业务

教育经历

甘肃农业大学
2021.09 - 2024.06
智能检测
硕士
相似推荐
杭州市
人工智能-NLP和自然语言处理、后端-Node.js
技能:Python、Vue、NestJS
广州市
人工智能-计算机视觉与图像处理、前端-Web前端
技能:Python、OpenCV、Transformers、PyTorch
昭通市
后端-Python、人工智能-计算机视觉与图像处理
技能:SQL、React、Vue、Flask、JavaScript
北京市
人工智能-机器学习与深度学习、人工智能-计算机视觉与图像处理
技能:C++、Python
北京市
人工智能-计算机视觉与图像处理、算法-几何建模和图形渲染
技能:C++、Python、PyTorch
帮助文档   Copyright @ 2021-2024 程聚宝 | 浙ICP备2021014372号
人工客服