博嘉

• UID:15334

综合评分 34

方向：人工智能-NLP和自然语言处理、人工智能-计算机视觉与图像处理

成都市

700元/8h

3-5年经验

求职意愿：接单·(30天前更新)

个人简介

熟悉强化学习，大语言模型训练，图像生成

技能

核心技能： Python、PyTorch

其他技能：

交流语言：普通话（母语水平）、英语（无需工具可书面交流）

行业经验：人工智能、工业互联网

项目案例

基于大规模预训练语言模型聊天机器人-qwen3

建立企业知识库并基于此实现检索增强生成（RAG）系统，以实时与用户交互完成问答，可以分为以下几个步骤： 1. 建立企业知识库文档收集与解析收集企业内部的各类文档，包括但不限于产品手册、技术文档、FAQ、政策文件等。使用合适的工具解析这些文档，确保它们能够被系统理解。例如，使用mineru进行版面分析，或者利用多模态大模型如qwen-vlm来处理复杂文档。文档切分将文档按照语义段落切分成适当大小的块（chunks），保证每个chunk都能包含完整的语义信息，同时适合后续处理。向量化对每个chunk应用嵌入模型（如jina-embeddings-v2或BAAI提供的模型）将其转换为向量表示，以便于后续的相似度计算和检索。 2. RAG检索与问答问题重写与查询优化针对用户的提问，可能需要对其进行重写或分解，以更好地匹配知识库中的内容。这可以通过多种策略实现，比如多重查询、RAG融合、查询分解等。向量检索与BM25结合在Elasticsearch或其他搜索引擎中，结合向量检索（基于嵌入的相似度搜索）和BM25检索（基于词频-逆文档频率的文本相似度评分算法），提供更加精确的结果。召回与重排根据检索结果，将最相关的文档chunks召回，并通过重排模型（如big-reranker-base/big-reranker-large）进一步优化排序，提高回答的相关性和准确性。实时交互使用Qwen基座模型作为后端的大语言模型，根据召回的文档chunks生成最终的回答。这个过程需要高效的处理机制来实现实时响应。

内容平台