该项目由上海申通地铁集团发起,致力于通过智能化技术手段,为地铁司机在应对突发运营故障时提供更快速、精准的问题定位与处置支持,从而显著提升轨道交通的运营效率与行车安全水平。
1.针对厂商同步过来的数据利用 jsoup 和正则规则进行数据清洗,去除富文本类数据中的标签,提取出有效内容
2.利用 dify 构建智能文档转换流水线,支持复杂文档类型,如科研论文/技术手册/图纸。
3.利用 Mineru 将包含图片,公式,表格等元素的多模态 PDF 文档转化成易于分析的 Markdown 格式,提高 AI 语料准备效
率。
4.针对客户问题进行多路并行召回,并将召回结果利用 reranker 重排序模型针对用户问题进行重排,拿到重排完之后结果集
进行归纳整理成标准 json 投送给大模型,使大模型生成总结或者差异性报告。