为解决企业内部知识分散、检索困难的问题,基于 MaxKB 构建私有化智能问答系统。需整合 OA 系统与 KMS 系统中的异构数据(约 4000+ 篇文档),涵盖 Word、PDF、PPT 及视频等多种格式,对答案的准确性及来源溯源有极高要求,AI 回答准确率要求达到90%。
1.针对 OA 系统中“主文档含多重附件”的嵌套结构,设计定制化解析脚本,实现主文档与附件的自动分离与独立索引,确保 4000+ 篇文档及其附属文件无遗漏入库。
2.攻克 KMS 系统中 PPT 及视频数据处理难题:建立"PPT 转 Markdown -> 人工语义校对 -> 结构化分段”的标准化处理流水线,大幅提升了图表与关键结论的检索召回率。
3.优化 MaxKB 的分段策略与混合检索参数,结合重排序模型,将用户提问的答案准确率提升至 90%+。
4.定制开发/配置深度溯源功能,实现回答内容精确映射到文档的具体段落,并自动生成可点击的原文档深链,满足客户对信息可信度的严苛审计要求。
5.完成 MaxKB 在客户内网环境的私有化部署,确保数据安全不出域。
6.协助客户建立知识库持续更新机制,培训内部管理员掌握文档预处理规范,降低后期维护成本。