1.面向个人的多模态知识管理平台。支持导入 PDF、Office文档、电子书、图片、音视频等多种格式文件,自动解析并构建私有知识库。
2.集成 OCR 文字识别与 ASR语音转写,将扫描件和音视频内容转化为可检索文本。
3.内置 AI精炼引擎,支持文档摘要、大纲提取、关键要点、改写润色、翻译、智能标签与分类。
4.基于 RAG架构实现知识库问答,用户可通过自然语言提问,系统从知识库检索相关内容并生成准确回答。
1.后端 FastAPI + 前端 Vue3 + Vant UI 全栈分离架构。文件解析层支持 python-docx、PyMuPDF、ebooklib 等多格式引擎,OCR模块封装 PaddleOCR 本地识别与云端 OCR 双通道,ASR 模块集成 FunASR 与云端语音平台。
2.AI 层接入 DeepSeek大模型实现摘要、大纲、要点、改写、翻译、标签、分类七种精炼能力,百炼 Embedding + ChromaDB 构建向量索引,结合 BM25实现混合检索。
3.知识图谱模块实现实体抽取与关系管理。
4.PostgreSQL存储文档与任务状态,后台异步任务队列支持批量处理与并发控制。Docker Compose 一键部署,完整日志与监控体系.