1、立项背景和目标
商业地产行业(写字楼/产业园区)在房源信息获取、客户需求匹配、销售线索跟踪等环节长期依赖人工操作,效率低、信息碎片化。本项目旨在通过大语言模型构建一个面向商业地产从业者和投资者的智能对话平台,实现 AI 驱动的房源搜索、销售线索分析、带看预约管理和房源智能创建,降低人力成本,提升业务转化效率。
2、软件功能、核心功能模块的介绍
平台包含以下核心模块:
• AI 智能对话:基于 LLM 的流式对话,支持意图识别(搜索房源/分析线索/预约带看/创建房源),自动路由到对应 AI 子图处理。
• 文件上传与 OCR 解析:支持 PDF、图片等多格式文件上传,调用 OCR 提取文本信息,用于房源资料自动解析。
• 销售线索分析:自动汇总分析销售线索数据,生成可视化报表和 actionable insights。
• 带看预约管理:智能调度带看时间,整合日历与通知系统。
• 房源创建与发布:AI 辅助填写房源表单(投资/租赁双模式),支持逐字段填入和一键发布到房源库。
• 场景导航系统:5 大业务场景(首页/AI找房/线索分析/带看预约/创建房源),结合角色权限(访客/投资人/经纪人)实现功能隔离。
• 对话历史持久化:支持多会话管理,对话内容按 session 持久化存储(内存/MySQL 可选)。
3、业务流程、功能路径描述
用户进入平台后,系统根据 IP 自动检测所在城市。访客可通过导航栏选择场景:AI 找房场景中输入自然语言需求(如"帮我搜索望京的甲级写字楼"),后端通过意图路由分发至搜索子图,返回结构化房源卡片;投资人/经纪人可进入销售线索或带看预约场景进行数据分析;创建房源场景中,用户可上传 PDF 资料,AI 自动提取关键字段填入双栏表单(左聊天右表单),确认后一键发布。整个流程由 LangGraph 状态机驱动,前端通过 SSE 实时接收流式响应。
1、整体架构和设计思路,不同模块使用的技术栈
整体采用前后端分离架构:
• 前端:Next.js 14(App Router)+ TypeScript + Tailwind CSS + shadcn/ui 组件库,状态管理使用 Zustand(会话/聊天/角色/表单多 store 拆分)。
• 后端:FastAPI + Python 3.11,AI 工作流使用 LangGraph 构建多 Agent 协作图(意图路由 → 子图分发 → 工具调用 → 结果组装)。
• LLM 层:通过 LangChain-OpenAI 调用硅基流动 DeepSeek-V4-Flash API,配置超时 120s、最大重试 2 次、max_tokens 4096。
• 数据层:房源数据使用 Mock JSON(开发阶段)/ MySQL(生产阶段);会话存储支持内存模式和 MySQL 持久化;文件上传存储到本地磁盘。
• 测试:后端使用 pytest(262 个测试用例),前端使用 vitest + @testing-library/react(72 个测试用例)。
2、"我"的负责模块和结果
我作为项目核心开发者,负责前后端全栈开发及 AI 工作流设计:
• 架构设计:设计了基于 LangGraph 的多 Agent 意图路由系统,将用户请求按 5 大意图分发至对应子图,解耦业务逻辑。
• 前端开发:完成全部 UI 组件开发(NavBar、ChatApp、双栏布局表单、场景导航等),构建通过 0 错误。
• 后端开发:实现 FastAPI 服务端、LLM 配置、OCR 工具链、文件解析器、发布服务等核心模块,后端 262 个单元测试全部通过。
• 性能优化:修复 LLM 503 超时根因(配置 request_timeout + asyncio.to_thread 避免阻塞事件循环 + SSE 流式推送),响应延迟从数分钟降至秒级。
• Bug 修复:诊断并修复 OCR 全流程 6 个 Bug(双重调用、Multipart 500、字段缺失、内存泄漏、权限矩阵等),端到端测试验证通过。
• 测试覆盖:累计编写 334 个测试用例(后端 262 + 前端 72),0 失败。