本项目是一个面向建筑领域的智能问答系统,旨在将大模型能力与行业知识深度结合,解决传统建筑信息查询效率低、专业门槛高以及安全合规风险大的问题。随着大模型在通用问答场景中的广泛应用,其在垂直行业中往往存在“回答不专业、胡乱生成、越权回答”等隐患,尤其在建筑规范、施工安全和法律责任相关问题上,错误回答可能带来严重后果。因此,构建一个安全、可信、可控的建筑大模型智能问答系统具有重要的现实意义。
在业务层面,该系统面向建筑设计、施工、监理及相关从业人员,提供建筑规范查询、专业知识问答和工程经验辅助决策等服务。系统以“安全合规优先”为核心原则,通过引入拒答机制,确保模型只在合理、合规、可回答的范围内进行输出,避免对高风险、越权或不确定问题给出误导性答案,从而提升业务可靠性与实际可用性。
在功能架构上,系统由前置拒答模块、核心问答模块和后置拒答模块共同构成。前置拒答模块基于专门训练的拒答模型,对用户问题进行安全与合规性判断,在高风险或不适合回答的场景下直接给出规范化拒答,避免问题进入生成环节。核心问答模块采用 RAG(检索增强生成)+ LangChain 架构,通过向量检索精准召回建筑领域知识文档,并结合大模型生成专业、可溯源的回答,显著降低幻觉问题。后置拒答模块则对模型生成结果进行二次审核,在发现潜在违规或不确定内容时进行拦截或修正,形成完整的安全闭环。
最终,系统以网站形式对外部署,为用户提供直观、便捷的交互体验,实现建筑行业知识的智能化、安全化与服务化落地。
本项目采用模块化、分层式的大模型系统架构,围绕“安全可控 + 行业知识增强”的核心目标进行整体设计。系统整体流程为:用户问题首先进入前置拒答模块进行安全与合规判断,通过筛选的问题再进入RAG 增强问答模块生成答案,最后由后置拒答模块对输出结果进行二次校验,确保最终回复的可靠性与规范性,并通过 Web 服务对外提供能力。
在技术架构上,前置与后置拒答模块均基于 Qwen3Guard 0.6B 模型进行 LoRA 微调,采用 PyTorch + HuggingFace Transformers + PEFT 完成训练与推理部署,用于高效判断高风险、越权及不确定问题。核心问答模块采用 RAG + LangChain 技术栈,使用 Sentence Embedding + 向量数据库(如 FAISS) 进行建筑领域知识检索,并结合大模型生成最终答案,从而在保证专业性的同时显著降低幻觉问题。系统整体通过 FastAPI 提供服务接口,并部署至 Web 前端,实现完整的端到端问答流程。
在项目中,我主要负责拒答模块的设计、训练与集成,包括拒答数据构建、模型微调方案制定以及与 RAG 问答链路的融合。具体工作中,我独立完成了约 16 万条拒答数据的清洗与格式统一,并基于 Qwen3Guard 0.6B 进行 LoRA 训练,在单卡 GPU 环境下实现稳定收敛。实验结果显示,前置拒答模块对高风险问题的拦截率提升至 90% 以上,有效减少了不合规问题进入生成阶段;后置拒答模块进一步降低了不安全回答的输出概率,使系统整体安全性显著提升。
在实现过程中,主要难点在于显存受限条件下的大模型训练与稳定性控制,以及拒答边界定义不清导致的误拒答问题。针对显存瓶颈,我通过 LoRA 微调、FP16、梯度累积与合理的 batch size 设置 成功完成训练;针对误拒答问题,我对数据标签进行多轮修正,并引入前后置双重拒答策略,在保证安全性的同时尽量减少对正常业务问答的影响。最终,该方案实现了安全性与可用性的平衡,为建筑行业大模型应用提供了可落地的工程实践。