自然语言生成sql
1、立项背景和目标
随着企业数据量的爆发式增长,业务人员直接向数据库取数分析的需求日益迫切,但传统方式高度依赖技术人员编写SQL,沟通成本高、响应周期长。为解决这一痛点,本项目立项旨在构建一个基于大模型(LLM)的自然语言数据分析平台。核心目标是打造一个智能体(Agent),允许用户通过日常对话(如“江门每月新增收入是多少”)直接查询数据库,并自动完成意图识别、表结构匹配、SQL生成、数据清洗及结果可视化,最终实现数据驱动决策的零门槛与高效率。
2、软件功能、核心功能模块的介绍
软件主要包含四大核心模块:①用户配置模块:支持通义千问、DeepSeek等多种API Key的配置及数据库连接设置,是整个系统的入口。②自然语言处理模块:接收用户模糊的业务需求,将其转化为机器可理解的指令。③数据分析与清洗模块:根据指令自动生成SQL查询数据,并提供数据清洗功能(如备份表、清空原表),确保数据操作的灵活性与安全性。④智能调度与可视化模块:将查询结果以表格或图表形式呈现,并支持环比等复杂计算。
3、业务流程、功能路径描述
业务流程完全由智能体驱动:①用户输入自然语言需求(如“江门,每个月,总新增收入,环比”);②智能体(Agent) 接管任务,通过RAG技术检索向量数据库中的表结构;③工具调用:根据需求调用LangChain工具包进行数据计算或逻辑判断;④生成SQL:将需求、表结构及工具结果整合为提示词交由大模型生成SQL;⑤验证与执行:对SQL进行安全性检查(防删除、语法校验)后执行查询;⑥结果返回:数据经脱敏、格式化后返回给用户。
人工智能