本项目以数字金融科技为背景,针对当前金融研报生成的复杂性与高专业性,提出了一种基于多模态技术的智能研报生成方案。通过融合大模型技术与金融领域数据,项目实现了从数据采集到报告生成的全流程创新设计,旨在提升智能投研和投顾服务的效率与质量。
多模态数据处理:集成文本、表格和图像数据,通过离线爬取公司年报和在线抓取新闻资讯、股价等信息,构建统一的金融数据运营管道。
文档树与多检索策略:采用文档树结构对年报长文本进行组织与索引,并结合 RAG、正则表达式和 OCR 提取表格数据,提升数据处理的完整性和精度。
智能 Agent 系统:搭建感知 Agent 和规划 MultiAgent,利用多模态大模型处理个股新闻、K 线图和财报信息,并生成初稿和终稿研报。
AI 模型网关与任务队列:通过集成 ChatGPT、文心一言等多模型构建 AI 模型网关,支持多模型调用与失败自动重试,同时结合 Celery 实现异步任务调度与离线数据更新。
多模态数据处理:集成文本、表格和图像数据,通过离线爬取公司年报和在线抓取新闻资讯、股价等信息,构建统一的金融数据运营管道。
文档树与多检索策略:采用文档树结构对年报长文本进行组织与索引,并结合 RAG、正则表达式和 OCR 提取表格数据,提升数据处理的完整性和精度。
智能 Agent 系统:搭建感知 Agent 和规划 MultiAgent,利用多模态大模型处理个股新闻、K 线图和财报信息,并生成初稿和终稿研报。
AI 模型网关与任务队列:通过集成 ChatGPT、文心一言等多模型构建 AI 模型网关,支持多模型调用与失败自动重试,同时结合 Celery 实现异步任务调度与离线数据更新。