1. 支持上传 Excel 文件或输入网址,自动抓取网页数据并解析为结构化表格
2. 内置京东、淘宝、拼多多、1688、抖音、小红书等平台专用爬虫,自动识别平台并提取数据
3. 提供自定义 CSS 选择器功能,支持用户手动指定提取规则
4. 自动分析数据特征,推荐合适的可视化图表类型
5. 一键生成 HTML 数据分析报告,支持预览和下载
1. 前端使用 HTML/CSS/JS 构建聊天式交互界面,后端基于 Flask 提供 REST API
2. 网页抓取采用 requests + BeautifulSoup 解析静态页面,Playwright 处理动态渲染页面
3. 社交平台爬虫通过 SSE(Server-Sent Events)实现实时进度推送,前端展示进度条和状态信息
4. 数据分析使用 pandas 进行统计计算,图表通过 pyecharts 生成
5. 抖音数据抓取基于 Douyin_Spider 模块,通过 protobuf 构造请求参数并模拟 API 调用