天气数据爬取与报告
1.立项背景和目标
随着气象数据在农业、交通、能源等领域的应用需求增加,传统手动获取天气信息效率低下且易出错。本项目旨在通过自动化技术实现对中国天气网指定城市 7 天天气预报数据的采集、处理和可视化,为用户提供直观、准确的天气分析报告,降低数据获取成本。
2.软件功能、核心功能模块的介绍
数据爬取模块:使用requests库模拟浏览器请求,爬取中国天气网指定城市的 7 天天气预报页面,并通过BeautifulSoup4解析 HTML,提取日期、天气状况、最高 / 最低温度等核心数据。
数据处理模块:清洗原始数据(如去除单位符号 “℃”),计算温差(最高温度 - 最低温度)和 7 天平均温度,确保数据准确性。
Excel 自动化模块:利用openpyxl创建 Excel 文件,结构化存储数据并生成温度趋势折线图(含最高 / 最低温两条曲线),自动设置数值格式、表头样式及文件标题。
3.业务流程、功能路径描述
数据爬取流程:
构造请求头(随机 User-Agent),发送 GET 请求至中国天气网目标页面。
检查响应状态,若成功则使用BeautifulSoup4解析 HTML 内容。
定位数据所在表格,遍历提取每行数据并存储为列表。
数据处理流程:
清洗温度数据,转换为数值类型。
计算温差和平均温度,扩展数据列表。
Excel 生成流程:
创建工作簿和工作表,写入表头及数据。
插入温差公式和平均温度计算函数,应用数值格式。
生成双折线图,设置图表标题、图例、网格线及数据点标注。
保存文件为 “天气报告.xlsx”。
生活服务