基于Python的可视化影视信息-Python
业务目标1. 循环遍历电影列表
遍历提前解析好的电影节点列表 movieItemList ,为每一部电影单独创建空字典 movieDict ,用来单条存储一部电影的全部字段。
2. XPath精准提取网页数据
通过XPath语法,从网页节点中定位并抓取4类核心信息:
- title :电影主名称
- otherTitle :电影别名/其他译名
- link :电影详情页URL链接
- star :电影评分
- quote :电影短评/经典一句评语
3. 数据清洗与字典封装
- 合并主标题+别名,拼接为完整电影名称存入字典
- 把链接、评分、评语依次存入字典对应key
- 打印单条电影字典,做运行调试校验
- 把单条字典追加进全局电影列表 movieList
批量抓取豆瓣电影列表页的电影信息,提取标题、链接、评分、经典评语,最终规整保存到本地 doubanMoive.csv 表格文件,方便后续查看、统计与数据分析。
内容平台