背景:为了了解TMDB网站上的电影排名,分析高分电影的相关属性,了解电影属性随时间的变迁趋势。
功能:使用Python爬虫获取网站上的相关数据,并使用pandas和matplotlib完成数据分析和可视化,使用pandas分别获取电影的文件的类型、语言和上映时间的series对象,统计并可视化各个属性的数量
整体架构:爬虫模块和可视化模块。
爬虫模块:使用简单的python代码,借助request库和lxml库,通过分析网站结构直接获取网站数据
可视化模块:通过分析网站的数据,获取前300的电影类型、语言和上映时间的折线图和饼状图