论文部分内容阅读
本文通过利用python抓取豆瓣TOP250的相关数据,并将数据存储在MYSQL数据库中,然后通过mongDB对数据进行清洗,最后通过Excel和Matlab对处理过的数据进行分析,从而实现数据的可视化。通过数据的可视化对豆瓣电影TOP250的数据进行分析,可以了解豆瓣评分分布区间,了解大众对那些国家电影喜欢,进而了解大众专注热点趋势,进而分析了热点电影的时间分布情况。通过对豆瓣电影TOP250数据的分析,对python爬虫、数据清洗、数据可视化有了深入的学习。