论文部分内容阅读
随着互联网的发展壮大,网络数据越来越多,如何高效抓取信息成为难题。网络爬虫具有自动提取网页信息的能力。文章根据网站的特点,提出了一种基于Python中requests模块及Py Query模块进行影评数据采集的爬虫程序设计,可采集豆瓣网大量影评信息。本设计具有针对性强,操作容易、简单,采集数据准确,采集量大等优点。