论文部分内容阅读
摘要:随着移动时代的到来,只适配了电脑网页、性能羸弱的校园教务系统,已经不能满足学生们的移动查询需求。为此,设计了一种基于网络爬虫的高实用性查询系統。它首先通过Python爬虫以HTTP(hypertext transport protocol)分析与模拟方法获取校园教务系统的网页数据,然后对网页数据进行HTTP解析并定位以精确抽取目标校园数据,最后存入高速NoSQL数据库以供快速查询。通过课表获取实例,验证了该设计的可行性与有效性。
关键词:网络爬虫;HTTP分析;模拟登陆;网络反爬;Scrapy框架
中图分类号:TP393
关键词:网络爬虫;HTTP分析;模拟登陆;网络反爬;Scrapy框架
中图分类号:TP393