论文部分内容阅读
通过基于Python语言的网络爬虫对"今日头条"、"一点资讯"的热点推送新闻标题进行抓取,使用基于Python的中文分词工具对新闻标题数据进行分词统计处理。为了高效获取数据,对不同的网站使用不同的爬虫技术,在为期一个月的时间内对"今日头条"等自媒体新闻网抓取近万条热点新闻标题,在对数据进行分词统计及关键词提取后成功获取当月新闻中的热词。