【摘 要】
:
系统运用Python语言克服新浪微博反爬虫问题,使用Scrapy框架实现了高效、稳定的微博用户信息爬虫程序,全面获取用户在微博中的基本信息,并导入Neo4j图数据库和Echarts数据可
【机 构】
:
江苏警官学院计算机信息与网络安全系
论文部分内容阅读
系统运用Python语言克服新浪微博反爬虫问题,使用Scrapy框架实现了高效、稳定的微博用户信息爬虫程序,全面获取用户在微博中的基本信息,并导入Neo4j图数据库和Echarts数据可视化库进行人物关系分析和挖掘。此外,系统针对微博中存在大量“网络水军”的现状设置了过滤选项,可以有效排除“网络水军”非正常行为对分析结果的影响。系统调试结果表明,系统能够实现对特定微博下转发、评论用户信息的实时、稳定、高效采集与分析,有效帮助人们从海量数据中提取复杂的关联关系,简洁、直观地分析微博用户之间的交互关系。
其他文献
长期以来,我国行政事业单位国有资产管理监督机制不够完善,管理存在诸多问题,不仅给国有资产的安全造成了隐患,而且大大地影响了国有资产的使用效率,加大了政府运行成本。当
<正>建筑是文化的载体,"是一定社会历史文化的体现",它以直观、形象的方式反映着一定社会的意识形态和深刻的历史文化内涵。有什么样的文化,就会有什么样的建筑。莫氏土司建
修辞格一般是从结构形式的角度来命名的。因而每一种修辞格理应具有一个特定的结构形式。而在以往的修辞学著作中 ,同一种语言的结构形式可以是不同的修辞格 ,不同的结构形式
我国城镇化已进入高速发展时期,但在发展中却凸显严重的生态问题,究其根源,文章从人类中心主义、资本逻辑与城市文明三大主要层面阐释,探析出产生城镇化生态问题的根本原因,
建筑问题是海德格尔最为关注的现实世界问题之一,而对此问题之解读成为展开海德格尔中晚期思想的一条重要线索。本文通过对建筑与安居,建筑与空间,建筑与天、地、神、人三个
<正>中信戴卡率先品尝了智能制造的硕果,通过西门子工程软件平台TIA博途,整条汽车轮毂低压铸造生产线可以实现1人管理12个机台,书面文件几乎为零,工艺调整的工作时间缩短了90
19世纪20年代西方逻辑实证主义的兴起宣告了科学哲学学科的诞生。鸦片战争之后的中国,对于"西学"的引进有着较强大的内在动力,包括逻辑学、分析哲学、实验主义哲学等在内的"
在这份首次发表的手稿中,塔尔斯基探讨了何谓"逻辑概念"的问题。他借助于克莱因的厄尔兰根纲领,把普通几何学的"逻辑概念"定位为那些对空间的所有变换都保持不变的概念。作为
新闻评论要继承和发扬古人的优良写作传统,通过增加论说气势,提高可读性和感染力。气势是评论从内容到形式的有机呈现。有效地将内容外化为形式,用形式为内容服务,是写出评论气势
“五四”至20世纪30年代中期,随着现代意义的女性文学登场,女性文学批评作为对女性文学创作的观照、阐释、评价也应运而生,成为一种较为可观的文学批评现象。当时的女性文学