论文部分内容阅读
随着电脑、智能手机以及平板电脑的普及,互联网已成为大众创业、万众创新的新工具。全球游戏产业迅速兴起,游戏制作的门槛随着技术的进步逐渐降低,从而使得销售额和玩家呈现逐年增加的态势。游戏属于创意产业,其产业链为增值链,即研发制作、发布运营、推广销售,一步比一步所要做的工作多,支付的资金多。随着游戏市场的飞速增长,游戏在研发、测试到运营、维护的过程中,游戏产业的人员迫切需要了解玩家对游戏的感受和体验,以制作出符合玩家口味的高质量游戏。本文分析了现有游戏行业收集用户反馈的现状,指出现有游戏行业的人工舆情监测存在的问题。在总结国内外相关研究成果的基础上,借鉴一些技术的成熟实践经验,并以腾讯游戏平台为依托,通过对整个游戏舆情监测流程的解析,设计并实现了基于网络爬虫的游戏舆情监测系统。本文主要工作如下:1.针对网络上游戏品种多,玩家对游戏的评价过于分散,人工收集游戏舆情耗时耗力的问题,设计和实现了网络爬虫功能。用户可以定制规则来爬取论坛或其他来源的数据,网络爬虫支持特征串标记、路径解析等方式对需要的网页内容进行定制化的提取,然后将数据存储到分布式数据库中供后续分析使用。网络爬虫功能有效的解决了传统通过人工查看舆情费时费力且容易遗漏的问题。2.针对人工查看玩家反馈,通过主观判断难以评判玩家对游戏的评价问题,设计和实现了对舆情信息进行自动化分析的功能。在爬取到论坛等来源的数据后,使用中文分词工具对数据分词,根据项目词库和用户自定义词库,分析统计每天数据源中热词的出现频率,汇总得到热词趋势、游戏口碑等数据。在此基础上,通过邮件、网页图表展示等方式,将游戏舆情信息以可视化的方式展现给用户。3.综合上述功能,设计并实现了基于网络爬虫的游戏舆情监测系统,该系统包含前端Web展示和后端业务实现两个部分。前端采用PHP和Apache相结合的方案,后端包括了后台控制系统、网络爬虫器、热词分析器、定时任务工具、自动化邮件工具、索引工具以及其他模块。使用到了爬虫、网页解析库、分词工具、全文检索引擎等工具。该系统解决了人工进行游戏舆情监测存在的各种问题,极大的提高了获取游戏舆情信息的效率和准确率。本论文研究设计的网络游戏舆情监测系统,最终服务于游戏研发、测试、运营等人员,为众多游戏从业人员量身打造了一个开放、专业的游戏舆情监测平台,助力成就更多精品游戏。