基于中文微博的话题趋势预测系统的设计与实现

来源 :北京邮电大学 | 被引量 : 2次 | 上传用户:ty_142857
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近些年来社交网络得到了快速的发展,其独有的特性使得用户发布消息更加容易,信息传播更加快捷,然而社交网络的发展也对于商业机构的管理者和政府机构的决策者,提出了一定的挑战。这些机构的管理者和决策者需要随时并且快速的应对社交网络上面的热点话题及相关事件,因为这些事件有时会对相关机构产生非常现实且巨大的风险。本论文将以新浪微博为实际的例子探索如何在社交网络中对于话题趋势做出预测。在本文中,首先给出了社交网络中热点话题趋势预测的形式化定义和一个话题趋势预测模型,然后提出了一种针对时间序列数据进行特征抽取和构造的新方法,基于提出的新方法构造了三个相互补充的特征子集,最后将这三个特征子集线性组合起来做为支持向量机SVM的输入向量进行话题趋势的预测。为了验证预测模型的性能,本论文采集了一个高质量的新浪微博数据集。基于获取到的数据,对预测模型进行了完整的测试,取得了良好的效果。论文首先介绍了近些年来社交网络的发展及社交网络的相关研究领域;在第二章中论文提出了基于SVM的话题趋势预测模型,并且详细的给出了特征向量的构造方式;在第三章论文给出了爬虫框架的详细设计与实现,然后描述了话题趋势预测系统内部各个子系统的详细设计与实现;论文在第四章对于整个系统进行了详细的功能测试和性能测试,测试表明整个系统达到了预期的设计目标;在最后一章,论文对未来的工作进行了展望,并总结了作者在研究生期间的所有工作和成果。
其他文献
该文通过中国某航空公司(以下简称某航)OFA(OracleFinancialanalyzer)财务分析系统(以下简称OFA系统)中般线经营成果分析系统(以下简称RP(ROUTINGPROFIT)系统)的工程实现与系
该文首先介绍了工作流技术产生的背景.该文的重点工作是上述应用模型及西安交通大学校园网办公自动化系统(XJTU-OAS)的分析与设计,采用群件工作流平台Lotus Notes及应用服务
该文在系统地调研、解剖已有的油田开发指标预测方法的基础上,结合油田地质开发特点,深入地阐述了油田开发指标预测的特征,主要对产量递减方程、水驱特征曲线方法、物质平衡
网络拓扑发现一直是近年来的研究热点,基于这个基础,可以进行推断或计算网络性能指标、评价网络行为等进一步的工作。尤其是在网络安全领域,拓扑发现已经成为网络安全评估系
该论文详细地描述了应用程序互操作框架,并解决下面的几个问题:(1)框架的体系结构和组成;(2)互操作的数据交换格式标准;(3)元数据标准间语义和语法不匹配问题;AIF主要由三大
迁移机制提供了agent在网络上迁移和执行的基本支撑,是移动agent技术的基础核心技术.该文的基本思路为:在Internet环境下研究agent迁移的内在机理,剖析其基本内容,提出了一中
针对在关系数据库中持久化对象的需求,该文设计并实现了一个独立的对象持久层,完成对象-关系映射.在对象持久层的支持下,上层模块可以按照面向对象模型对数据建模,对象数据的
该文主要论述了基于向量空间模型和用户档案模型的个性化搜索引擎的设计和开发.文中首先介绍了目前流行的中、英文搜索引擎的发展现状以及分类、评价;而后着重讨论了搜索引擎
该文通过对数据挖掘技术、神经网络技术及数据降维分析技术的深入研究,把这些技术应用到股票市场的分析和预测上,取得了以下阶段性的成果:把关联规则挖掘技术应用到股票连动
该文给出了广东省移动客户服务中心的设计,包括系统的总体设计、实现方法,并研究用多线程设计系统的外部接口模块.该文第一章给出了项目的背景和意义;第二章客户服务中心概述