微博平台的热门话题检测

来源 :浙江大学 | 被引量 : 0次 | 上传用户:jinyu1016
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文针对在微博平台检测热门话题这个问题进行了算法研究。借鉴最邻近结点算法的思路,我们提出针对时变数据的潜在信号源模型分类模型,用训练样例作为潜在信号源的代理,通过训练样例来直接进行在线分类。在一定程度上解决了高频词的话题与非话题的分类问题。在采样率仅为1%的条件下,实验结果显示我们的方法能够比Twitter官方更早检测出热门话题,平均早20min。而且维持一个低的错误率:真阳性率约为80%,假阳性率约为20%。且通过分析算法参数的影响,证明该算法具有较强的灵活性。
其他文献
双目立体视觉三维重构技术模仿人类的视觉系统,是通过两个摄像机在不同位置同时拍摄同一场景的二维图像来获取该场景的三维信息。它的研究热点主要有两个:摄像机标定和立体匹
随着Internet的高速发展,Web已经形成一个规模庞大种类繁多的信息资源库。实体抽取是从Web海量数据中快速准确地提取有效信息,目前成为国内外信息处理、问答系统和实体检索研究
链状线型无线传感器网络是一种特殊类型的无线传感器网络,广泛应用于高速公路,河流,火车铁轨,输变电线等领域的监测,主要特点是,数据传输距离远且路径单一,网络中一般会有多
随着有线电视网络规模不断扩大,各种网络设备和接入技术广泛地应用于有线电视网络的建设中,这使得人们对网络设备全方位监控的要求越来越高。早期的许多有线电视设备都只支持
随着电力企业生产设备的日益复杂和精细,硬件可靠性技术的不断提高,直接由机械故障导致的事故比例已经下降到很低,人的因素对电力企业的安全生产过程的影响越来越严重。而人的失
容迟网络作为一种新型无线移动网络,其特点是节点移动造成缺乏持久的端到端连接、动态变化的网络拓扑结构、有限的存储空间等。为了解决链路缺失等问题,实现容迟网络中不同网络
在突发事件下,把供应链库存系统看作一个整体,从系统内部结构着手,采用动态系统的方法,建立系统的模型,研究其动态的特性,掌握其运行的规则,并提出解决供应链库存系统管理问题的应急对策,逐渐成为学术界关注的问题之一。由于在供应链突发事件研究领域中还有许多方面需要进一步研究,有必要从不同的角度出发,研究不同的突发事件对供应链造成的影响,从而能够使有关供应链突发事件的研究得到完善,更好的为社会实践服务。突发
在趋于开放和多变的Internet环境下,面对Internet上越来越丰富的数据资源、计算资源以及应用资源,通过整合甚至重组已有的资源实现资源升值成为一个新的研究思路。面向服务的
基于3G网络的车载无线视频监控系统,与传统的模拟监控、有线监控相比,具有移动性、无需线路铺设等显著特点。车辆监控终端通过把摄像头采集到的图像,经过视频压缩编码,将实时
随着计算机科学技术的发展,图形图像处理和虚拟现实技术得到了广泛的应用。同时,在现代化军事战争中,战争场景往往是复杂多变,对于军事场景的准确绘制能够使部队有效的掌握战