【摘 要】
:
本文研究了异构数据流下对基于地理位置的时间线进行提取的问题。针对该问题,本文提出了一个异构文本数据流下基于地理位置的时间线处理框架,并对其中的技术点进行了深入的研
论文部分内容阅读
本文研究了异构数据流下对基于地理位置的时间线进行提取的问题。针对该问题,本文提出了一个异构文本数据流下基于地理位置的时间线处理框架,并对其中的技术点进行了深入的研究。该框架主要包括两项技术:基于地理位置的流聚类技术和时间线生成技术。基于地理位置的流聚类技术主要处理异构数据流。对于流中的每个文档,本文首先提出了一项文本定位技术,使得文档的地理位置能够精确到POI级别;接着建立了一个同时考虑地理位置和时间特征的页面模型进行基于地理位置的聚类,得到了带地理标签的类;最后,提出了一个基于异构数据流和地理位置的热门话题提取技术,得到带有地理标记的热门话题组成的流。时间线生成技术基于前者产生的结果,通过建立一个热度敏感的网页排序模型支持范围/连续时间线的生成。与此同时,为了提高时间线的计算效率和查询复用效率,本文提出了一项Top-K文档分割选择算法,极大地减小了时间代价。本文搜集了大量的真实数据集,并进行实验充分验证了提出方法的有效性和高效性。
其他文献
随着生命科学的发展,人类越来越关注于对自身的认识。计算机技术的发展使得研究人员可以通过建立生物体各级生理对象的数学模型的方式来研究其生理学过程,大大推动了人类对生
在传统的基于内容图像检索的方法中,由于图像的领域较宽,图像的低级视觉特征和高级概念之间存在较大的语义间隔,检索的效果不很理想。文章研究了图像增强技术在贝叶斯框架下
分布式数据库系统(Distributed Data Base System,DDBS)的研究开始于20世纪70年代。由于数据库应用需求的扩展和计算机硬件环境的改变,特别是计算机网络与数字通信技术的飞速
入侵检测作为一种主动的安全防御手段,通过对网络上的数据流进行实时分析,发现潜在的入侵威胁,最大限度地提高网络的安全保障能力。本文首先分析了当前网络安全现状及其对策
鉴于基于内容图像检索(Content-Based Image Retrieval,CBIR)技术的高效性,人们开始研究它与Web的结合,以提高互联网图像检索效率。Web与CBIR技术的结合,已逐渐成为基于内容
作为最自然的人机交互方式之一,手势识别一直是近年来人机交互与计算机视觉领域的热点研究领域之一,大量的研究致力于利用现有的视觉设备得到实时稳定,鲁棒性高的跟踪与识别
一词多义现象给计算机对自然语言的处理带来了许多困难,有不少自然语言理解领域的问题归根到底是解决词语歧义的问题。从人们最初注意到歧义的影响至今已经过去了60多个年头,
纸币识别器是自助售卖领域的核心设备之一,目前已广泛应用于各种金融交易场合。但随着嵌入式技术的发展,8位或16位单片机裸机已经越来越不能满足应用的需要。而基于金融货币
RNA(脱氧核糖核酸)是生物系统内最为重要的分子之一,它在生物体内行使多种功能。预测RNA二级结构具有重要意义,知道了RNA的二级结构就可以获得许多有益的信息,不仅能使我们更
随着计算机和网络技术的飞速发展,计算机安全问题日益突出。入侵检测是计算机安全体系结构中的一个重要的组成部分。目前入侵检测系统的研究已经有了长足的进步,开发出了许多