基于适应性分段估计的数据流上在线相似性搜索

来源 :2008中国计算机大会 | 被引量 : 0次 | 上传用户:fangdong520
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
相似性搜索在股票交易行情,网络安全,传感器网络等众多领域应用广泛。由于这些领域中产生的数据具有无限的、连续的、快速的、实时的特性,所以,需要适合数据流上的在线相似性搜索算法。本文首先,在具有或不具有全局约束条件下,分别提出了没有索引结构的DTW下限函数LB_seg_WFglobal和LB_seg_WF,它们是一种分段DTW技术,能够处理数据流上的非等长序列问在线相似性匹配问题。然后,为了进一步提高LB_seg_WFglobal和LB_seg_WF的近似程度,提出了一系列的改进方法。最后,针对流上使用LB_seg_WFglobal或LB_seg_WF,可能会出现连续失效的情况,分别提出了DTW的下限函数LB_WFglobal(具有全局约束条件)和上限函数UB_WF、下限函数LB_WF(不具有全局约束条件),通过增量方式,快速估计DTW,大大减少估计DTW的冗余计算量。通过理论分析和统计试验,验证了本文方法的有效性。
其他文献
小学语文阅读教学作为小学语文教学的重要环节,对拓展学生视野,提升学生的语文能力及综合素养的发展有着重要的意义,同时对语文教学质量也有着十分重要的影响.因此,小学语文
如今我国对小学教育非常重视,且引进先进教学理念及方法,以期提高教学质量.数学课程作为小学教育重要课程,注重培养学生的数字认识、运算能力、逻辑能力等,为将来学习和生活
k匿名是在数据发布环境下实现隐私保护的一种重要技术。在对一个数据表进行k匿名化时,如何使被隐匿单元的数量最少已经被证明为NP-Hard问题,因此大都采用近似算法来实现匿名
随着用户和应用需求的不断增长,存储系统在规模、体系结构等方面都出现了新的变化,系统正朝着大规模、复杂化的方向飞速发展,随之而来的是为了满足各种存储需求而引起的管理
会议
传统文化博大精深、璀璨辉煌,是我国劳动人民智慧的结晶.在初中语文教学中渗透传统文化教育,将能增强学生对中华优秀传统文化的认知与理解,提高学生的品德修养、人文素质,培
我国传统英语的教学模式一直以教师讲解、句型翻译等方法为主,大多数的初中英语教师都习惯了这种传统的教学方式,并且积累了很多与此相关的应试经验,但这种传统老套的教学模
随着数据库应用及搜索引擎的发展,业务需要使用的数据量也飞速增长。为了提高系统的可靠性,一般采用数据复制的方法。数据复制可以通过主机,存储系统和光纤交换机来执行。基
会议
本文一是提出了广义词汇共现模型(General Term Co-occurrence Model,GTM),该模型统一了传统的词汇共现模型密切关注的两个方面,可以将分别注重于两个方面的诸多传统词汇共现
本文主要针对小学课堂上的40分钟,任课教师如何合理安排、统筹兼顾、科学施教.使其老师能轻松教课,学生可以快乐学习,不断提高学生的学习积极性和教师的教学质量.希望对同行
在今年深圳市两会期间,房价涨幅成为见报率特高的一个关键词。面对媒体质询,深圳市市长许宗衡表示:“自2004年下半年以来深圳的房价确实出现了一定程度的上涨,作为市长,我对此