基于迁移学习理论的Markov检索模型

来源 :江西师范大学 | 被引量 : 0次 | 上传用户:hfxwh6
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在传统的信息检索中,检索模型是在静态数据集上训练得到的,模型一经训练,结构和参数都相对固定下来,没有根据新的数据自动修正的机制。但现实中,Web上的信息是实时更新的,经过一段时间训练好的模型往往会因为随后新数据的加入而使得检索性能明显下降。为了解决这个问题,传统的模型必须对新的数据重新进行学习,但在新的数据上重新训练一个模型需要耗费大量的时间,而且在旧数据上训练了很久的模型也因得不到利用而被浪费,因此,如何避免重新训练且很好地利用旧数据在新的数据上进行检索成为一个关键的迁移学习问题。在本文中,我们在传统的基于Markov网络的信息检索模型基础上提出一个基于迁移学习理论的Markov检索模型(简称TLMR模型)。它利用Markov网络在旧数据上建立信息检索模型,由于Markov网络能够表示学习更新机制,可应用新数据集来更新已有的Markov网络,也即将已有的知识迁移到新的检索模型中。在这篇文章中,我们通过计算新、旧数据中词关系的Markov网络之间的KL距离来度量新、旧数据之间的关联程度,利用它来估计迁移量参数。而且,在现实中Web上的信息并非只更新一次就不再变化,在旧数据上迁移一次得来的新模型,将其再次迁移到再次更新的数据上检索性能是否仍然会好,这是值得探索的。在本工作中,我们将TLMR模型在多个数据集上进行多步迁移,以此来探讨其适应动态数据的能力。在TREC数据集上的单步与多步迁移实验表明模型能很好地在多个数据集间迁移,多步迁移实验也表明模型的学习能力与学习顺序无关。本文的工作和创新点在于:1.在目前将迁移学习理论研究只应用于分类的情况下,将迁移学习理论用于信息检索领域,将知识的迁移和有指导的迁移学习等思想成功应用在基于Markov网络的信息检索模型中,利用在新旧数据上构造的Markov网络来进行知识的迁移。2.在迁移学习的基础上提出将TLMR模型在多个数据集上进行多步迁移,从而观察在以Markov网络表达数据信息的前提下,旧知识在经过多步迁移后是否仍对新的检索任务有所帮助,以此来探讨TLMR模型对动态数据的适应能力。3.通过在TREC数据集上的单步和多步实验证明了TLMR模型能在多个数据集上进行很好地迁移,多步迁移结果也证明模型的学习能力与学习顺序无关,符合人类的认知规律。
其他文献
一直以来自然灾害都是人类所要面对的巨大挑战,比如近些年来地震灾害在我国造成的不可估量的损失。国家大力提倡防震减灾、加强自然灾害预防性公共事务建设、提高公众的防灾
数据是企业的生命线,对于高度依赖信息的企业,各种灾难都有可能导致企业信息系统的瘫痪。如何尽量降低灾难给企业带来的负面影响并保证业务的连续性运营是需要高度重视的问题
随着互联网技术和多媒体技术的高速发展,数字信息的传输变得越来越方便。与此同时,由于数字信息很容易取得并传播,使得网络上充斥着未授权而被篡改或复制的信息。因此,为了遏
随着全社会的信息化进程的不断加速,当代学校教育也不能不受到这种“信息爆炸”的影响,教学资源再也不像先前那样单调和受制于教师个体知识视野的局限,呈现出海量增长和形态
随着信息处理技术的飞速发展,命名实体识别技术越来越多的受到人们的关注。本文所研究的时间表达式识别,就是命名实体识别领域一项基础而重要的任务。时间表达式在自然语言处
随着网络的快速发展和计算机的普及,国家各级政府加快了对电子政务的建设步伐。网上审批作为电子政务的一部分,是政府对外办公的一个重要窗口。按照方便公众的原则实现政府各
作为软件复用的一种有效手段,软件构件技术成功地将系统开发的重点从程序设计转移到对已有构件的选取、组装和部署。在构件模型的支持下,通过复用已有的构件,软件开发者可以
我国是地震多发国家。地震活动频度高、强度大、分布范围广、震源浅,地震灾害十分严重。由于引发地震的因素很多且各种因素之间具有极不确定的非线性关系。本文通过时间震级
在组合优化问题中,车辆路径问题(Vehicle Routing Problem)属于比较典型的NP-Hard问题。一般情况下组合问题可以模式化为排序问题与分类问题,然而VRP则同时具备排序与分类这两
在这个信息爆炸的时代,信息检索系统的出现无疑给人们在因特网上寻找自己感兴趣的内容提供了莫大的帮助。对于系统返回的大量文档来说,用户们最关注的就是这些文档的顺序。一个