论文部分内容阅读
随着互联网的快速发展,人们在生活中需要传播和存储的信息越来越多,信息的形式和特性也越来越多样化,人们接受信息的渠道也越来越广泛,传统的图书馆模式已无法满足互联网信息时代人们的需求。数字图书馆是传统图书馆在互联网信息时代的发展和延续,能存储海量的数字资源,维护成本低且不易损坏,信息检索方便,用户可以方便地通过互联网来访问数字图书馆的电子资源。众包技术也是互联网技术带来的新的生产组织形式。众包利用网络将计算机较难处理的工作分解并分配给众包工人去完成,并给予众包工人适当的奖励,将人们的空闲生产力利用起来,从而提升解决问题的效率,节约成本。本文的研究涉及到数字图书馆与众包技术,其主要工作如下:第一、提出了数字图书馆应用场景下基于用户行为分析的自适应众包方法。首先,该方法通过分析用户行为,预测最有兴趣成为众包工人的注册用户,减少随机选择工人的盲目性;其次,利用Multi-armed Bandit模型自适应地选择众包工人,以高质量快速地完成众包任务。第二、实现了基于用户行为分析的CADAL数字图书馆自适应众包系统,该系统包括潜在众包工人预测、邮件邀请、反馈收集、基于Multi-armed Bandit的众包工人选择等功能模块。在该系统之上,我们实验对比了多种众包工人选择方法,并分析了实验结果。总的来说,本文所要研究的是在数字图书馆的背景下应用众包技术的方法,提出了基于用户行为分析,结合Multi-armed Bandit模型与个性化推荐技术来创造性的提升众包性能的方法,从而实现自适应的众包模型。另外,在CADAL平台上实现了自适应众包系统。本文的研究可以较好的帮助解决CADAL数字图书馆上修订民国期刊元数据信息的问题。