数字图书馆个性化排序子系统原型的设计与实现

来源 :北京大学 | 被引量 : 0次 | 上传用户:wosxty
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机技术的发展与数字图书馆资源建设的深入,数字图书馆中数字资源的总量日益增多。在集成多种类型资源的统一检索平台上,如何根据用户特点对检索结果进行有效和个性化的(重)排序(re-rank[Qu et al.]),使得用户所期望的检索结果能尽可能排在最前面成为一个亟待解决的问题。数字图书馆中现有的检索系统只能提供几种固定的排序模式,在检索结果排序算法上很少考虑到用户个性化需求的多样性和资源类型的多样性,在检索结果展现方式上缺乏对记录之间深层次关系进行揭示的有效手段,因而很难为用户提供检索结果的个性化排序。 本文以国家“211”的“十五”项目“中国高等教育数字图书馆(CADLIS)”中的子项目“CALIS统一检索系统”为应用背景,重点研究和设计对多种资源的检索结果进行个性化排序的算法,并以此为基础,设计出一个满足数字图书馆环境中用户个性化排序需求的原型子系统。该子系统基于对数字图书馆中各实体的之间关系的融合与分析,实现了个性化排序策略以及该策略的注册与调度模块两个部分。 个性化的排序策略包括:个性化信息服务领域中基于多种关系的用户模型及其表示方式,基于多种关系的用户个性化排序算法,提出了用户个性化综合评分的概念、计算方法以及基于用户个性化综合评分的文档集的概念及其生成与排序算法。 在该策略的注册与调度模块的设计与实现方面,在接口设计上提出了一套通用的接口方案,该方案以SRU[LOC sRu]规范为基础,设计了符合通用检索需求的请求与响应参数格式。该接口不仅能与统一检索系统无缝集成,还能用于与其它检索系统的集成。 在实验方面,本文利用统一检索系统所提供的数字资源对排序子系统相关参数值的选取策略进行了实验。结果表明在采用本文所设计的个性化排序策略后,对于大多数用户而言,该子系统的20-Precision指标比未采用该策略时提高了7%-10%. 数字图书馆个性化排序子系统原型的设计与实现本文还提出了一种加速算法收敛的方法,通过实验证明,该方法能显著改善个性化排序算法的计算效率。
其他文献
本文研究了利用音位配列学信息的语种识别技术,并引入基于向量空间模型的文本分类技术进行语种识别。在利用音位配列学信息进行语种识别的方法中,采用并行音子识别并建立语言模
随着计算机网络技术的不断发展,特别是Internet的迅速普及,全球信息网络化己成为人类社会发展的大趋势。网络安全的重要性日益凸显,已成为各个安全组织、机构的研究热点,而网络攻
苯并[a]芘是由5个苯环组成的一种多环芳烃(PAH)化合物,是一切碳物质热分解的产物。由于性质稳定,来源广泛,致癌性极强,BaP被世界卫生组织国际癌症研究中心指定为一级致癌物质。
由于用户对高传输速率、高服务质量业务的强烈需求,无线频谱成为越来越稀缺的资源。认知无线电技术通过限制认知用户对主用户的干扰,智能地接入授权频段,实现频谱资源的二次利用
羊毛直径和曲率是羊毛纤维检验和分类中最为重要的测试指标,也是绵羊育种中最为重要的经济性状指标。羊毛纤维的纹理特征反映了不同等级羊毛的宏观纹理特性,实验证明纹理特征在
学位
从20世纪七十年代单片机的出现到今天各式各样的嵌入式微处理器,嵌入式系统已经有了近30年的发展历史。做为专门应用于嵌入式系统的嵌入式操作系统往往采用微内核结构,具有实时
本文对网络约束下基于RFID的移动对象不确定性建模与查询处理进行了研究。主要内容如下: 1) 针对网络节点处RFID定点探测的数据采集方式,提出了一个不确定性模型来描述移动
随着智能设备的增加以及多媒体通信业务的蓬勃发展,无线服务需求呈爆炸式增长,这造成了网络对无线频谱的大量需求,给LTE系统带来了极大的技术挑战。Device-to-Device(D2D)通
空间声源定位和增强是当前通信和信号处理研究的热点之一,在智能机器人和视频会议等多个领域有着广泛的应用。本文试图利用声源的空间信息,对目标声源进行增强,涉及到:空间的声源
新型调制格式密集波分复用(DWDM)光传输技术是当前光通信研究的热点。差分相移键控(DPSK)信号相比于常用的非归零码(NRZ)信号可以改善接收灵敏度、延长无中继传输距离以及提