数字图书馆资源聚合与服务推荐研究

来源 :吉林大学 | 被引量 : 0次 | 上传用户:qq1186827110
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
大数据环境下,以数字化存储与呈现、网络化检索与获取为特征的数字图书馆,成为集用户获取知识、传播知识、交流等多功能为一体的知识集散中心。各种数字对象(知识作为一种对象,可以表现为各种文献、事实/科研数据、数据库、知识库和知识体系)构成了可充分集成关联的数字图书馆领域的大数据环境,数字图书馆资源规模化增长是不可逆转的客观事实。随着数字图书馆资源的迅猛增加,以及智能技术的普及,推荐服务的智能化和个性化已经成为服务推荐发展的趋势。然而传统的个性化服务已经无法满足用户需求以及数字图书馆的发展。一方面,用户需求越来越复杂,如何准确描述和充分挖掘用户的个性化复杂需求,根据用户需求向其进行资源服务推荐成为难题;另一方面,数字图书馆资源数量巨大,如何有效对海量资源聚合并支持高效检索和推荐,充分挖掘数字图书馆资源内在的语义联系成为关注重点。数字图书馆资源"聚合"旨在发现资源之间及其内在的语义关联,通过系统汇聚、挖掘利用、有效整合多源异构的数字图书馆资源,构建一个内容相互关联、多维度、多层次的资源体系,形成集概念主题、学科内容和科研对象为一体的立体化知识网络;服务推荐作为一种有效的智能化信息过滤技术,能够结合数字图书馆资源的内容特征,通过对用户的兴趣偏好和资源访问行为进行自动分析与挖掘,主动向用户推荐满足其需求的数字图书馆资源。可见,基于数字图书馆资源聚合实现服务推荐已成为满足用户精准化需求的重要途径。本文以领域本体、数据挖掘、复杂网络理论及分析方法等技术和方法为基础,借鉴相应聚合及个性化推荐的成果,提出了面向用户复杂需求的资源聚合方法与服务推荐技术,为数字图书馆资源服务推荐提供相应参考。主要研究内容如下:(1)界定了数字图书馆资源聚合及服务推荐概念,分析了数字图书馆资源聚合同服务推荐之间的关系。数字图书馆资源聚合是服务推荐的基础,服务推荐是数字图书馆资源聚合的目标。服务推荐又从用户需求方面引导聚合的质量,更进一步揭示了学科领域的知识结构与发展规律,从而能够在提高数字图书馆资源聚合能力和效率基础上满足用户个性化需求、提升服务推荐效果。(2)阐述了数字图书馆资源语义化概念,分析了数字图书馆资源语义化、语义关系以及数字图书馆资源的文本语义距离。语义概念和语义关系构成了数字图书馆资源聚合的基础,将领域本体看做由节点(语义概念)和弧线链(语义关系)组成的带有标记的有向网络。基于复杂网络理论对其进行分析,深度揭示概念之间的网络关系,进而挖掘、建立、利用资源之间的联系,将繁杂、无序的内容通过聚合以呈现关联性。(3)对数字图书馆资源聚合的特征、维度等问题进行系统研究,综合运用复杂网络理论及其指标、语义相似度计算等理论方法和工具,构建了数字图书馆资源聚合模型。总结了数字图书馆资源聚合的特征:数字图书馆资源聚合对象的多元化、数字图书馆资源聚合方法的多样化、数字图书馆资源聚合维度的立体化以及数字图书馆资源聚合过程的动态化。在此基础上,提出了数字图书馆资源聚合模型。该模型框架包括数据资源层、资源语义化层、资源聚合层、应用层四个层次,即从数字图书馆资源甄选及资源语义化(微观)到资源的系统汇聚(中观)再到资源的深度挖掘与利用(宏观)。(4)分析了基于维基百科构建的领域本体的网络结构,结合复杂网络指标中的度、集聚系数等指标测度提出了重要节点识别方法,以此作为聚合的基础。依据D-S证据理论,在识别框架(high,low)下构建基本概率分配函数,表示节点重要性程度,通过D-S证据理论合成公式进行合并,以概率的形式对节点重要性进行量化,并得到节点重要性的评价指标。对构建的领域本体进行分析,发掘网络的重要节点,能够为充分挖掘本体的语义信息、发现本体中的隐含知识、对特定领域的相关知识结构进行分析和呈现、解决领域知识共享等问题提供方法和参考。(5)通过改进基于本体的语义相似度计算方法以及基于《同义词词林扩展版》的语义相似度计算方法,提出了改进的谱聚类算法。在资源聚合中应用文本聚类分析的方法,从资源内部以及外部特征出发,利用资源聚合原理使资源呈现出集簇状,进而根据资源呈现出的层次簇状结构为之选择一种或多种合适的表示结构,从而深入地挖掘出隐含在资源之间的语义关系。(6)提出了 3种服务推荐方法:基于本体规则推理和语义相似度计算的服务推荐方法、基于关联语义链的服务推荐方法、基于谱聚类的服务推荐方法。通过对数字图书馆资源有效聚合,将资源语义化并进行语义关联,在此基础上,挖掘用户需求信息,根据用户偏好对其进行推荐。实验结果表明:在对数字图书馆资源聚合的基础上利用服务推荐方法对用户进行推荐,可以提高推荐准确性,使得推荐结果更加符合用户对于数字图书馆资源的偏好。利用本体、数据挖掘以及服务推荐等方法,对数字图书馆资源聚合以及服务推荐进行研究,为资源聚合与服务推荐的深入研究搭建了一个新的框架,从而为优化其资源再组织结构和提升知识服务能力提供有价值的参考与指导。(7)将知网文献资源作为数据源,验证了本文第4章和第5章所提出的聚合和推荐方法,从技术实现的角度采用JAVA语言和MYSQL数据库开发设计了数字图书馆资源服务推荐应用平台。该系统采用C/S系统架构,集成了本文所提出的聚合方法和推荐方法,实现了数字图书馆资源聚合及服务推荐功能。以聚合为基础为用户进行服务推荐的方法解决了传统推荐方法对用户需求挖掘不充分、冷启动以及数据稀疏等问题,实现了推荐结果与用户个性化需求的高度匹配,并提高了推荐精度,进一步扩展了数字图书馆未来开展知识服务的新视野。
其他文献
超精密气浮工件台系统是当前主流光刻机中的核心子系统,要求具有纳米级的重复定位精度和同步运动精度。这种系统所采用的气浮轴承如果设计不当,会导致系统发生微幅振动,从而
绿色节能是开关电源、功率变换器的一大发展趋势,如何设计出高效的电源系统,也是电源设计关注重点之一。以3相UPS系统为例,从功率拓扑、半导体器件、磁性元件及辅助电源中的
以网络的出现为代表的信息产业的兴起和迅猛发展正给我们这个社会带来新的革命。网络作为先进的技术手段和理念已深入到社会生产生活的各个方面 ,尤其对教育带来了深刻的革命
目的:探讨超短波疗法联合冰敷在肩周炎患者中的临床效果。方法肩周炎患者60例,随机分为观察组和对照组,各30例。对照组患者给予冰敷治疗,观察组患者给予超短波疗法和冰敷联合治疗
高等职业教育是一个交叉概念,它既是高等教育的组成部分,又是职业教育的组成部分.文章通过对高等职业教育和普通高等教育的比较,提出确立适应时代发展需要的教育理念、明确教
全国英语等级考试(PETS)是教育部组织的,旨在大力推进外语教学、考试改革的一项有力措施.2003年,要在全国大力推广.此文就PETS的产生背景及其理念,学习PETS所能得到的独特的