Web挖掘在高职数字图书馆个性化服务系统中的应用

来源 :广西教育·C版 | 被引量 : 0次 | 上传用户:sheygy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  【摘 要】在分析Web挖掘技术的内容与类型的基础上,探讨利用Web挖掘技术分析用户的需求信息,发现用户的兴趣模式,并将其应用于数字图书馆中,构建个性化服务模型,不仅实现了图书馆资源的优化,还能为用户带来全新的数字图书馆服务体验。
  【关键词】Web挖掘 数字图书馆 个性化服务 高职院校
  【中图分类号】 G 【文献标识码】 A
  【文章编号】0450-9889(2015)03C-0092-03
  随着计算机网络技术、多媒体技术等高新技术的出现和快速发展,转变了信息存取方式,图书馆向数字化演变已经成为大势所趋。高职院校图书馆作为学生了解国内外科研信息、查阅资料等获取知识的重要场所,建设数字化图书馆也是高职院校图书馆要进行的一项重要革新工作。
  数字图书馆是将现代网络、通讯和计算机等技术应用于信息的收集、整理、组织和传递的新的模式和理念,本质是利用各种信息技术为用户提供更加便利的服务,提高信息的广度和深度,提升图书资源的使用效率,提高服务质量。正是基于这样的理念,数字图书馆的个性化服务才应运而生,数字图书馆的个性化服务是根据用户的个性化的需求,搜集、分析、加工和重组信息,从而提供相应的信息服务,让用户获得所需的信息内容,关键在于对人的需求与信息处理能力的有机结合,通过挖掘用户的需求、兴趣和偏好,建立用户需求模型,再利用信息技术整合加工信息,为用户提供与之需求相匹配的信息资源,并且引导用户检索利用信息。本文将探讨利用Web挖掘技术分析用户的需求信息,发现用户的兴趣模式,并将其应用于数字图书馆中,为高职院校学生用户提供全新的服务体验。
  一、Web挖掘技术
  Web挖掘技术是数据挖掘技术在Web环境下的应用,是从大量Web文档集合中提取潜在有用的信息和知识的过程。基本原理在于根据用户的需求提取数据,通过预处理精简数据,去除不相关的冗余数据,接着选择合适的数据挖掘方法分析数据,形成一种易于理解的数据模式呈现给用户,主要有以下三种数据类型。
  (一)Web内容挖掘
  Web内容挖掘是对Web页面的本信息、图像、多媒体信息等文本内容进行特征提取,采用的技术方法主要是对页面文本的分类和聚类,以从文档内容中抽取出知识,算法的思想如下:
  通过上述方法能够将Web页面内容表示成一个个矢量,然后通过计算矢量之间的距离进行文本的分类和聚类。
  (二)Web结构挖掘
  Web结构挖掘是从利用WWW之间的组织结构和联接关系,对Web页面进行分类,从中推导知识。超文本链接丰富了Web页面上的信息,使得Web页面能够提供除文本内容以外的有用信息,通过利用这些信息,运用挖掘方法从而对页面进行排序,发现重要的页面。
  一个重要的页面通常被认为被引的次数较高或者被重要的页面引用。设是一个Web页面,被引用的页面集合为,引用的页面集合为,则 表示页面的重要性,表达式为,其中为引用的页面,表示引用的页面的总数。因此,针对一个查询条件,首先将利用相似度函数查找个页面;其次,计算个页面的重要程度进行排名,计算公式为:,其中,,,表示相似函数。
  (三)Web日志挖掘
  Web日志挖掘是通过挖掘Web访问记录,如IP地址、访问时间、访问日期、请求的URL以及用户浏览器等,了解用户的行为模式,发现用户感兴趣的模式。在数字图书馆中,主要采用的技术有路径分析和关联规则分析,路径分析是通过分析用户最经常访问的路径,从而调整站点之间的结构;关联规则是分析用户访问的Web页面之间的关联关系,找到隐含的信息。
  二、基于Web挖掘技术的数字图书馆个性化服务模型
  (一)Web挖掘技术在高职院校数字图书馆个性化服务中的应用
  数字图书馆个性化服务是根据不同用户所提出的需求,利用网络技术、人工智能技术等,自动检索、收集网络信息和图书馆数字信息,并结合用户的行为、习惯以及浏览历史等信息,对信息进行整合,然后将这些信息推送给用户的一种综合性服务。Web挖掘技术作为一项综合技术,能够获取、分析用户行为,能为数字图书馆提供重要的信息基础。
  1.发现学生用户兴趣,建立个性化的访问空间
  一般而言,学生用户在浏览数字图书馆的过程中,会对感兴趣的Web页面浏览时间较长,浏览的次数较多,而对不感兴趣的Web页面浏览时间较短,次数也较少,基于此,我们可以通过用户浏览历史的时间和次数,发现学生用户的兴趣,为其建立个性化的访问空间,有利于用户浏览阅读。
  2.实现数字图书馆网站链接结构的优化
  通过关联规则分析用户的Web访问记录,发现不同页面之间的相关性,对于增强相关系较高的页面之间的联系,方便用户使用。例如学生用户在查找文献的过程中,除了会关注该文献的参考文献以外,也会去关注内容上较为接近的文献,以及同行关注的文献,甚至是同一个导师指导下的文献,因此,可以将学生用户可能关注的页面信息建立导航链接,实现Web站点的优化。
  3.挖掘用户特征,发现用户重点关注领域,提高信息检索的个性化
  高职院校师生在使用数字图书馆的过程中,一般是由于某种学术目的或是偏好而进行信息检索,因此,通过对用户检索信息的挖掘,能够发现用户所关注的领域,如物流供应链、教育心理学、图书情报学等,从而进一步为用户提供服务。当用户输入相关的检索关键字之后,将用户重点关注领域的内容优先排在前面,便于顾客快速找到所需的信息,提高信息检索的个性化。
  4.根据用户特征,对用户进行分类,实现精准化服务
  不同年龄、学历、学科的用户在使用数字图书馆过程中会呈现不同的行为模式和兴趣模式,通过Web挖掘技术能找出各类的特征属性,将用户进行群体细分,从而实现精准化服务。例如,图书馆可以根据不同类别用户的兴趣点,推送讲座信息、讲坛信息、课程信息等,还可以将图书馆新到资料、最新一期的期刊目录通知用户,提高数字图书馆的服务质量。   5.挖掘用户借阅信息,提高图书资源的利用率
  对用户所借阅的文献、图书信息进行挖掘,可以发现受欢迎的书籍,并以此向用户推送最近时期的热门书籍和文献,也可根据图书的借阅情况,实行馆际调度,或者是重新购买热门书籍,便于用户借阅,优化图书馆资源,提高利用率。另一方面,对于将旧的、使用少的书籍归类,放置统一书库,减少冗余空间,节省开销。
  (二)数字图书馆个性化服务模型
  将Web挖掘技术应用于数字图书馆,通过内容挖掘、结构挖掘、日志挖掘,使用聚类分析、关联分析、路径分析等方法,实现用户的个性化服务。基于Web挖掘技术的个性化服务模型如图1所示,主要包括以下几个部分:
  1.用户接口
  用户接口用于连接用户与图书馆系统,用户通过该接口浏览图书馆网站,浏览所需的图书、期刊信息,同时用于接收系统的反馈信息,这个过程可以学习和记录用户的兴趣。
  2.Web挖掘
  根据挖掘要求,选择合适的挖掘方法执行挖掘任务,识别用户行为,实现具有针对性、主动的、符合其需求的特色服务。同时,挖掘方法具有可扩充性和易选择性,能够引入新的挖掘方法,提高挖掘的效率。
  3.信息推送与反馈
  通过Web挖掘,建立用户的个性化信息服务模型,并利用电子邮箱、手机短信等方式将信息推送给用户的个性化终端。用户也可以对推送的信息作出反馈,对信息推送方式、推送内容、推送安排等方面给予评价,以便调整和完善用户的数字图书馆个性化服务。
  三、实现案例
  目前,我国高校在进行图书馆数字化建设时,已将个性化服务的发展纳入进去。
  华中科技大学图书馆推出了Mylibrary系统,基于Web挖掘技术为广大师生提供服务,师生可以在该系统内根据自己的需要和爱好,选择与自己相关的模块,并对一个模块功能进行加工处理。
  厦门大学图书馆推出了“图·时光”服务,用来记录师生在图书馆的足迹,以故事的形式展现师生的入馆次数、借阅的数目等内容,受到了广大师生的热捧。
  国家科学技术文献中心也运用了Web挖掘技术,整合多家行业单位的数字资源,建立了动态用户兴趣特征模型,为国内各大研究中心提供资源服务,取得了不错的效果。
  国家专业图书馆也是基于Web技术,在网络平台上实现图书采购、编目、查询等自动化业务,用户可以随时随地查询各类图书、期刊信息。
  总之,将Web挖掘技术运用于数字图书馆,通过内容挖掘、结构挖掘、日志挖掘,使用聚类分析、关联分析、路径分析等方法,构建个性化服务模型,利用该模型可以建立个性化的用户访问空间、实现数字图书网站链接结构的优化、发现用户的重点关注领域、将用户群体细分实现精准化服务、提高高职院校图书资源的利用率等,从而为学生用户带来全新的数字图书馆服务体验。
  【参考文献】
  [1]赵金龙,胡小丽,王硕.利用 Web3D 技术建设数字图书馆平台的研究[J]. 数字图书馆,2011(1)
  [2]王玉珍. 基于Web挖掘的数字图书馆个性化服务体系研究[J]. 情报科学,2014(4)
  [3]王发社.高校数字图书馆个性化服务的 SWOT 分析及发展策略[J].图书馆理论与实践,2011(12)
  [4]吴志强,王义翠,马慧娟.协同信息推荐: 一种数字图书馆个性化信息服务新模式[J].图书馆,2011(1)
  【基金项目】广西高等学校科研项目(KY2015LX672)
  【作者简介】刘 巧(1975- ),广西柳州人,柳州城市职业学院讲师,硕士,研究方向:信息技术管理;李燮慧(1974- ),广西柳州人,柳州职业技术学院图书馆馆员,研究方向:图书馆管理。
  (责编 丁 梦)
其他文献
【摘 要】介绍柳州市龙潭公园的概况,分析生态学公选课分层实习设计的思路框架,并提出利用龙潭公园作为生态学公选课分层实习基地的具体方案。  【关键词】公园 生态学 实习基地 分层教学  【中图分类号】 G 【文献标识码】 A  【文章编号】0450-9889(2015)04C-0154-03  生态学野外实习是理论与实践相结合的必要环节。野外实习有利于提高学生综合素质,有利于培养学生发现问题、提出问
期刊
【摘 要】基于广西艺术学院的调查数据,分析艺术院校俱乐部制体育教学模式运用现状,剖析体育教学中存在的不足,提出俱乐部制体育教学模式的优化措施,以增强艺术院校学生参与体育课程的积极性,促进其身心的健康发展。  【关键词】艺术院校 俱乐部制 体育教学模式  【中图分类号】 G 【文献标识码】 A  【文章编号】0450-9889(2015)03C-0026-03  俱乐部制教学模式指的是遵循体育教学的
期刊
【摘 要】良好的学习习惯培养是高职教育教学质量的重要保障之一,需要从思想上高度重视;充分发挥党团组织的先锋模范作用;加强课堂纪律检查力度,建立通报制度;加大教育处理力度;对学业成绩低下、学习能力较差、学习自制能力较弱的学生给予更多的关心、支持和引导;加强家校联系,形成合力,从而在“成功、激励”教育理念下共同推进良好学习习惯养成教育。  【关键词】学习习惯 养成教育 培养方式  【中图分类号】 G
期刊
【摘 要】以柳州城市职业学院为例,从课程体系构建、课外实践活动体系设计、科学素养培育模式研究等方面阐述高职院校基于STS理念实施科学教育,培养全面发展的人才。  【关键词】高职院校 STS理念 科学教育 课程体系 实践活动  【中图分类号】 G 【文献标识码】 A  【文章编号】0450-9889(2015)03C-0045-03  随着全球范围内传统产业技术进步加快、国家转变经济发展方式的推进,
期刊
【摘 要】采用问卷调查和质的研究相结合的方法,以广西6所高校的212名东南亚留学生为研究对象,从学习环境、教学活动、师生关系、生生关系四个维度考察东南亚留学生的跨文化学习适应性,并提出提高东南亚留学生跨文化学习适应性的建议。  【关键词】东南亚留学生 跨文化 学习适应性 广西高校  【中图分类号】 G 【文献标识码】 A  【文章编号】0450-9889(2015)03C-0023-04  一、研
期刊
【摘 要】借助“6S汽车技术服务社”平台优势,以汽车维修服务前台接待岗位为例进行岗位职业能力分析,将该服务社日常承接的作业项目作为载体,依据各个作业项目应具备知识、技能和素质要求,对所涉及的4门课程关联和交叉的内容进行有效整合优化,开发4个可操作性强的综合性实训项目。  【关键词】多课程整合 实景相融 6S汽车技术服务社  【中图分类号】 G 【文献标识码】 A  【文章编号】0450-9889(
期刊
【摘 要】阐述中小企业创立与经营管理课程实践教学内容设计、实践教学方法设计以及实践教学效果评价设计。  【关键词】高职教育 中小企业创立与经营管理 实践教学  【中图分类号】 G 【文献标识码】 A  【文章编号】0450-9889(2015)03C-0068-02  中小企业创立与经营管理课程是我院市场营销专业开设的着眼于学生未来发展前景,顺应实施阶梯式人才培养教育模式要求的一门职业素质拓展课程
期刊
【摘 要】分析新课改对师专语文教育专业课程结构的要求,并反思目前语文教育专业课程结构存在的问题,对师专语文教育专业课程结构优化提出一些建设性的建议。  【关键词】语文教育 课程结构 问题 优化  【中图分类号】 G 【文献标识码】 A  【文章编号】0450-9889(2015)03C-0052-03  随着新课改发展与深入,教学中暴露出不少难以解决的新问题,而这些问题的根源主要是教师素质的问题。
期刊
【摘 要】儿童发展课程是学前教育专业的主干课程,在教师教育国家级精品资源共享课程建设中,可从课程目标、课程内容、课堂教学方法、考核评价方式、实践教学及课程资源等六个方面探索儿童发展课程建设。  【关键词】教师教育精品资源共享课程 儿童发展课程 课程建设  【中图分类号】 G 【文献标识码】 A  【文章编号】0450-9889(2015)03C-0050-03  儿童发展课程是学前教育专业的主干课
期刊
【摘 要】分析高校加强生态文明建设的重要性,以广西机电职业技术学院为例,对高校生态文明校园建设的目标和路径进行探究。  【关键词】高校 生态文明校园建设 路径  【中图分类号】 G 【文献标识码】 A  【文章编号】0450-9889(2015)03C-0082-02  目前,生态文明建设意识目前已经融入现代化建设的各个方面,高校校园建设也不例外。高校生态文明校园对提高青年大学生的生态文明素质有重
期刊