论文部分内容阅读
摘 要:个性化阅读逐渐成为提升读者阅读满意度的有效手段之一,在数字农家书屋上构建个性化推荐系统是改善马太效应的一个途径。将情境感知融入到个性化推荐系统中,可以解决系统的冷启动问题和数据稀疏性,就此提出了建设构想和解决方案。
关键词:个性化;推荐系统;农家书屋
中图分类号:TP39 文献标识码:A 文章编号:1007-9599 (2013) 03-0000-02
文化惠民的农家书屋工程已建设了七个年头,实体农家书屋得到了大力发展,在一定程度上满足了广大农民对知识的渴求。在互联网高速发展的今天,农家书屋数字化平台的建设则显得相对落后。以贵州省数字农家书屋平台为例,该平台是引入了省图书馆的数字图书资源,依托贵州财经大学的技术支撑,在限定的IP段内统一账号访问数字资源。该平台采用了C#编程语言,SQL sever 2005,主页有超过三分之二的布局做了按点击率分布的大众化书目推荐。在数字书屋首页以如此大的篇幅来做书目的推荐,可见书目推荐在农家书屋数字化建设中的重要地位。而农家书屋发挥能效作用的部分在于对图书的阅读,阅读本身是具有个性化和私密性特点的。目前国外关于个性化阅读的应用有Zite等,国内的有微观、指阅、无觅、牛赞网、鲜果等。而现有的数字农家书屋属于大众化推荐的阅读,缺乏个性化阅读的服务,在提升农民阅读体验满意度上受到限制。随着传统互联网和移动互联网业务以摩尔定律的速率飞速发展,为数字农家书屋提供个性化阅读服务,无疑对消除城乡数字鸿沟起到积极的推进作用。
1 个性化阅读
个性化阅读是相对大众化阅读而言的,是基于读者用户的借阅历史,注册信息以及对各类别书目的评分,利用个性化推荐技术,计算读者用户的阅读偏好,给出具有准确性、多样性和新颖性的个性化书目推荐列表。
1.1 个性化推荐技术
上世纪九十年代中期学术界发表了关于协同过滤技术的文章后,个性化推荐开始成为独立的学科得到关注,逐步成为解决信息过载的有效途径之一。个性化推荐是基于用户和资源之间的二元关系,利用相似关系挖掘每个用户的偏好,进而实现个性化推荐。传统互联网的个性化推荐可以分为协同过滤推荐,基于内容的推荐,混合推荐。随着移动互联网的发展,出现了基于情境感知的移动个性化推荐。
1.1.1协同过滤推荐
协同过滤推荐(collaborative filtering recommendation):采取“我为人人,人人为我”的集体智慧,通过与当前用户类似的其他用户偏好来推测该用户的偏好。可以依据该用户和其他用户对资源的历史偏好来推测当前用户对其他资源潜在偏好,或是利用用户对当前项目及其他项目的已知偏好数据推测其他用户对其他项目的潜在偏好。协同过滤可以分为启发式和基于模型的方法[1]。启发式需要计算用户或项目之间的相似度,基于模型的需要利用用户的历史偏好学习一个模型作为活动用户和活动项目的偏好预测的基础。
1.1.2基于内容的推荐
基于内容的推荐(content-based recommendation):利用用户喜欢的资源,选择其他类似的资源作为推荐啊列表。首先,由推荐系统隐式或显式的获取用户对资源属性的偏好,然后,通过计算用户偏好和待测项目属性的匹配度,最后按照相似度进行TOP-N排序,向用户推荐其可能感兴趣的项目。基于内容的推荐也可分为启发式和基于模型的方法。
1.1.3混合推荐
混合推荐(hybrid recommendation):该推荐技术主要是为了解决使用单一推荐技术的局限性,可以根据不同的混合策略(例如加权、切换、混合呈现、特征组合、串联、元层次混合等)将各种推荐方法进行组合使用完成推荐[2]。在移动场景下的推荐系统中,研究较多的是将协同过滤系统和基于内容的推荐混合来用,基于标签的推荐可以理解为基于内容的一类。在移动推荐中,往往将地点、时间等各类上下文信息融合进系统进行情境感知,通过本体构建或贝叶斯网络来做推荐。
此外,有学者提出了基于知识的推荐(knowledage-based recommendation)的概念,利用在特定领域的规则进行基于规则和实例的推测,并根据推测结果生成推荐列表。其中,规则的获取、推断、知识库的构建等是基于知识推荐的关键所在。
2 数字农家书屋的个性化阅读研究
从理论意义来看,当前农家书屋数字化平台中的阅读排行,提供的阅读热度排名属于大众化的推荐,会产生马太效应,使得热门书目变得更加热门,冷门书目变得更加冷门,而列入推荐排行榜中的书目只是大量图书资源中为数很少的几本热点图书,这种热门图书的长期积累优势,会造成人们较少关注冷门书目,这是对图书资源的一种浪费。而每一本冷门图书也必会有属于它的阅读受众,个性化阅读正是缓解马太效应的有力工具,可以提高图书资源的利用率。未列入推荐排行榜的大量图书存在巨大的潜在读者群,涵盖了几乎更多人的需求,个性化阅读可以充分发挥长尾理论的优势,使得冷门图书不再冷门。随着农民人均收入的逐步增加,广大农民朋友对于个性化阅读的需求将更为迫切,在农家书屋的数字化平台上增添个性化推荐的服务迎合了马斯洛需求层次理论的自我实现需求,扩展了数字农家书屋的时间维度,空间维度和受众维度。这种以人为本的个性化服务理念符合社会学的诠释。
从实践意义来看,数字农家书屋的主页有超过三分之二的页面布局是图书推荐和阅读排行。但由于目前的数字化平台是统一账号登录,阅读书目的推荐通过点击率进行排名,这种靠阅读流行度的排名推荐属于非个性化推荐。阅读本身是属于个性化的行为,不同地区、不同年龄、不同文化层次的农民群众对于阅读内容的需求是不尽相同的,随着每年定期的更新书库,数字农家书屋平台中的电子图书资源将是海量的,这势必会产生信息过载,导致农民群众迷航于书海中,而个性化阅读服务恰是解决这一问题的有效工具。有助于减轻书屋管理员的压力。广大农民朋友从过去的人找图书过渡到图书找人,节约了检索图书的时间成本,提升了各类图书资源的利用率,促进了城乡数字鸿沟的弥合。 2.1 基于个性化阅读的数字农家书屋建设思路
主要思路是在传统协同过滤的基础上融合当前农民读者的情境信息,结合调研,对情境信息进行加权处理,先对读者和评分的书目进行相似度计算,再利用贝叶斯网络构建读者的兴趣模型,最后通过系统平台展示差异化的书目推荐,如图1。
2.2 基于个性化阅读的解决方案
(1)在农民朋友普遍存在信息检索技能受限的情况下,读者历史行为的记录收集是提供个性化推荐的基础和兴趣建模的依据。有效的捕获各类读者行为信息也是解决读者兴趣漂移的关键。通过显式的读者评分来获取读者偏好会严重影响读者的体验,常用隐式方法来获取读者偏好。随着时间的推移,读者偏好不是一成不变的,情境读者偏好也是如此。因此,情境读者偏好变化检测与修正是做个性化阅读的重点。
(2)个性化阅读推荐系统也存在包括新用户问题和新项目问题。对首次使用系统的农民读者,系统没有或只有少量关于读者的信息,不能准确地获取读者偏好。新项目问题是指新加入的项目在一段时间之后才可能有读者对其浏览并评价,在使用协同过滤的推荐系统中,由于新项目没有被读者浏览或评分,因此不能被推荐。如何解决移动推荐系统中的冷启动数据稀疏性问题是个性化阅读的又一个难点。
(3)推荐系统中情境对读者偏好存在不同程度的影响,当并没有明确规定需要考虑哪些类型的情境,从降低计算复杂度来讲,获取尽可能多的情境信息并不是必需的。因此,明确不同情境在不同领域对推荐系统性能的影响,只考虑有效的情境以降低计算复杂度。由于阅读环境的不确定性,获取的情境可能存在错误或丢失的情况。如何处理情境错误或丢失的情况以提高推荐系统的健壮性的重点。
3 结论
在传统互联网的推荐系统中融入当前阅读的情境信息,如:位置、标签、年龄、文化程度、各类图书喜好等。同时结合调研,提出适合数字农家书屋的个性化推荐系统,实现个性化的前台展示。从普适计算发展而来情境感知概念对于阅读推荐来说,提高了个性化推荐的精确度,有效改善了系统冷启动和数据稀疏性问题,提升了数字农家书屋平台的个性化阅读的满意度。
参考文献:
[1]项亮.推荐系统实践[M].北京:人民邮电出版社,2012.
[2]Wang LC.Context-Aware recommender systems.Journal of Software,2012,23(1):1?20.
[作者简介]高亮(1984-),男,河北邯郸人,贵州财经大学2011级计算机应用技术硕士研究生,研究方向为管理信息与决策支持系统。
[基金项目]贵州省2010年工业攻关项目“贵州农家书屋建设中数字化平台架构及关键共性技术研发”(黔科合 GY 字[2010]3053)。
关键词:个性化;推荐系统;农家书屋
中图分类号:TP39 文献标识码:A 文章编号:1007-9599 (2013) 03-0000-02
文化惠民的农家书屋工程已建设了七个年头,实体农家书屋得到了大力发展,在一定程度上满足了广大农民对知识的渴求。在互联网高速发展的今天,农家书屋数字化平台的建设则显得相对落后。以贵州省数字农家书屋平台为例,该平台是引入了省图书馆的数字图书资源,依托贵州财经大学的技术支撑,在限定的IP段内统一账号访问数字资源。该平台采用了C#编程语言,SQL sever 2005,主页有超过三分之二的布局做了按点击率分布的大众化书目推荐。在数字书屋首页以如此大的篇幅来做书目的推荐,可见书目推荐在农家书屋数字化建设中的重要地位。而农家书屋发挥能效作用的部分在于对图书的阅读,阅读本身是具有个性化和私密性特点的。目前国外关于个性化阅读的应用有Zite等,国内的有微观、指阅、无觅、牛赞网、鲜果等。而现有的数字农家书屋属于大众化推荐的阅读,缺乏个性化阅读的服务,在提升农民阅读体验满意度上受到限制。随着传统互联网和移动互联网业务以摩尔定律的速率飞速发展,为数字农家书屋提供个性化阅读服务,无疑对消除城乡数字鸿沟起到积极的推进作用。
1 个性化阅读
个性化阅读是相对大众化阅读而言的,是基于读者用户的借阅历史,注册信息以及对各类别书目的评分,利用个性化推荐技术,计算读者用户的阅读偏好,给出具有准确性、多样性和新颖性的个性化书目推荐列表。
1.1 个性化推荐技术
上世纪九十年代中期学术界发表了关于协同过滤技术的文章后,个性化推荐开始成为独立的学科得到关注,逐步成为解决信息过载的有效途径之一。个性化推荐是基于用户和资源之间的二元关系,利用相似关系挖掘每个用户的偏好,进而实现个性化推荐。传统互联网的个性化推荐可以分为协同过滤推荐,基于内容的推荐,混合推荐。随着移动互联网的发展,出现了基于情境感知的移动个性化推荐。
1.1.1协同过滤推荐
协同过滤推荐(collaborative filtering recommendation):采取“我为人人,人人为我”的集体智慧,通过与当前用户类似的其他用户偏好来推测该用户的偏好。可以依据该用户和其他用户对资源的历史偏好来推测当前用户对其他资源潜在偏好,或是利用用户对当前项目及其他项目的已知偏好数据推测其他用户对其他项目的潜在偏好。协同过滤可以分为启发式和基于模型的方法[1]。启发式需要计算用户或项目之间的相似度,基于模型的需要利用用户的历史偏好学习一个模型作为活动用户和活动项目的偏好预测的基础。
1.1.2基于内容的推荐
基于内容的推荐(content-based recommendation):利用用户喜欢的资源,选择其他类似的资源作为推荐啊列表。首先,由推荐系统隐式或显式的获取用户对资源属性的偏好,然后,通过计算用户偏好和待测项目属性的匹配度,最后按照相似度进行TOP-N排序,向用户推荐其可能感兴趣的项目。基于内容的推荐也可分为启发式和基于模型的方法。
1.1.3混合推荐
混合推荐(hybrid recommendation):该推荐技术主要是为了解决使用单一推荐技术的局限性,可以根据不同的混合策略(例如加权、切换、混合呈现、特征组合、串联、元层次混合等)将各种推荐方法进行组合使用完成推荐[2]。在移动场景下的推荐系统中,研究较多的是将协同过滤系统和基于内容的推荐混合来用,基于标签的推荐可以理解为基于内容的一类。在移动推荐中,往往将地点、时间等各类上下文信息融合进系统进行情境感知,通过本体构建或贝叶斯网络来做推荐。
此外,有学者提出了基于知识的推荐(knowledage-based recommendation)的概念,利用在特定领域的规则进行基于规则和实例的推测,并根据推测结果生成推荐列表。其中,规则的获取、推断、知识库的构建等是基于知识推荐的关键所在。
2 数字农家书屋的个性化阅读研究
从理论意义来看,当前农家书屋数字化平台中的阅读排行,提供的阅读热度排名属于大众化的推荐,会产生马太效应,使得热门书目变得更加热门,冷门书目变得更加冷门,而列入推荐排行榜中的书目只是大量图书资源中为数很少的几本热点图书,这种热门图书的长期积累优势,会造成人们较少关注冷门书目,这是对图书资源的一种浪费。而每一本冷门图书也必会有属于它的阅读受众,个性化阅读正是缓解马太效应的有力工具,可以提高图书资源的利用率。未列入推荐排行榜的大量图书存在巨大的潜在读者群,涵盖了几乎更多人的需求,个性化阅读可以充分发挥长尾理论的优势,使得冷门图书不再冷门。随着农民人均收入的逐步增加,广大农民朋友对于个性化阅读的需求将更为迫切,在农家书屋的数字化平台上增添个性化推荐的服务迎合了马斯洛需求层次理论的自我实现需求,扩展了数字农家书屋的时间维度,空间维度和受众维度。这种以人为本的个性化服务理念符合社会学的诠释。
从实践意义来看,数字农家书屋的主页有超过三分之二的页面布局是图书推荐和阅读排行。但由于目前的数字化平台是统一账号登录,阅读书目的推荐通过点击率进行排名,这种靠阅读流行度的排名推荐属于非个性化推荐。阅读本身是属于个性化的行为,不同地区、不同年龄、不同文化层次的农民群众对于阅读内容的需求是不尽相同的,随着每年定期的更新书库,数字农家书屋平台中的电子图书资源将是海量的,这势必会产生信息过载,导致农民群众迷航于书海中,而个性化阅读服务恰是解决这一问题的有效工具。有助于减轻书屋管理员的压力。广大农民朋友从过去的人找图书过渡到图书找人,节约了检索图书的时间成本,提升了各类图书资源的利用率,促进了城乡数字鸿沟的弥合。 2.1 基于个性化阅读的数字农家书屋建设思路
主要思路是在传统协同过滤的基础上融合当前农民读者的情境信息,结合调研,对情境信息进行加权处理,先对读者和评分的书目进行相似度计算,再利用贝叶斯网络构建读者的兴趣模型,最后通过系统平台展示差异化的书目推荐,如图1。
2.2 基于个性化阅读的解决方案
(1)在农民朋友普遍存在信息检索技能受限的情况下,读者历史行为的记录收集是提供个性化推荐的基础和兴趣建模的依据。有效的捕获各类读者行为信息也是解决读者兴趣漂移的关键。通过显式的读者评分来获取读者偏好会严重影响读者的体验,常用隐式方法来获取读者偏好。随着时间的推移,读者偏好不是一成不变的,情境读者偏好也是如此。因此,情境读者偏好变化检测与修正是做个性化阅读的重点。
(2)个性化阅读推荐系统也存在包括新用户问题和新项目问题。对首次使用系统的农民读者,系统没有或只有少量关于读者的信息,不能准确地获取读者偏好。新项目问题是指新加入的项目在一段时间之后才可能有读者对其浏览并评价,在使用协同过滤的推荐系统中,由于新项目没有被读者浏览或评分,因此不能被推荐。如何解决移动推荐系统中的冷启动数据稀疏性问题是个性化阅读的又一个难点。
(3)推荐系统中情境对读者偏好存在不同程度的影响,当并没有明确规定需要考虑哪些类型的情境,从降低计算复杂度来讲,获取尽可能多的情境信息并不是必需的。因此,明确不同情境在不同领域对推荐系统性能的影响,只考虑有效的情境以降低计算复杂度。由于阅读环境的不确定性,获取的情境可能存在错误或丢失的情况。如何处理情境错误或丢失的情况以提高推荐系统的健壮性的重点。
3 结论
在传统互联网的推荐系统中融入当前阅读的情境信息,如:位置、标签、年龄、文化程度、各类图书喜好等。同时结合调研,提出适合数字农家书屋的个性化推荐系统,实现个性化的前台展示。从普适计算发展而来情境感知概念对于阅读推荐来说,提高了个性化推荐的精确度,有效改善了系统冷启动和数据稀疏性问题,提升了数字农家书屋平台的个性化阅读的满意度。
参考文献:
[1]项亮.推荐系统实践[M].北京:人民邮电出版社,2012.
[2]Wang LC.Context-Aware recommender systems.Journal of Software,2012,23(1):1?20.
[作者简介]高亮(1984-),男,河北邯郸人,贵州财经大学2011级计算机应用技术硕士研究生,研究方向为管理信息与决策支持系统。
[基金项目]贵州省2010年工业攻关项目“贵州农家书屋建设中数字化平台架构及关键共性技术研发”(黔科合 GY 字[2010]3053)。