论文部分内容阅读
引言:本文就构建旅游个性化推荐知识库的方法进行了讨论和研究,分析了为什么选用基于本体方法来构建旅游个性化推荐知识库。介绍了以本体为基础的旅游个性化推荐知识库的构建及本体的构建原则,重点介绍了采用骨架法构建旅游资源本体知识库的具体构建方法及步骤。另外,对OWL语言进行了简要的介绍和举例。
当旅游市场发展到一个相对完善的水平时,旅游者对自己的旅游方式以及消费观念就会提出更高的要求,这就表现在旅游过程中所追求的自由,高质且量身订制的个性化专业服务。
旅游是—个集吃、住、行、娱、游、购六大要素为一体的—个综合性产业,一次旅游活动涉及到众多的旅游资源和服务设施,而旅游信息又有着丰富的空间和时间的内涵,再加上旅游过程是—个受自然、人为等多种因素制约的复杂过程。如何组织并安排好各相关的服务设施和旅游资源,协调好各种旅游服务产业提供的各项服务。并根据客户的需要进行服务流程的描述,进行功能、行为、策略和推理过程。现在较为成熟的推荐方法也有很多,下表列出了几种推荐方法的优缺点比较:
通过对上表的分析可以看出,基于知识库的推荐更适合完成我们所提出的个性化旅游推荐这一点。它是建立在用户需求和偏好基础上推荐的,因为在知识库中,景区的各项属性都与用户的需求有了相应的联系,也就是所形成的知识。因此在获得用户的需求后,就能够快捷准确的从知识库中获得所需要的景区信息,并推它不需要用户资料等信息,只需构建旅游资源的知识库,就可以与用户产生互动,将用户的需求映射到景区的潜在属性上,完成对旅游项目的选择。
传统的旅游信息系统(TIS)一般是建立在数据库系统基础上的,欧洲的一些国家曾有过许多成功的例子,比较著名的有瑞士阿彭策尔信息系统、奥地利蒂罗尔信息系统等。数据库系统管理的是数据,而知识库系统管理的是知识。[1]
二、知识库的构建方法
关于“知识”这一概念,还没有一个准确的定义,它被理解为“通过学习或经历所得到的理解和认识”或理解为“所发现、理解或学到的东西的总和”。消息应该被理解成对可用数据释义的叙述。数据则应该理解为:“附有数据的标记”。所以,知识是一个三元组的一部分。这个三元组是:数据、信息、知识。[2]
从计算机科学的角度来说,知识是信息经过分析和处理后得到的结果,在这一过程中数据经分析、比较、综合,最后结合成为有意义的资源---知识。这一过程如下图2.1所示:
目前有很多知识库的构建方法:基于模型的知识构建技术、基于关系数据库的知识库构建方法;基于知识管理的知识库建立;面向隐喻计算的实体概念知识库构建方法等;基于本体的知识库构建。[3]
其中,基于模型的知识构建技术是以模型为核心来组织、管理、共享和应用知识的体系,依据知识复用的原则,建立了基于模板与模型的知识复用技术;基于知识管理的知识库,它是以知识元挖掘为基础,通过揭示知识元之间的语义逻辑链接来构建知识结构体系;面向隐喻计算的实体概念知识库构建方法是利用属性是属性值与实体概念的中间桥梁这一思路来构建实体概念知识库的,其中涉及实体概念属性值的抽取与实体概念库的选择以,最后由属性的判定构建了实体概念知识库;基于本体的知识库构建是基于本体为知识库的建立提供了基本的结构,本体提供了一套概念及术语来对某一领域进行描述。知识库就是利用这些术语来表达虚拟或现实世界中的知识。[4]
下面,本文就基于本体的旅游个性化推荐知识库的构建方法进行具体讨论。
三、基于本体的构建方法
知识库的构建是为知识共享提供基础,也是关系到知识管理系统是否能平稳、有效运行的关键。知识库其实是一种对领域信息的模型化表示,利用本体来构建知识库已经成为当前知识库构建研究的热点。本体是关系和概念的集合,是对领域知识概念的抽象和描述。利用本体我们可以在数据库和应用软件来共享、重用领域知识。[5] 本体在知识库系统的开发中较多应用于开发领域模型,就比如本文所研究的旅游资源领域。下图3.1描述了本体与知识库之间的关系。
(一)基于骨架法的本体构造
本体构造的方法有很多种,这里本文讨论研究骨架法。骨架法的过程为:(1)确定本体的应用范围和目的;(2)知识本体的分析;(3)本体的表示;(4)本体的评估;(5)本体的建立。[6]骨架法流程如下图3.2所示:
(二)旅游资源领域本体分析
设计一个有效的知识表示系统以及对应的词汇表,要对该领域进行有效的本体分析,如果本体分析没做到位,则会导致知识库的不一致。[7]
在对旅游领域本体所涉及概念范围、概念关系、概念属性等进行分析后,得到旅游推荐所涉及到的主要事物包括:景点、地区、旅游路线、交通信息、酒店住宿、民风民俗、天气状况、餐饮等。对旅游本体库描述如下图3.3所示:图3.3 旅游本体库分析
(三)本体的描述
本体描述语言有RDF Schema(8Dr2S)和RDF、DAML、OIL、OWL等。本文采用OWL对旅游本体进行描述。OWL的全称是Web Ontology Language,是语义互联网中本体描述语言的标准。OWL采用的是面向对象的方式来对领域知识进行描述,即使用类以及属性来对对象进行描述,并使用公理来对这些类及属性的特征和关系进行描述。[8]与其它语言相对比,OWL增加了更多用来描述属性及类的词汇,如类之问的不等价性、基数和相交性,拥有更为丰富的属性特征(如对称性)、属性类型和枚举类。OWL还有3个表达能力递增的子语言:OWL Lite、OWL DL以及OWL Full,可以满足不同用户要求。
以下举例说明OWL在旅游资源本体构建中的一些实际应用:
例如在本体的定义中可以将同级别的几个词汇定义成不同的类,这就可以使用不相交类来进行定义:owl:disjiointWith,如下段的OWL定义的类就是不相交类:
在建立类属性的时候,我们还会定义属性的一些约束,如下面的OWL语言片段,allValuesFrom属性约束,就描述的是酒店星级都包含在酒店星级这一类中。
(四)本体的评估
在建立了基于本体的旅游信息知识库后,需要对该本体进行评估。本体的评估指根据能力问题及需求描述等对本体及相关文档、软件环境进行评价。这些评价因素需要包括详细的文本需求规则和本体所具有的功能以及在实际应用中对于知识的推理和检查能力。由于旅游本体是建立在传统旅游信息数据库上的,在咨询领域专家以及参考国内外的开发案例后,可以进一步的保证旅游信息系统所包含多个领域数据的有效性的和完备性。[9]
(五)本体知识库的建立
将本体引入知识库的知识建模,建立起领域本体知识库,知识库的构建涉及知识的表示、推理、传递以及获取。将本体引入知识库系统中,可以采用概念或术语来对知识进行表示,并能揭示这些知识之间所存在的内在联系。
下图3.4就是基于本体的知识库架构:
其中,表示层是语义web浏览器,提供接口用于用户浏览和交互。用户通过浏览器或者其他途径访问系统,用户界面接收并查询请求,将服务端所检索到的结果反馈给用户。值得注意的是,虽然本体被我们引入了系统中,但本体在表示层中是对用户屏蔽的。
数据层包括三个库:资源数据库、本体库和资源描述库。数据层是知识库的存储介质,由它创建和提取出结构化的知识本体,知识检索的直接来源就是数据层。[10]
应用逻辑层用以完成对知识的检索。应用逻辑层由查询组件、推理引擎、信息获取组件、语义分析组件、和本体管理组件这五个部分构成。由于旅游本体数据库中还包含了多个领域的知识,为了让用户能够得到供丰富完善、智能友好的旅游个性化推荐服务,对旅游资源信息进行语义查询时还需要利用推理机来实现此功能。其中,旅游资源本体公理可以用一阶谓词来表示。“A:(类)”表示A是一个类变量,A的表示是类中的一个实例;使用“A.S”表示A的槽S的值。S(A,B)表示A的槽S取值为B。要使本体知识库中数据一致,还需要构造公理库。
如定义以下公理:
公理1:
所有A:酒店,存在B:交通路线[HasRoute (A,B)]
公理2:
所有A:交通路线,所有B:酒店[HasRoute(A,B)-connctHotel(A,B)]
将建立好的公理库放入推理机中,在建立好的旅游资源本体知识库的基础上进行推理,这样可以根据用户的要求更为方便准确地推理查询出用户所期望的个性化旅游资源信息。
四、结束语
本文阐述了根据骨架方法构造旅游领域本体的原则和步骤。对基于本体的知识库系统和描述逻辑做了研究和探索工作。
由于知识库系统及本体论本身的内容的广泛性及其复杂性,仍然有很多问题有待进一步深入探讨和研究。特别是对旅游资源本体的研究、描述、构建以及发展等内容。本人将在后续的研究过程中继续钻研,力争取得更多更好的成果。
参考文献
[1]本体知识库的构建与进化方法研究[D].山东:中国海洋大学,2008.
[2]张鑫.基于知识管理的知识库构建[D].黑龙江:黑龙江大学,2009王璀民.
[3]冯欣.本体在旅游信息系统中的应用研究[D].重庆:重庆大学,2008.
[4]郭小芳,刘爱军.知识获取方法及实现技术[J].山西师范大学学报.2007,6(1):33~55.
[5]郭庆磊.基于本体的流程知识库研究与设计[D].山东:山东大学,2009.
[6]Paul C.jorgensen(美国).译者:韩柯,杜旭涛等.软件测试[M].北京:机械工业出版社.2008.159 ~187.
[7]陈铭,王英林.基于本体按需知识管理系统研究与实现[M].2006,23(1):236-240.
[8]张建华,刘仲英.当前知识管理系统模型与对策分析[M].[J].2004,23(1):73-77.
[9]Maedche,Alexander,Motik,Boris,Stojanovic,Ljiljana,Studer,Rudi;Volz,Raphael.Ontologiesforenterpriseknowledgemanagement.IEEEIntelligentSystems[J],2003(18/2):26-33.
[10] Gruninger M.and Fox.M.S.Methodology for the Design and Evaluation of Ontologies,Workshop on Basic Ontological Issues in Knowledge Sharing[J].IJCAI-95,Montreal,1995:121-128.
(作者单位:贵州财经大学 实验教学部)
作者简介:李小天(1987-),女,贵州贵阳人,硕士研究生,研究方向为数据库技术与软件工程。
基金项目:贵州省2008年省级信息化专项基金项目(0830)。
当旅游市场发展到一个相对完善的水平时,旅游者对自己的旅游方式以及消费观念就会提出更高的要求,这就表现在旅游过程中所追求的自由,高质且量身订制的个性化专业服务。
旅游是—个集吃、住、行、娱、游、购六大要素为一体的—个综合性产业,一次旅游活动涉及到众多的旅游资源和服务设施,而旅游信息又有着丰富的空间和时间的内涵,再加上旅游过程是—个受自然、人为等多种因素制约的复杂过程。如何组织并安排好各相关的服务设施和旅游资源,协调好各种旅游服务产业提供的各项服务。并根据客户的需要进行服务流程的描述,进行功能、行为、策略和推理过程。现在较为成熟的推荐方法也有很多,下表列出了几种推荐方法的优缺点比较:
通过对上表的分析可以看出,基于知识库的推荐更适合完成我们所提出的个性化旅游推荐这一点。它是建立在用户需求和偏好基础上推荐的,因为在知识库中,景区的各项属性都与用户的需求有了相应的联系,也就是所形成的知识。因此在获得用户的需求后,就能够快捷准确的从知识库中获得所需要的景区信息,并推它不需要用户资料等信息,只需构建旅游资源的知识库,就可以与用户产生互动,将用户的需求映射到景区的潜在属性上,完成对旅游项目的选择。
传统的旅游信息系统(TIS)一般是建立在数据库系统基础上的,欧洲的一些国家曾有过许多成功的例子,比较著名的有瑞士阿彭策尔信息系统、奥地利蒂罗尔信息系统等。数据库系统管理的是数据,而知识库系统管理的是知识。[1]
二、知识库的构建方法
关于“知识”这一概念,还没有一个准确的定义,它被理解为“通过学习或经历所得到的理解和认识”或理解为“所发现、理解或学到的东西的总和”。消息应该被理解成对可用数据释义的叙述。数据则应该理解为:“附有数据的标记”。所以,知识是一个三元组的一部分。这个三元组是:数据、信息、知识。[2]
从计算机科学的角度来说,知识是信息经过分析和处理后得到的结果,在这一过程中数据经分析、比较、综合,最后结合成为有意义的资源---知识。这一过程如下图2.1所示:
目前有很多知识库的构建方法:基于模型的知识构建技术、基于关系数据库的知识库构建方法;基于知识管理的知识库建立;面向隐喻计算的实体概念知识库构建方法等;基于本体的知识库构建。[3]
其中,基于模型的知识构建技术是以模型为核心来组织、管理、共享和应用知识的体系,依据知识复用的原则,建立了基于模板与模型的知识复用技术;基于知识管理的知识库,它是以知识元挖掘为基础,通过揭示知识元之间的语义逻辑链接来构建知识结构体系;面向隐喻计算的实体概念知识库构建方法是利用属性是属性值与实体概念的中间桥梁这一思路来构建实体概念知识库的,其中涉及实体概念属性值的抽取与实体概念库的选择以,最后由属性的判定构建了实体概念知识库;基于本体的知识库构建是基于本体为知识库的建立提供了基本的结构,本体提供了一套概念及术语来对某一领域进行描述。知识库就是利用这些术语来表达虚拟或现实世界中的知识。[4]
下面,本文就基于本体的旅游个性化推荐知识库的构建方法进行具体讨论。
三、基于本体的构建方法
知识库的构建是为知识共享提供基础,也是关系到知识管理系统是否能平稳、有效运行的关键。知识库其实是一种对领域信息的模型化表示,利用本体来构建知识库已经成为当前知识库构建研究的热点。本体是关系和概念的集合,是对领域知识概念的抽象和描述。利用本体我们可以在数据库和应用软件来共享、重用领域知识。[5] 本体在知识库系统的开发中较多应用于开发领域模型,就比如本文所研究的旅游资源领域。下图3.1描述了本体与知识库之间的关系。
(一)基于骨架法的本体构造
本体构造的方法有很多种,这里本文讨论研究骨架法。骨架法的过程为:(1)确定本体的应用范围和目的;(2)知识本体的分析;(3)本体的表示;(4)本体的评估;(5)本体的建立。[6]骨架法流程如下图3.2所示:
(二)旅游资源领域本体分析
设计一个有效的知识表示系统以及对应的词汇表,要对该领域进行有效的本体分析,如果本体分析没做到位,则会导致知识库的不一致。[7]
在对旅游领域本体所涉及概念范围、概念关系、概念属性等进行分析后,得到旅游推荐所涉及到的主要事物包括:景点、地区、旅游路线、交通信息、酒店住宿、民风民俗、天气状况、餐饮等。对旅游本体库描述如下图3.3所示:图3.3 旅游本体库分析
(三)本体的描述
本体描述语言有RDF Schema(8Dr2S)和RDF、DAML、OIL、OWL等。本文采用OWL对旅游本体进行描述。OWL的全称是Web Ontology Language,是语义互联网中本体描述语言的标准。OWL采用的是面向对象的方式来对领域知识进行描述,即使用类以及属性来对对象进行描述,并使用公理来对这些类及属性的特征和关系进行描述。[8]与其它语言相对比,OWL增加了更多用来描述属性及类的词汇,如类之问的不等价性、基数和相交性,拥有更为丰富的属性特征(如对称性)、属性类型和枚举类。OWL还有3个表达能力递增的子语言:OWL Lite、OWL DL以及OWL Full,可以满足不同用户要求。
以下举例说明OWL在旅游资源本体构建中的一些实际应用:
例如在本体的定义中可以将同级别的几个词汇定义成不同的类,这就可以使用不相交类来进行定义:owl:disjiointWith,如下段的OWL定义的类就是不相交类:
在建立类属性的时候,我们还会定义属性的一些约束,如下面的OWL语言片段,allValuesFrom属性约束,就描述的是酒店星级都包含在酒店星级这一类中。
(四)本体的评估
在建立了基于本体的旅游信息知识库后,需要对该本体进行评估。本体的评估指根据能力问题及需求描述等对本体及相关文档、软件环境进行评价。这些评价因素需要包括详细的文本需求规则和本体所具有的功能以及在实际应用中对于知识的推理和检查能力。由于旅游本体是建立在传统旅游信息数据库上的,在咨询领域专家以及参考国内外的开发案例后,可以进一步的保证旅游信息系统所包含多个领域数据的有效性的和完备性。[9]
(五)本体知识库的建立
将本体引入知识库的知识建模,建立起领域本体知识库,知识库的构建涉及知识的表示、推理、传递以及获取。将本体引入知识库系统中,可以采用概念或术语来对知识进行表示,并能揭示这些知识之间所存在的内在联系。
下图3.4就是基于本体的知识库架构:
其中,表示层是语义web浏览器,提供接口用于用户浏览和交互。用户通过浏览器或者其他途径访问系统,用户界面接收并查询请求,将服务端所检索到的结果反馈给用户。值得注意的是,虽然本体被我们引入了系统中,但本体在表示层中是对用户屏蔽的。
数据层包括三个库:资源数据库、本体库和资源描述库。数据层是知识库的存储介质,由它创建和提取出结构化的知识本体,知识检索的直接来源就是数据层。[10]
应用逻辑层用以完成对知识的检索。应用逻辑层由查询组件、推理引擎、信息获取组件、语义分析组件、和本体管理组件这五个部分构成。由于旅游本体数据库中还包含了多个领域的知识,为了让用户能够得到供丰富完善、智能友好的旅游个性化推荐服务,对旅游资源信息进行语义查询时还需要利用推理机来实现此功能。其中,旅游资源本体公理可以用一阶谓词来表示。“A:(类)”表示A是一个类变量,A的表示是类中的一个实例;使用“A.S”表示A的槽S的值。S(A,B)表示A的槽S取值为B。要使本体知识库中数据一致,还需要构造公理库。
如定义以下公理:
公理1:
所有A:酒店,存在B:交通路线[HasRoute (A,B)]
公理2:
所有A:交通路线,所有B:酒店[HasRoute(A,B)-connctHotel(A,B)]
将建立好的公理库放入推理机中,在建立好的旅游资源本体知识库的基础上进行推理,这样可以根据用户的要求更为方便准确地推理查询出用户所期望的个性化旅游资源信息。
四、结束语
本文阐述了根据骨架方法构造旅游领域本体的原则和步骤。对基于本体的知识库系统和描述逻辑做了研究和探索工作。
由于知识库系统及本体论本身的内容的广泛性及其复杂性,仍然有很多问题有待进一步深入探讨和研究。特别是对旅游资源本体的研究、描述、构建以及发展等内容。本人将在后续的研究过程中继续钻研,力争取得更多更好的成果。
参考文献
[1]本体知识库的构建与进化方法研究[D].山东:中国海洋大学,2008.
[2]张鑫.基于知识管理的知识库构建[D].黑龙江:黑龙江大学,2009王璀民.
[3]冯欣.本体在旅游信息系统中的应用研究[D].重庆:重庆大学,2008.
[4]郭小芳,刘爱军.知识获取方法及实现技术[J].山西师范大学学报.2007,6(1):33~55.
[5]郭庆磊.基于本体的流程知识库研究与设计[D].山东:山东大学,2009.
[6]Paul C.jorgensen(美国).译者:韩柯,杜旭涛等.软件测试[M].北京:机械工业出版社.2008.159 ~187.
[7]陈铭,王英林.基于本体按需知识管理系统研究与实现[M].2006,23(1):236-240.
[8]张建华,刘仲英.当前知识管理系统模型与对策分析[M].[J].2004,23(1):73-77.
[9]Maedche,Alexander,Motik,Boris,Stojanovic,Ljiljana,Studer,Rudi;Volz,Raphael.Ontologiesforenterpriseknowledgemanagement.IEEEIntelligentSystems[J],2003(18/2):26-33.
[10] Gruninger M.and Fox.M.S.Methodology for the Design and Evaluation of Ontologies,Workshop on Basic Ontological Issues in Knowledge Sharing[J].IJCAI-95,Montreal,1995:121-128.
(作者单位:贵州财经大学 实验教学部)
作者简介:李小天(1987-),女,贵州贵阳人,硕士研究生,研究方向为数据库技术与软件工程。
基金项目:贵州省2008年省级信息化专项基金项目(0830)。