论文部分内容阅读
摘 要:本文介绍了Ontology的概念和相关理论,从较高的层面上研究分析了它在B2B电子商务产品信息集成中特别是文档集成和内容管理中的作用,在一定程度上帮助解决了B2B电子商务发展的瓶颈问题。
关键词:B2B电子商务;信息集成;文档集成;
引言
使用XML进行交易方之间的数据交换时,首先必须在使用的词汇,以及用法和语义方面达成一致,这在一定程度上抑制了电子商务特别是B2B的跨领域、跨地区甚至跨国家的扩展性发展。为了更好地解决电子商务中的語义异构问题,引入了人工智能领域中的Ontology(本体)技术。它是不同领域、不同应用系统之间进行交流、协定的可以共享理解的表示。这种协定有助于对内容意义的精确、高效通信,同时又反过来促使系统的交互式操作、重用和共享等一系列的性能得以提高。
Ontology的概念及相关理论
Ontology在人工智能领域用于知识的共享,从20世纪90年代初以来,Ontology就已成为许多人工智能研究领域中如知识工程、自然语言处理与知识表示的研究主题。
(一)Ontology的概念
Ontology作为从哲学领域借鉴过来的术语,在哲学中它是一种存在的系统化解释。Ontology的概念有很多,但是目前基本上得到认同并能够较好表明它的本质的概念是:Ontology是对一个共享的概念化的形式的、显式的规格说明。“概念化”指的是世界上某些现象的抽象模型,该模型能够识别现象的相关概念。“显示的”指所使用概念的类型及这些概念在使用上的约束要显式定义。“形式的”指Ontology是机器可以处理的。当然,这种形式化的程度可以不同,例如WordNet提供了超过100 000的使用自然语言解释的术语,而CYC提供了常识知识许多方面的形式化、公理化理论。“共享”说明Ontology表明的是达成一致的知识,也就是说,它并不是局限于某几个个体而是被整体所接受。
1、Ontology的语言
有许多语言可用于表示Ontology,其中一些语言是基于XML语法并用于语义Web的,如:OXL(OntologyeXchange Language),SHOE(Simple HTML Ontology Extension,最初基于HTML),OML(Ontology MarkupLanguage),以及由W3C工作组创建的RDF(Resource Description Framework)与RDF Schema。最后,还有建立在RDF与RDF之上的、较为完善的Ontology语言OIL(Ontology Inference Layer)和DAML+OIL(图1)。当然,还有其它创建Ontology的语言如传统的OKBC,OCML等。选择何种语言表示,要根据具体的应用来定。
(二)Ontology在B2B电子商务信息集成中的应用
电子商务中的B2B主要从事企业与企业之间在线进行商业合作的交易,Internet和基于Web的电子商务为优化商业关系提供了较高水平的灵活性和开放性。这些电子商务B2B平台为他们的客户提供了新的机会,可以帮助客户不需要通过大量的通讯渠道,就可以联系到许多潜在的商业伙伴。譬如中国的阿里巴巴以全球领先的B2B电子商务网上贸易平台为许多企业带来了商机和利润。
从技术的角度来看B2B的信息集成任务,它主要包括两种:商业文档的集成和内容标准管理。其中的关键技术是基于本体(Ontology)来实现的。
1、B2B文档集成
传统的转换技术在效率和应用范围上均不能满足要求,但使用具有发展前景的Ontology技术,能够较好地解决电子商务中的这一问题。以Ontology为中介的信息集成提供了进行文档集成、将概念结构引入文档和对基于知识的文档查询、检索进一步集成的良好架构。
XSL-T与Xpath结合使用可以转换任意XML文件,但由于进行的是直接映射,所以规则比较复杂,程序编写困难、复杂,维护起来不容易,而且实现的映射重用性差。基于Ontology的多层次集成可以解决以上的问题,该方法中将信息的表示分为三个层次:语法层、数据模型层和Ontology层。
(1)语法层对应使用XML序列化表示的文档实例,该序列化主要说明使用到的XML元素和属性以及它们的顺序。
(2)数据模型层可以看作是语法层与Ontology层之间的桥梁,该层将在语法层中的差异抽取出来进行表示,并用对象—属性—值对产品进行描述。标准化(Normalization)的进行是根据相应的Ontology进行的,因为在Ontology中表明了按所要求粒度进行元素分解后的元素的语义。该层使用的术语由相应的Ontology进行定义,并且通常必须与在语法层使用到的相符合。然而,前者比后者要详细得多,如在XML文件描述中,街道名称与门牌号可以作为一个元素,而在Ontology中,两者肯定是分开的。该层次可以使用RDF进行描述,也可使用SOAP(Simple Object Access Protocol)。
(3)Ontology层包含每一种文档类型通用的文档Ontology,如产品目录Ontology、购买合同的Ontology等。这些Ontology提供了电子商务B2B中的使用到的术语及术语的形式化语义。如地址在运输文档中可能是指运输地址,而在财务文档中可能是指账单地址,在Ontology层这两种类型的地址必须明确地分开。另外,Ontology中还包含了在一些文档标准中可选或忽略的元素。
按照上述层次描述,可实现电子商务B2B中的较复杂的文档集成,结构如图2所示,总的来说可以分为三步:①按照从语法层到数据模型层的转换要求,从XML描述中抽象出源文档的RDF数据模型,这样解决了由于XML语法的多样性和复杂性带来的转换规则的复杂性。②把文档的数据模型转化为电子商务B2B中的使用的术语,并在相应的文档Ontology中详细说明。在该步骤中,数据模型的粒度水平需要与电子商务B2B中的使用的粒度水平平齐。这意味着可能需要进行一对多的转化。③电子商务B2B的按照目标文档标准的术语生成一个相应的文档,其中由于原子概念的粒度水平的不一致,需要对该文档进行多对一的到RDF表示的转换。
2、内容管理
从本质上说,内容标准也就是产品Ontology,它们提供产品分类层次和相关产品属性。因此,电子集市需要进行的内容管理任务实际上是Ontology的管理任务。它包括:①产品分类。按产品Ontology中的类别,对产品进行分类。②产品再分类。由于不同企业有自己不同的需求,因此,往往会造成不同的产品分类,因此这就要求B2B电子商务网上贸易平台具有根据新的分类模式再分类的能力,根据新的产品Ontology将新类型分配给某一产品。在该任务中需要解决水平型标准之间、垂直型标准之间,以及水平型标准与垂直型标准之间的映射问题。③产品描述层次的个性化并根据不同产品Ontology产生视图。不同的用户希望得到不同的产品分类视图,根据用户的描述,内容管理过程可半自动化地产生用户需要的产品目录视图。为了更好地实现面向用户,需要设计和实现两个产品Ontologies:客观的与主观的产品Ontology。客观的Ontology用于描述被讨论域内典型产品目录中的元素,如打印机重量;主观Ontology描述有关用户喜好的产品信息元素,如打印机的打印分辨率。分类规则可以发展成为根据一定主观的类别对产品信息进行分类,如便宜的家用打印机。Ontologies可以用于模仿(Model)每一产品特性的协商。④不同版本Ontology的维护,确保Ontology的一致性。这主要是由于内容标准的经常变化,如UNSPSC每两个星期需要进行一次更新。
结论
随着Ontology技术(如Ontology表示语言、Ontology学习方法、Ontology库系统及Ontology工程工具等)的不断完善,以及语义Web技术的日臻成熟,Ontology技术在B2B电子商务中的应用将更加广泛。
注:文章内所有公式及图表请以PDF形式查看。
关键词:B2B电子商务;信息集成;文档集成;
引言
使用XML进行交易方之间的数据交换时,首先必须在使用的词汇,以及用法和语义方面达成一致,这在一定程度上抑制了电子商务特别是B2B的跨领域、跨地区甚至跨国家的扩展性发展。为了更好地解决电子商务中的語义异构问题,引入了人工智能领域中的Ontology(本体)技术。它是不同领域、不同应用系统之间进行交流、协定的可以共享理解的表示。这种协定有助于对内容意义的精确、高效通信,同时又反过来促使系统的交互式操作、重用和共享等一系列的性能得以提高。
Ontology的概念及相关理论
Ontology在人工智能领域用于知识的共享,从20世纪90年代初以来,Ontology就已成为许多人工智能研究领域中如知识工程、自然语言处理与知识表示的研究主题。
(一)Ontology的概念
Ontology作为从哲学领域借鉴过来的术语,在哲学中它是一种存在的系统化解释。Ontology的概念有很多,但是目前基本上得到认同并能够较好表明它的本质的概念是:Ontology是对一个共享的概念化的形式的、显式的规格说明。“概念化”指的是世界上某些现象的抽象模型,该模型能够识别现象的相关概念。“显示的”指所使用概念的类型及这些概念在使用上的约束要显式定义。“形式的”指Ontology是机器可以处理的。当然,这种形式化的程度可以不同,例如WordNet提供了超过100 000的使用自然语言解释的术语,而CYC提供了常识知识许多方面的形式化、公理化理论。“共享”说明Ontology表明的是达成一致的知识,也就是说,它并不是局限于某几个个体而是被整体所接受。
1、Ontology的语言
有许多语言可用于表示Ontology,其中一些语言是基于XML语法并用于语义Web的,如:OXL(OntologyeXchange Language),SHOE(Simple HTML Ontology Extension,最初基于HTML),OML(Ontology MarkupLanguage),以及由W3C工作组创建的RDF(Resource Description Framework)与RDF Schema。最后,还有建立在RDF与RDF之上的、较为完善的Ontology语言OIL(Ontology Inference Layer)和DAML+OIL(图1)。当然,还有其它创建Ontology的语言如传统的OKBC,OCML等。选择何种语言表示,要根据具体的应用来定。
(二)Ontology在B2B电子商务信息集成中的应用
电子商务中的B2B主要从事企业与企业之间在线进行商业合作的交易,Internet和基于Web的电子商务为优化商业关系提供了较高水平的灵活性和开放性。这些电子商务B2B平台为他们的客户提供了新的机会,可以帮助客户不需要通过大量的通讯渠道,就可以联系到许多潜在的商业伙伴。譬如中国的阿里巴巴以全球领先的B2B电子商务网上贸易平台为许多企业带来了商机和利润。
从技术的角度来看B2B的信息集成任务,它主要包括两种:商业文档的集成和内容标准管理。其中的关键技术是基于本体(Ontology)来实现的。
1、B2B文档集成
传统的转换技术在效率和应用范围上均不能满足要求,但使用具有发展前景的Ontology技术,能够较好地解决电子商务中的这一问题。以Ontology为中介的信息集成提供了进行文档集成、将概念结构引入文档和对基于知识的文档查询、检索进一步集成的良好架构。
XSL-T与Xpath结合使用可以转换任意XML文件,但由于进行的是直接映射,所以规则比较复杂,程序编写困难、复杂,维护起来不容易,而且实现的映射重用性差。基于Ontology的多层次集成可以解决以上的问题,该方法中将信息的表示分为三个层次:语法层、数据模型层和Ontology层。
(1)语法层对应使用XML序列化表示的文档实例,该序列化主要说明使用到的XML元素和属性以及它们的顺序。
(2)数据模型层可以看作是语法层与Ontology层之间的桥梁,该层将在语法层中的差异抽取出来进行表示,并用对象—属性—值对产品进行描述。标准化(Normalization)的进行是根据相应的Ontology进行的,因为在Ontology中表明了按所要求粒度进行元素分解后的元素的语义。该层使用的术语由相应的Ontology进行定义,并且通常必须与在语法层使用到的相符合。然而,前者比后者要详细得多,如在XML文件描述中,街道名称与门牌号可以作为一个元素,而在Ontology中,两者肯定是分开的。该层次可以使用RDF进行描述,也可使用SOAP(Simple Object Access Protocol)。
(3)Ontology层包含每一种文档类型通用的文档Ontology,如产品目录Ontology、购买合同的Ontology等。这些Ontology提供了电子商务B2B中的使用到的术语及术语的形式化语义。如地址在运输文档中可能是指运输地址,而在财务文档中可能是指账单地址,在Ontology层这两种类型的地址必须明确地分开。另外,Ontology中还包含了在一些文档标准中可选或忽略的元素。
按照上述层次描述,可实现电子商务B2B中的较复杂的文档集成,结构如图2所示,总的来说可以分为三步:①按照从语法层到数据模型层的转换要求,从XML描述中抽象出源文档的RDF数据模型,这样解决了由于XML语法的多样性和复杂性带来的转换规则的复杂性。②把文档的数据模型转化为电子商务B2B中的使用的术语,并在相应的文档Ontology中详细说明。在该步骤中,数据模型的粒度水平需要与电子商务B2B中的使用的粒度水平平齐。这意味着可能需要进行一对多的转化。③电子商务B2B的按照目标文档标准的术语生成一个相应的文档,其中由于原子概念的粒度水平的不一致,需要对该文档进行多对一的到RDF表示的转换。
2、内容管理
从本质上说,内容标准也就是产品Ontology,它们提供产品分类层次和相关产品属性。因此,电子集市需要进行的内容管理任务实际上是Ontology的管理任务。它包括:①产品分类。按产品Ontology中的类别,对产品进行分类。②产品再分类。由于不同企业有自己不同的需求,因此,往往会造成不同的产品分类,因此这就要求B2B电子商务网上贸易平台具有根据新的分类模式再分类的能力,根据新的产品Ontology将新类型分配给某一产品。在该任务中需要解决水平型标准之间、垂直型标准之间,以及水平型标准与垂直型标准之间的映射问题。③产品描述层次的个性化并根据不同产品Ontology产生视图。不同的用户希望得到不同的产品分类视图,根据用户的描述,内容管理过程可半自动化地产生用户需要的产品目录视图。为了更好地实现面向用户,需要设计和实现两个产品Ontologies:客观的与主观的产品Ontology。客观的Ontology用于描述被讨论域内典型产品目录中的元素,如打印机重量;主观Ontology描述有关用户喜好的产品信息元素,如打印机的打印分辨率。分类规则可以发展成为根据一定主观的类别对产品信息进行分类,如便宜的家用打印机。Ontologies可以用于模仿(Model)每一产品特性的协商。④不同版本Ontology的维护,确保Ontology的一致性。这主要是由于内容标准的经常变化,如UNSPSC每两个星期需要进行一次更新。
结论
随着Ontology技术(如Ontology表示语言、Ontology学习方法、Ontology库系统及Ontology工程工具等)的不断完善,以及语义Web技术的日臻成熟,Ontology技术在B2B电子商务中的应用将更加广泛。
注:文章内所有公式及图表请以PDF形式查看。