论文部分内容阅读
语义网将使人类从搜索相关网页的繁重劳动中解放出来,把用户变成全能的上帝
人类的幸运之一便是在需要天才出现的时候,总会有天才出现推动我们前行。“万维网之父”蒂姆•伯纳斯•李(
Tim Berners-Lee)就是一个典型代表,他的“纯粹个人的劳动成果”改变了全球信息化的传统模式,带来了一个信息交流的全新时代,为互联网的全球化普及翻开了里程碑式的篇章。
但是随之而来的信息大爆炸,却让我们再次迷失了方向。互联网中海量的信息让我们有限的体力疲劳不已,常常花费了几个小时,输入了几百个关键词,点开了成千上万个网页,却依旧不能找到想要的信息。万维网的未来怎么办?在这个需要天才的时刻,伯纳斯•李再一次站了出来,提出了“语义网”这一概念。
什么是语义网
2001年5月,伯纳斯•李在《科学美国人》杂志上系统地论述了他对下一代万维网架构——语义网的设想。他认为:“语义网并非一个完全不同的万维网,而是现在万维网的一个延伸,是将现行万维网上的信息加以明确的语义定义,更利于人机之间的合作。”
简单地说,语义网是一种能理解人类语言的智能网络,它不但能够理解人类的语言,而且还可以使人与电脑之间的交流变得像人与人之间交流一样轻松。它好比一个巨型的大脑,智能化程度极高,协调能力非常强大。在语义网上连接的每一部电脑不但能够理解词语和概念,而且还能够理解它们之间的逻辑关系,可以干人所从事的工作。它将使人类从搜索相关网页的繁重劳动中解放出来,把用户变成全能的上帝。语义网中的计算机能利用自己的智能软件,在万维网上的海量资源中找到你所需要的信息,从而将一个个现存的信息孤岛发展成一个巨大的数据库。
下面这个场景就是语义网应用的一个典型案例:某天早上你突然想去可可西里旅游,于是你打开电脑,连通语义网,输入“预订今天下午两点到六点之间任意时刻的到可可西里的飞机票”,此刻你的计算机代理将先与你所住地点航空公司的代理进行联系,获得符合你要求的飞机票信息,然后联系航空公司的订票代理,完成订购。你不必像现在这样上网查看时间表,并进行拷贝和粘贴,然后打电话或在线预订机票和宾馆等,安装在你计算机上的软件会自动替你完成上述步骤,你所做的仅仅是用鼠标按几个按钮,然后等着送飞机票的人上门甚至直接去机场登机就可以了。
总之,语义网是一种更丰富多彩、更个性化的网络,是对万维网本质的变革。它可以帮助你滤掉你不喜欢的内容,使得网络更像是你自己的网络。
语义网研究现状
我们知道,大部分科技创新和突破是对已有知识的重新组合和更新,具有对网络空间所储存的数据进行智能评估能力的语义网,必然会为新的科技创新提供无尽的资源。一旦这种技术被广泛运用,其产生的效益无可估量。因此,语义网从诞生之日起,便成为计算机研究的热点领域。
W3C组织(World Wide Web Consortium)是语义网主要的推动者和标准制定者,在它的呵护之下,语义网技术羽翼渐丰。2001年7月30日,美国斯坦福大学召开了题为“语义网基础设施和应用”的学术会议,这是有关语义网的第一个国际会议。2002年7月9日,第一届国际语义网大会在意大利召开。此后语义网大会每年举行一次,形成惯例。同时,HP、IBM、微软、富士通等大公司,斯坦福大学、马里兰大学、德国卡尔斯鲁厄大学、英国曼彻斯特维多利亚大学等教育机构都对语义网技术展开了广泛深入的研究,开发出了Jena
、KAON、Racer、Pellet、Protégé等一系列语义网技术开发应用平台、基于语义网技术的信息集成以及查询、推理和本体编辑系统。
我国也非常重视语义网的研究,早在2002年,语义网技术就被国家863计划列为重点支持项目,清华大学、东南大学、上海交通大学和中国人民大学都是国内语义网及其相关技术的研究中心。东南大学的语义网本体映射研究有一定的国际影响,清华大学的语义网辅助本体挖掘系统SWARMS、上海交通大学的本体工程开发平台ORIENT都代表了国内语义网研发水平。
语义网技术应用
语义网一开始就肩负着改造现有万维网的重任,它正在逐渐改变和影响我们现有的万维网。RSS、CC以及Powerset这些语义网支撑技术都让我们切实感受到了迎面扑来的语义Web之风,使我们普通用户享受到了语义网技术所带来的便捷,听到了它越来越近的脚步声。
RSS是目前最成功的以语义网支撑技术为基础的应用,是站点用来和其他站点共享内容的一种简易方式。用户只要安装RSS阅读器,它就会自动收集和组织用户定制的新闻,按照用户希望的格式、地点和时间直接传送到用户的计算机上。目前国内外大型门户网站如新浪、搜狐、网易等都支持RSS应用,标记为“XML”或“RSS”的橙色图标就是该网站支持RSS应用的记号。
知识共享(CC)版权识别是语义网技术的另一个现实应用。非营利性组织“知识共享组织”旨在为创造性作品提供灵活的著作权许可协议。2006年3月,中国大陆版CC发布。基于语义网支撑技术RDF的CC搜索引擎,能自动识别和理解作品版权信息,为用户合法使用具有不同级别的知识产权网络作品提供了极大方便,例如在线图片存储网站巴巴变(bababian.com)就已经集成了CC中国大陆版许可协议
,“巴巴变”的用户可以选择知识共享中国大陆项目提供的许可协议,授权他人使用自己拥有著作权的图片作品。
刚问世就被称为“Google杀手”的Powerset,则是巴尼•佩尔(Barney Pell)追逐的一个关于自然语言搜索引擎的梦想。38岁的佩尔认为,Google只能通过关键字来搜索,不能分辨“儿童看的书”、“儿童写的书”和“关于儿童的书”之间的区别,而自然语言引擎却能够分析“功能词”,理解哪怕是最小的关键词的意思。他相信Powerset搜索引擎很快就可以推向市场,成为语义网的催化剂。
除了上述语义网技术的成功应用外,目前有希望的语义网应用研究还集中在Web服务、基于代理的分布式计算以及基于语义的数字图书馆等方面。
语义网虽然是一种更加美好的网络,但实现起来却是一项复杂浩大的工程。毕竟决定技术发展方向的是用户体验,而不是理论。要真正实现实用的语义网,还有很多难题亟待解决,有些暂时还看不到解决的希望。语义网的研究开发基本上还停留在实验室阶段,基于成熟语义网技术的商业应用产品并不多见,但是,随着对语义网体系结构、支撑技术和实现方法的不断突破,基于语义网支撑技术的相关应用会日趋成熟,在不久的将来,计算机一定能看懂并处理网页中的内容,伯纳斯•李所期盼的人们将更方便快捷地使用万维网发布和获取信息的理想,也一定会成为现实。
人类的幸运之一便是在需要天才出现的时候,总会有天才出现推动我们前行。“万维网之父”蒂姆•伯纳斯•李(
Tim Berners-Lee)就是一个典型代表,他的“纯粹个人的劳动成果”改变了全球信息化的传统模式,带来了一个信息交流的全新时代,为互联网的全球化普及翻开了里程碑式的篇章。
但是随之而来的信息大爆炸,却让我们再次迷失了方向。互联网中海量的信息让我们有限的体力疲劳不已,常常花费了几个小时,输入了几百个关键词,点开了成千上万个网页,却依旧不能找到想要的信息。万维网的未来怎么办?在这个需要天才的时刻,伯纳斯•李再一次站了出来,提出了“语义网”这一概念。
什么是语义网
2001年5月,伯纳斯•李在《科学美国人》杂志上系统地论述了他对下一代万维网架构——语义网的设想。他认为:“语义网并非一个完全不同的万维网,而是现在万维网的一个延伸,是将现行万维网上的信息加以明确的语义定义,更利于人机之间的合作。”
简单地说,语义网是一种能理解人类语言的智能网络,它不但能够理解人类的语言,而且还可以使人与电脑之间的交流变得像人与人之间交流一样轻松。它好比一个巨型的大脑,智能化程度极高,协调能力非常强大。在语义网上连接的每一部电脑不但能够理解词语和概念,而且还能够理解它们之间的逻辑关系,可以干人所从事的工作。它将使人类从搜索相关网页的繁重劳动中解放出来,把用户变成全能的上帝。语义网中的计算机能利用自己的智能软件,在万维网上的海量资源中找到你所需要的信息,从而将一个个现存的信息孤岛发展成一个巨大的数据库。
下面这个场景就是语义网应用的一个典型案例:某天早上你突然想去可可西里旅游,于是你打开电脑,连通语义网,输入“预订今天下午两点到六点之间任意时刻的到可可西里的飞机票”,此刻你的计算机代理将先与你所住地点航空公司的代理进行联系,获得符合你要求的飞机票信息,然后联系航空公司的订票代理,完成订购。你不必像现在这样上网查看时间表,并进行拷贝和粘贴,然后打电话或在线预订机票和宾馆等,安装在你计算机上的软件会自动替你完成上述步骤,你所做的仅仅是用鼠标按几个按钮,然后等着送飞机票的人上门甚至直接去机场登机就可以了。
总之,语义网是一种更丰富多彩、更个性化的网络,是对万维网本质的变革。它可以帮助你滤掉你不喜欢的内容,使得网络更像是你自己的网络。
语义网研究现状
我们知道,大部分科技创新和突破是对已有知识的重新组合和更新,具有对网络空间所储存的数据进行智能评估能力的语义网,必然会为新的科技创新提供无尽的资源。一旦这种技术被广泛运用,其产生的效益无可估量。因此,语义网从诞生之日起,便成为计算机研究的热点领域。
W3C组织(World Wide Web Consortium)是语义网主要的推动者和标准制定者,在它的呵护之下,语义网技术羽翼渐丰。2001年7月30日,美国斯坦福大学召开了题为“语义网基础设施和应用”的学术会议,这是有关语义网的第一个国际会议。2002年7月9日,第一届国际语义网大会在意大利召开。此后语义网大会每年举行一次,形成惯例。同时,HP、IBM、微软、富士通等大公司,斯坦福大学、马里兰大学、德国卡尔斯鲁厄大学、英国曼彻斯特维多利亚大学等教育机构都对语义网技术展开了广泛深入的研究,开发出了Jena
、KAON、Racer、Pellet、Protégé等一系列语义网技术开发应用平台、基于语义网技术的信息集成以及查询、推理和本体编辑系统。
我国也非常重视语义网的研究,早在2002年,语义网技术就被国家863计划列为重点支持项目,清华大学、东南大学、上海交通大学和中国人民大学都是国内语义网及其相关技术的研究中心。东南大学的语义网本体映射研究有一定的国际影响,清华大学的语义网辅助本体挖掘系统SWARMS、上海交通大学的本体工程开发平台ORIENT都代表了国内语义网研发水平。
语义网技术应用
语义网一开始就肩负着改造现有万维网的重任,它正在逐渐改变和影响我们现有的万维网。RSS、CC以及Powerset这些语义网支撑技术都让我们切实感受到了迎面扑来的语义Web之风,使我们普通用户享受到了语义网技术所带来的便捷,听到了它越来越近的脚步声。
RSS是目前最成功的以语义网支撑技术为基础的应用,是站点用来和其他站点共享内容的一种简易方式。用户只要安装RSS阅读器,它就会自动收集和组织用户定制的新闻,按照用户希望的格式、地点和时间直接传送到用户的计算机上。目前国内外大型门户网站如新浪、搜狐、网易等都支持RSS应用,标记为“XML”或“RSS”的橙色图标就是该网站支持RSS应用的记号。
知识共享(CC)版权识别是语义网技术的另一个现实应用。非营利性组织“知识共享组织”旨在为创造性作品提供灵活的著作权许可协议。2006年3月,中国大陆版CC发布。基于语义网支撑技术RDF的CC搜索引擎,能自动识别和理解作品版权信息,为用户合法使用具有不同级别的知识产权网络作品提供了极大方便,例如在线图片存储网站巴巴变(bababian.com)就已经集成了CC中国大陆版许可协议
,“巴巴变”的用户可以选择知识共享中国大陆项目提供的许可协议,授权他人使用自己拥有著作权的图片作品。
刚问世就被称为“Google杀手”的Powerset,则是巴尼•佩尔(Barney Pell)追逐的一个关于自然语言搜索引擎的梦想。38岁的佩尔认为,Google只能通过关键字来搜索,不能分辨“儿童看的书”、“儿童写的书”和“关于儿童的书”之间的区别,而自然语言引擎却能够分析“功能词”,理解哪怕是最小的关键词的意思。他相信Powerset搜索引擎很快就可以推向市场,成为语义网的催化剂。
除了上述语义网技术的成功应用外,目前有希望的语义网应用研究还集中在Web服务、基于代理的分布式计算以及基于语义的数字图书馆等方面。
语义网虽然是一种更加美好的网络,但实现起来却是一项复杂浩大的工程。毕竟决定技术发展方向的是用户体验,而不是理论。要真正实现实用的语义网,还有很多难题亟待解决,有些暂时还看不到解决的希望。语义网的研究开发基本上还停留在实验室阶段,基于成熟语义网技术的商业应用产品并不多见,但是,随着对语义网体系结构、支撑技术和实现方法的不断突破,基于语义网支撑技术的相关应用会日趋成熟,在不久的将来,计算机一定能看懂并处理网页中的内容,伯纳斯•李所期盼的人们将更方便快捷地使用万维网发布和获取信息的理想,也一定会成为现实。