论文部分内容阅读
Shunsaku中文名称为:瞬索,是富士通公司推出的创新产品,解决了以关系数据库为核心的现存技术所难以解决的”设计阶段的性能保障、削减开发成本、运行简单”等问题。瞬索把到目前为止不能利用的不同种类或形式的数据群统一为XML型数据,使信息得到快速有效的利用。它还适用于在现存系统中要求对查询性能进行改善和实现高速查询的领域。使用瞬索不需要对在不同的事业单位或部门进行单独管理的数据进行重构,而是将其XML化后,快速地进行统一和联合,实现跨越多个系统的信息系统构筑。
1.工作原理
Shunsaku(瞬索)是由两种服务器构成的XML型数据库。这两种服务器是:把查询对象的数据作为XML型数据进行储存,受理查询要求,并进行访问文件管理和结果应答的“主导服务器”,接受主导服务器的要求,实行高速查询处理的引擎部分的”搜索服务器”。瞬索还采用了高密度型的服务器——“刀锋服务器”,以保证性能和降低成本。刀锋服务器是指在同一个机箱中,装入多个具有服务器功能的板状物(刀锋服务器),数据可以被分散到这些刀锋服务器上进行并列处理。这样,能够根据数据规模简单地进行扩展,实现了以低成本获取高可靠性的服务器系统。构成刀锋服务器的最小查询单位是一片一片的刀锋。Linux/Windows版的Shunsaku(瞬索)可以把主导服务器和搜索服务器配置在同一个服务器中。因为Shunsaku(瞬索)是由这些不同形式的、高性能的系统所构成,所以它可以灵活对应从低端(MB)到高端(TB)的数据,快速构筑起“对来自现场的第一手信息进行有效利用”的体系。
2.核心技术
SIGMA技术:Shunsaku(瞬索)使用的SIGMA查询技术,无论查询关键词有多少个,都能通过SIG-MA技术把这些关键词合成起来生成自动过滤筛。它对查询对象数据依次进行匹配,并读入符合查询条件的数据。采用这个技术的优势在于:无论查询条件多么复杂,也与只有一个查询条件的时候一样,只要对所有查询对象数据进行一次查询处理,就能实现无遗漏的、稳定的查询。 高速多载运行技术:所谓高速多载运行技术是指在使用者多、查询要求量大的情况下,也能保证稳定的查询性能的技术。采用高速多载运行技术的优点在于:可以有效降低由于访问高峰出现而对系统造成的影响。这种技术,就好像将信息高速公路的单行线,转变成为动态变化的并行线,大大提高了系统的效率和使用率。这与以往使用RDB的查询系统相比,效果更好。
刀锋服务器的有效利用技术:刀锋服务器的有效利用技术是指在查询处理时,数据自动地分散到多个刀锋服务器上同时进行并列处理,所以,即使是在处理大量的数据时也能保证稳定的查询,性能。Shunsaku(瞬索)通过使用SIGMA技术和高速多载运行技术,可以在各种情况下保证稳定的查询性能,只要将数据分散到各个CPU(刀锋服务器)上,通过这些CPU(刀锋服务器)的同时运作,就可以实现全CPU的同时查询处理。也就是说,当CPU(刀锋服务器)数增加为两倍时,查询性能也增长为原来的两倍。利用刀锋服务器技术,只要根据查询数据量和查询时间的要求,简单地增设CPU(刀锋服务器),就能使性能得到保证。
3.应用现状及前景展望
“瞬索”自2003年正式推出,就受到很大关注,并在市场应用上取得较大认同。基于“瞬索XML数据搜索引擎”,企业可以轻松进行信息整合、应对海量数据搜索和构建知识管理系统、内容管理系统,从而加速传统业务系统,并且大幅度削减TCO(总体拥有成本)。2004年10月27日,在由“计算机世界方案评析实验室”主办的“优秀中间件解决方案”评选中,“瞬索”获得了“优秀中间件方案设计奖”。
“瞬索”在很多行业都已经有成功案例,如房地产、网站、铁路、媒体、银行和保险等。日本九州大学的开发“大学评估信息系统”就采用了“瞬索XML数据搜索引擎”。由于“瞬索”底层采用“XML数据仓库”,能够处理各种变化的信息,而不需要考虑数据库设计和调优的问题。当向系统导入数据时,用户只需向系统中堆积尽可能多的数据,根本不需要考虑其他问题。2003年7月至9月,日本三洋房产有限公司采用”瞬索”快速开发出基于互联网的房屋户型平面图检索系统,其响应时间比以前的搜索系统快了近10倍,优化了销售流程。2004年2月韩国书店联盟采用“瞬索XML数据搜索引擎”构建了图书搜索系统,新系统比旧系统快了5倍,无论搜索条件多么复杂,都可以在3秒内显示结果。据统计,到目前为止,“瞬索”全球的成功案例已经有50例左右,还有300多个项目在商谈中,更多的用户在试用。
“瞬索”在数字化要求较高的行业有广泛的应用前景。据权威机构Jupiter Research的报告所示,各行业所产生的各种数据每6—8个月便以双倍或更快的速率增加。这些信息都是企业的宝贵财产,庞大繁琐的数据,带给企业和客户更多的是困惑。而且,信息技术越来越复杂,项目预算越来越庞大,系统一旦定型,要改变就非常困难。随着信息化市场的不断成熟和XML技术的发展,用户对企业中的结构化和非结构化的信息资源的搜索、分析越来越重视,因此,”瞬索XML数据搜索引擎”有着广阔的市场前景。
参考文献
1 郭瑞华.XML数据库技术.现代图书情报技术,2004(9)
2 赵铭.“瞬索”技术使搜索引擎摆脱束缚.中国计算机报,2004—12一01
3“瞬索”捞针于数字大海.网络世界,2004—12—20
4 XML解决利用数据难题.每周电脑报,2004—11—2
5 富士通“瞬索”亮相中国http://cn.fujitsu.com/it/news/2004—9—22.htm
6 厂商推动瞬间搜索海量数据每周电脑报,2004—11—01 (作者单位:陈丽香 华东师范大学商学院 上海 200062
郭一翔 天津工业大学通信学院 天津 300160)
1.工作原理
Shunsaku(瞬索)是由两种服务器构成的XML型数据库。这两种服务器是:把查询对象的数据作为XML型数据进行储存,受理查询要求,并进行访问文件管理和结果应答的“主导服务器”,接受主导服务器的要求,实行高速查询处理的引擎部分的”搜索服务器”。瞬索还采用了高密度型的服务器——“刀锋服务器”,以保证性能和降低成本。刀锋服务器是指在同一个机箱中,装入多个具有服务器功能的板状物(刀锋服务器),数据可以被分散到这些刀锋服务器上进行并列处理。这样,能够根据数据规模简单地进行扩展,实现了以低成本获取高可靠性的服务器系统。构成刀锋服务器的最小查询单位是一片一片的刀锋。Linux/Windows版的Shunsaku(瞬索)可以把主导服务器和搜索服务器配置在同一个服务器中。因为Shunsaku(瞬索)是由这些不同形式的、高性能的系统所构成,所以它可以灵活对应从低端(MB)到高端(TB)的数据,快速构筑起“对来自现场的第一手信息进行有效利用”的体系。
2.核心技术
SIGMA技术:Shunsaku(瞬索)使用的SIGMA查询技术,无论查询关键词有多少个,都能通过SIG-MA技术把这些关键词合成起来生成自动过滤筛。它对查询对象数据依次进行匹配,并读入符合查询条件的数据。采用这个技术的优势在于:无论查询条件多么复杂,也与只有一个查询条件的时候一样,只要对所有查询对象数据进行一次查询处理,就能实现无遗漏的、稳定的查询。 高速多载运行技术:所谓高速多载运行技术是指在使用者多、查询要求量大的情况下,也能保证稳定的查询性能的技术。采用高速多载运行技术的优点在于:可以有效降低由于访问高峰出现而对系统造成的影响。这种技术,就好像将信息高速公路的单行线,转变成为动态变化的并行线,大大提高了系统的效率和使用率。这与以往使用RDB的查询系统相比,效果更好。
刀锋服务器的有效利用技术:刀锋服务器的有效利用技术是指在查询处理时,数据自动地分散到多个刀锋服务器上同时进行并列处理,所以,即使是在处理大量的数据时也能保证稳定的查询,性能。Shunsaku(瞬索)通过使用SIGMA技术和高速多载运行技术,可以在各种情况下保证稳定的查询性能,只要将数据分散到各个CPU(刀锋服务器)上,通过这些CPU(刀锋服务器)的同时运作,就可以实现全CPU的同时查询处理。也就是说,当CPU(刀锋服务器)数增加为两倍时,查询性能也增长为原来的两倍。利用刀锋服务器技术,只要根据查询数据量和查询时间的要求,简单地增设CPU(刀锋服务器),就能使性能得到保证。
3.应用现状及前景展望
“瞬索”自2003年正式推出,就受到很大关注,并在市场应用上取得较大认同。基于“瞬索XML数据搜索引擎”,企业可以轻松进行信息整合、应对海量数据搜索和构建知识管理系统、内容管理系统,从而加速传统业务系统,并且大幅度削减TCO(总体拥有成本)。2004年10月27日,在由“计算机世界方案评析实验室”主办的“优秀中间件解决方案”评选中,“瞬索”获得了“优秀中间件方案设计奖”。
“瞬索”在很多行业都已经有成功案例,如房地产、网站、铁路、媒体、银行和保险等。日本九州大学的开发“大学评估信息系统”就采用了“瞬索XML数据搜索引擎”。由于“瞬索”底层采用“XML数据仓库”,能够处理各种变化的信息,而不需要考虑数据库设计和调优的问题。当向系统导入数据时,用户只需向系统中堆积尽可能多的数据,根本不需要考虑其他问题。2003年7月至9月,日本三洋房产有限公司采用”瞬索”快速开发出基于互联网的房屋户型平面图检索系统,其响应时间比以前的搜索系统快了近10倍,优化了销售流程。2004年2月韩国书店联盟采用“瞬索XML数据搜索引擎”构建了图书搜索系统,新系统比旧系统快了5倍,无论搜索条件多么复杂,都可以在3秒内显示结果。据统计,到目前为止,“瞬索”全球的成功案例已经有50例左右,还有300多个项目在商谈中,更多的用户在试用。
“瞬索”在数字化要求较高的行业有广泛的应用前景。据权威机构Jupiter Research的报告所示,各行业所产生的各种数据每6—8个月便以双倍或更快的速率增加。这些信息都是企业的宝贵财产,庞大繁琐的数据,带给企业和客户更多的是困惑。而且,信息技术越来越复杂,项目预算越来越庞大,系统一旦定型,要改变就非常困难。随着信息化市场的不断成熟和XML技术的发展,用户对企业中的结构化和非结构化的信息资源的搜索、分析越来越重视,因此,”瞬索XML数据搜索引擎”有着广阔的市场前景。
参考文献
1 郭瑞华.XML数据库技术.现代图书情报技术,2004(9)
2 赵铭.“瞬索”技术使搜索引擎摆脱束缚.中国计算机报,2004—12一01
3“瞬索”捞针于数字大海.网络世界,2004—12—20
4 XML解决利用数据难题.每周电脑报,2004—11—2
5 富士通“瞬索”亮相中国http://cn.fujitsu.com/it/news/2004—9—22.htm
6 厂商推动瞬间搜索海量数据每周电脑报,2004—11—01 (作者单位:陈丽香 华东师范大学商学院 上海 200062
郭一翔 天津工业大学通信学院 天津 300160)