Internet与非结构化数据库

来源 :互联网世界 | 被引量 : 0次 | 上传用户:kong26
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  非结构化数据库是由我国著名学者吴广印针对关系数据库模型过于简单,不便表达复杂的嵌套需要以及支持数据类型有限等局限,从数据模型入手而提出的全面基于Internet的新型应用数据库理论。
  非结构化数据库理论认为:在信息社会,所有信息大体上可以分为两类。一类信息能够用数据或统一的结构加以表示,我们称之为结构化数据,如数字、符号;而另一类信息根本无法用数字或者统一的结构表示,例如,文本、图象、声音乃至网页等,我们称之为非结构化数据。非结构化数据包括结构化数据,但又不止是结构化数据;结构化数据属于非结构化数据,是非结构化数据的特例。一般来说,在人们的认识之中,关系数据库处理的对象最主要的特征就是数据的结构化。
  然而,随着网络技术和软件技术的飞速发展,特别是Internet和Intranet技术的发展,使得非结构化数据的应用日趋扩大。擅长于处理结构化数据的关系数据库随着随着非结构化数据应用领域的不断拓展,开始暴露出越来越多的局限。特别是关系数据库对数据类型的处理只局限于数字、字符等,对非结构化信息的处理只是停留在简单的二进制代码文件的存储,已经不适应用户从简单的存储上升为识别、检索和深入加工的要求;而基于Internet的应用尤其使关系数据库相形见绌。因而数据库技术也相应进入了“后关系数据库时代”,发展进入基于网络应用的非结构化数据库时代。
  非结构化数据库以北京国信贝斯(iBASE)软件有限公司的iBASE数据库为代表。它从数据模型入手,采用子字段、多值字段以及变长字段的机制,允许创建许多不同类型的非结构化或者说任意格式的字段,从而突破关系数据库非常严格的表结构,解决了关系数据库模型过于简单,不便表达复杂嵌套的问题;同时iBASE数据库将所有数据管理纳入资源管理范畴,将所有数据定义为可管理的资源,通过iBASE的资源管理器实现对各种复杂数据的管理,以数据库管理系统为代表的非结构化数据库是国信贝斯拥有自主版权的专门处理非结构化信息、全文信息、多媒体信息和其它海量信息的数据库管理系统。非结构化数据库区别于传统的其它数据库之处,在于它将所有数据定义为资源,而这一资源可以是网页、文本、与字处理文档类似或者就是整个关系数据库。通过对资源的管理,非结构化数据库实现数据库系统从数据管理到内容管理的转化。
  具体说来,同关系数据库相比,非结构化数据库系统的特点主要反映在以下方面:
  1.iBASE 数据库系统的数据库结构定义是相对灵活的,解决了变长字段和重复字段的定义问题,使一个字段可以存贮变长的信息,但是却能通过特有的索引技术实现对指定字段的检索。iBASE 数据库大部分数据项的内容长度变化较大,因此要求变长存储管理。iBASE 数据库的一些数据项具有多值性。
  2.iBASE数据库在数据注录格式方面,有国际标准(ISO-2709,MARC,CCF)和国内标准(CCFC)格式。这些格式对于数据库标准化和数据交换与共享是十分重要的。这些标准要求数据项中可包含数据子项(子字段),文献数据库管理系统必需支持子字段的处理。
  3.文献数据库在数据查询方面要求较高,iBASE数据库不仅能够对整个字段查询,要求子字段、关键词、自由词、标引词、位置词和全文任意词的单项及组配检索。
  4.iBASE数据库处理的对象多为海量数据,不仅检索功能强而且检索速度快,在检索速度方面一般不受文献量(上千万条记录)的影响。
  5.数据库的查全率和查准率是评价文献数据库系统的重要指标。所谓查准率指的命中文献和查询条件的匹配准确程度,查全率是指命中结果相对整个数据库的内容是否全面。iBASE数据库提供了ANY词检索方式,这也是一种特定的相关检索。用户只要定义好一个ANY词检索文件,比如“计算机、电子计算机、电脑、微机、586计算机等”,那么用户一旦用“计算机”进行检索,iBASE数据库就可以把数据库中所有包含“计算机、电子计算机、电脑等”信息的记录查询到,提高了查全率,同时iBASE 数据库支持的禁用词,可以过滤掉一些没有检索意义的英文虚词如“I、TO”等以提高查准率。
  6.iBASE数据库在输出时,格式复杂且变化多,数据库管理系统提供方便简单的手段来满足用户的需求。iBASE数据库自有的格式化语言允许用户自定义各种输入输出报表格式,允许按照不同方式进行排序,生成用户需要的报表。


  
  近年来网络体系结构经历了一次次重大变迁,客户机/服务器结构越来越流行了,Internet以惊人的速度在短短一年内迅速蔓延,面临新的格局,如何简易地实现“客户机/服务器”连接与“Web/Intranet”连接成为数据库管理人员关注的焦点。
  目前,在Web上一个典型的数据库应用程序应包括三个部分:Web浏览器、HTTP服务器和Web数据库服务器。对于一般的关系型数据库,实现Web数据库的应用通常有两种方法:一种是Web服务器提供中间件连接Web服务器与数据库服务器;另一种是把应用程序下载到客户端直接访问数据库。难道就没有一个开发相对容易、功能强大且高效的Web数据库的开发方法吗?
  有,答案是——iBASE。基于Web是一个广域网的海量数据库的思想,国信贝斯的iBase 提供一个网上资源管理系统iBASE WEB。利用非结构化数据库全部基于Internet的数据库结构模型,采用网络服务器(Web Server)和数据库服务器(iBase Server)紧密集成的方法,将目前传统数据库厂商由C/S结构扩展来的浏览器/Web服务器+应用服务器/数据库服务器的三层体系结构,集成为浏览器/iBASE WEB式的Internet计算结构,使数据库系统成为Internet的一个重要有机组成部分,实现在单一平台上融合所有数据库和应用服务器的功能。这不仅大大减少了用户对额外硬件、中间件和其它昂贵的集成业务需求,而且极大的缩短了用户开发和采用基于Internet应用的时间;也正是采用这种集成技术,与其他数据库厂商的Internet解决方案相比,iBASE Web具有集成性强、简单易用、检索效率高、易于管理维护、总拥有费用低(包括系统购置、二次开发、管理维护等费用)等竞争优势,给用户提供了一个强大的Internet解决方案平台。


  
  近五年里,用户的选型观念发生了明显的改变,有更多的用户把数据库的重要性放在十分重要的地位,其主要原因是用户将把应用软件和应用需求放在首位,应用软件是否满足用户需求是整个项目是否成功的标志,而应用软件开发直接依赖于数据库开发工具。正是用户需求的这种变化给数据库厂商提供了新的发展机会。iBASE为各数据库系统集成商提供了强大的数据库开发平台,iBASE结合了企业级电子邮件、分布式文档数据库与快速应用开发等三位一体的强大技术、完全集成了Internet技术,提供用户完整的,以网络为中心的应用技术平台。完全可以预言,在不久的将来,完全基于Internet 应用的非结构化数据库将成为继层次数据库、网状数据库和关系数据库之后的又一热点技术。
其他文献
采访中国科学技术信息研究所所长兼万方数据公司总裁朱伟之前,没想到这次采访会是如此轻松愉快。朱伟更象一个务实高效的学者,没有国有企业当家人身上那种不可一世的霸气。但他脑子里充满了理论和规则,大到企业的经营战略,小到员工的后顾之忧,他都能象计算化学反应式一样一步步地表述出来,其间会告诉你促成这种反应的介质是加热还是光照。  其实,对万方数据进行股份制改造,加快创新步伐就是给国有企业加热,让她发光的过程
期刊
想要极品的黄金装备,不用说了就是魄力+耐心+财力=极品,三者缺一不可。笔者不论在游戏还是论坛上,经常都可以看到玩家关于如何打造黄金装备的讨论,以下是我的一些经验拿出来和大家共享,希望能够帮助大家提高打造成功的几率,不过……暴了的话千万不要鄙视偶啊,谁还没有个失手的时候:)
期刊
“Copyright”、“Internet”和“网上版权”     “网上版权”实际上指的是“网上作品的版权”。 “Copyright”一词指的是“著作权”或“版权”。确切地说是“一件‘作品’的所有权和用各种可能手段复制该作品的支配权……著作权保护涉及文学、戏曲和艺术作品(绘画、图画、照片等)、录音、影片、电影和广播,以及各种新技术创作品。”(《剑桥百科全书》)。国际互联网(Internet)是近
期刊
《大话西游Ⅱ》练功区出现的所有怪物,都可以被玩家捕捉而成为玩家的宠物——“召唤兽”,它们是玩家的左膀右臂,而且任劳任怨,招之即来挥之即去,其威力可不容小视哦。
期刊
古人王维在《中南别业》里的一句“行至水穷处,坐看云起时”成了他亦官亦隐的生活写照。采访完中公网的谢文,笔者头脑中清晰地想到这句话。现在正是中国互联网产业对上市无限渴望、对电子商务大加炒作、大谈特谈注意力经济的时候。然而,中公网和谢文,却是全然一派恬静安淡……    互联网产业是中长跑,仅有冲刺是不够的    中公网是由中海恒实业公司和信息产业部数据网络开发中心共同出资,于1997年10月成立。在公
期刊
上月初,一线通(ISDN)飓风行动——应用解决方案全国巡展在北京拉开帷幕。此次活动由中国邮电电信总局、思科(中国)公司和上海贝尔联合主办。巡展一共九站,除北京外还有上海、广州、大连、成都、深圳、福州、武汉、南京等地,活动将于五月底结束。为配合这次活动,北京市电信管理局在北京推出了优惠套餐活动:自1月5日起,北京地区新装或改装“一线通”业务的用户,前两万名将免费获赠NTIPLUS或NT1,并赠送价值
期刊
瀛海威这个名字,连同它所具有的服务能力与品牌价值在中国网络信息服务业的历史上有着里程碑式的地位,如同它当年在北京白石桥路口树立起的广告牌——“中国人离信息高速公路还有多远——向北1500米”一样,具有不可磨灭地启动背景市场的作用。然而1998年以来随着其前任经营者与一批管理人员的离职,瀛海威沉默了,但就在人们几乎就要把她遗忘时,瀛海威完成了自身的改造并对未来发展前景提出了一整套业务转型与创新策略。
期刊
一、 引言    随着Internet/Intranet的讯速发展,WEB得到了越来越广泛的应用,WWW页面已由静态网页逐渐发展为动态的交互式网页,如何更好地实现与用户的交互就成为非常迫切的问题。解决这一问题的方法之一就是实现数据库与Internet/Intranet 应用软件的集成。基于WEB的数据库应用,就是将数据库和WEB技术结合,按照Browser/Server结构建立的通过浏览器访问数据
期刊
期刊
据估计,世界上将近90%的信息存储在诸如Web站点、文件系统、层状数据库、网状数据库和已有的应用程序等非关系型数据库中。这些数据源的区别在于它们的数据组织方式、使用的符号集以及数据的存取和查询机制。这些区别为不同数据源的数据集成带来了困难。虚拟数据库(VDB)技术使外部数据源成为企业的关系数据库系统的外延。使用VDB技术,应用程序可以提供对分散在各类原始数据源中的数据进行访问的服务。VDB收集、组
期刊