论文部分内容阅读
[摘 要] 在文件系统阶段,数据以文件的形式长期保存在计算机上,而且有专门的软件对其进行管理,可以实现文件的创建、查询、修改、删除等操作。由于数据长驻外存,因此可以由-个或多个应用程序反复使用,程序与数据之间具有一定的独立性。数据库系统解决了文件系统的弊端,,它使用一个软件系统来集中管理所有数据,从而实现了数据共享,解决了数据的安全性、完整性等问题。数据库系统下的用户不必了解数据存储的细节,他可以逻辑地、抽象地使用数据,一切烦琐的存储细节都中数据库系统核心来完成,这个核心就是DBMS。
[关键词] 计算机 数据库 数据 模式
在文件系统阶段,数据以文件的形式长期保存在计算机上,而且有专门的软件对其进行管理,可以实现文件的创建、查询、修改、删除等操作。由于数据长驻外存,因此可以由—个或多个应用程序反复使用,程序与数据之间具有一定的独立性。但文件系统只是部分体现了数据项之间的联系,一些较高层次的数据联系仍要通过应用程序体现,因此文件系统下的用户需要对他的文件的物理存储细节有一定的了解,这增加了用户使用数据的难度。此外,文件数量的增加也会给数据管理带来相当的难度,因为多个文件缺乏统一的管理机构,难以保证其整体的安全性和完整性。
数据库系统与文件系统有一个重要区别,前者是体现更高层次的数据联系,也就是实体与实体之间的联系。我们把表示这种联系的模型叫做数据模型。由此可给数据模型下一个定义:数据模型是描述记录与记录之间,即信息世界中实体之间的联系,是数据库的数据结构(全局性的逻辑结构)。数据模型是数据库系统中的一个关键的概念;它的演变也正好反映了三种数据库系统的发展过程。
数据库系统解决了文件系统的弊端,,它使用一个软件系统来集中管理所有数据,从而实现了数据共享,解决了数据的安全性、完整性等问题。数据库系统下的用户不必了解数据存储的细节,他可以逻辑地、抽象地使用数据,一切烦琐的存储细节都中数据库系统核心来完成,这个核心就是DBMS。
一、层次模型
用树形结构表示实体之间联系的模型,称为层次模型。一棵树由节点和连线组成,节点代表实体集,连线代表实体之间的关系。层次模型一般只能表示一对多关系,层次模型实际上是一棵倒置的树,树的根,称为父节点,它可以有一个或多个子节点,但一个子节点仅能与一个父节点相连。同时与一个或多个子节点相连的节点,又称为中间(子)节点。没有子节点的节点,称为叶层次模型是数据库系统中最早出现的数据模型,具有构造简单、层次清晰等优点,但在表达多对多关系时,需要设法将该关系分解为两个一对多关系,这是它的局限性。层次模型的典型代表是IBM公司的IMS系统。它在1968年问世,是世界上第一个DBMS,曾一度在美国商用市场上广泛使用。在这以后又出现了许多层次模型的DBMS,如SYSTEM2000等。
二、网络模型
用网状结构表示实体与实体之间联系的模型,称为网络模型。网络模型的表示方法.与层次模型是类似的,即以节点代表实体集,连线代表实体之间的联系联系,但网络模型取消了层次模型中节点之间的层次限制,因此它所表示的实体关系更为一般,更为普遍。我们也可以把层次模型看做是网络模型的—种特例。
從表面上看,它似乎具有层次的特点,但它并不满足树型结构的约束,因为部门一雇员、技能一雇员都是一对多的关系,这样雇员节点就有多于一个的父节点。此外,让我们来考察一下另外一个更为一般的关系。
工作—雇员是一个多对多的关系,而多对多关系是层次模型所不能直接表达的,因此结构不能看做层次模划。如果我们对照一下右侧所示的实体特定值之间的结构,这一点就不难理解了。判断一个数据模型不能单看模型本身,还要从具体值上看,这也是非常重要的“型”与“值”的概念。
第一个采用网络模型的DBMS是TOTAl,,它出现在1968年。3年之后,美国CODASYL
组织的DBTG小组正式公布了DBTG报告,其目的是使得网络模型的系统研制规范化。在这个报告的准则指导下,计算机厂商们又研制了许多基于DBTG的DBMS,如IDMS、IDS等。
三、关系模型
用二维表结构来表示实体之间联系的模型,称为关系模型。关系模型的表示方法与前两者截然不同。在层次、网状模型中,实体间的联系是通过指针来实现的中,它类似于环的功能,把有联系的实体一个个链接起来。而关系模型是用表格数据来表示和实现实体间的联系,也就是说,是由数据本身自然地建立起它们之间的联系。
二维数据库理论中称为关系,它们构成一个教学管理系统中的数据库。因为它是用关系来组织数据的,所以称它为关系数据库。从学生的姓名或学号可以查到所选课程、任课教师和得到分数,这样的查询过程实际上是一个关系代数操作。关系代数和关系演算的理论正是关系模型相对于前面两种模型的最大长处。
四、三种数据模型的比较
(1)层次和网状数据库系统的设计和研制仅凭设计者的经验和技术,而关系数据库系统的设计和研制已有理论指导,建立在关系代数和规范化的理论基础上。
(2)使用层次和网状模型的数据库时,要求用户既要了解记录类型存取路径,又要了解它们之间的相互关系,这就增加了用户负担;而关系数据库仪是一些表格,结构简单,用户使用方便。
(3)层次和网状模型不能直接处理多对多关系,关系模型可以直接处理多对多关系。
(4)就系统的实现和存取效率而言,层次和网状模型都优于关系模型。但近年来,关系模型的查询和优化技术的研究取得了很大进展,使效率大大提高,有些系统已接近层次和网状数据模型系统。
总之,随着关系理论的逐步完善,许多国家都把重点转移到关系模型DBMS的研制和开发上,比较具代表性的原型系统有美同IBM公司的SYSTEMR、德国斯图加特大学的POREL,著名的商品化数据库有Ingrcs、Oracle、Sybase等。
我们必须认识到,数据库不是对现实世界建模,而是对用户关于其业务环境的模型建模。判断一个数据模型好坏的合适准则是看它是否与用户模型吻合,争论哪一个模型最符合现实世界是没有意义的。
参 考 文 献
[1]王炽鸿。计算机辅助设计[M]。北京:机械工业出版社,1998。
[2]丁剑洁,基于度量的软件维护过程管理的研究[D],西北大学,2006■
[关键词] 计算机 数据库 数据 模式
在文件系统阶段,数据以文件的形式长期保存在计算机上,而且有专门的软件对其进行管理,可以实现文件的创建、查询、修改、删除等操作。由于数据长驻外存,因此可以由—个或多个应用程序反复使用,程序与数据之间具有一定的独立性。但文件系统只是部分体现了数据项之间的联系,一些较高层次的数据联系仍要通过应用程序体现,因此文件系统下的用户需要对他的文件的物理存储细节有一定的了解,这增加了用户使用数据的难度。此外,文件数量的增加也会给数据管理带来相当的难度,因为多个文件缺乏统一的管理机构,难以保证其整体的安全性和完整性。
数据库系统与文件系统有一个重要区别,前者是体现更高层次的数据联系,也就是实体与实体之间的联系。我们把表示这种联系的模型叫做数据模型。由此可给数据模型下一个定义:数据模型是描述记录与记录之间,即信息世界中实体之间的联系,是数据库的数据结构(全局性的逻辑结构)。数据模型是数据库系统中的一个关键的概念;它的演变也正好反映了三种数据库系统的发展过程。
数据库系统解决了文件系统的弊端,,它使用一个软件系统来集中管理所有数据,从而实现了数据共享,解决了数据的安全性、完整性等问题。数据库系统下的用户不必了解数据存储的细节,他可以逻辑地、抽象地使用数据,一切烦琐的存储细节都中数据库系统核心来完成,这个核心就是DBMS。
一、层次模型
用树形结构表示实体之间联系的模型,称为层次模型。一棵树由节点和连线组成,节点代表实体集,连线代表实体之间的关系。层次模型一般只能表示一对多关系,层次模型实际上是一棵倒置的树,树的根,称为父节点,它可以有一个或多个子节点,但一个子节点仅能与一个父节点相连。同时与一个或多个子节点相连的节点,又称为中间(子)节点。没有子节点的节点,称为叶层次模型是数据库系统中最早出现的数据模型,具有构造简单、层次清晰等优点,但在表达多对多关系时,需要设法将该关系分解为两个一对多关系,这是它的局限性。层次模型的典型代表是IBM公司的IMS系统。它在1968年问世,是世界上第一个DBMS,曾一度在美国商用市场上广泛使用。在这以后又出现了许多层次模型的DBMS,如SYSTEM2000等。
二、网络模型
用网状结构表示实体与实体之间联系的模型,称为网络模型。网络模型的表示方法.与层次模型是类似的,即以节点代表实体集,连线代表实体之间的联系联系,但网络模型取消了层次模型中节点之间的层次限制,因此它所表示的实体关系更为一般,更为普遍。我们也可以把层次模型看做是网络模型的—种特例。
從表面上看,它似乎具有层次的特点,但它并不满足树型结构的约束,因为部门一雇员、技能一雇员都是一对多的关系,这样雇员节点就有多于一个的父节点。此外,让我们来考察一下另外一个更为一般的关系。
工作—雇员是一个多对多的关系,而多对多关系是层次模型所不能直接表达的,因此结构不能看做层次模划。如果我们对照一下右侧所示的实体特定值之间的结构,这一点就不难理解了。判断一个数据模型不能单看模型本身,还要从具体值上看,这也是非常重要的“型”与“值”的概念。
第一个采用网络模型的DBMS是TOTAl,,它出现在1968年。3年之后,美国CODASYL
组织的DBTG小组正式公布了DBTG报告,其目的是使得网络模型的系统研制规范化。在这个报告的准则指导下,计算机厂商们又研制了许多基于DBTG的DBMS,如IDMS、IDS等。
三、关系模型
用二维表结构来表示实体之间联系的模型,称为关系模型。关系模型的表示方法与前两者截然不同。在层次、网状模型中,实体间的联系是通过指针来实现的中,它类似于环的功能,把有联系的实体一个个链接起来。而关系模型是用表格数据来表示和实现实体间的联系,也就是说,是由数据本身自然地建立起它们之间的联系。
二维数据库理论中称为关系,它们构成一个教学管理系统中的数据库。因为它是用关系来组织数据的,所以称它为关系数据库。从学生的姓名或学号可以查到所选课程、任课教师和得到分数,这样的查询过程实际上是一个关系代数操作。关系代数和关系演算的理论正是关系模型相对于前面两种模型的最大长处。
四、三种数据模型的比较
(1)层次和网状数据库系统的设计和研制仅凭设计者的经验和技术,而关系数据库系统的设计和研制已有理论指导,建立在关系代数和规范化的理论基础上。
(2)使用层次和网状模型的数据库时,要求用户既要了解记录类型存取路径,又要了解它们之间的相互关系,这就增加了用户负担;而关系数据库仪是一些表格,结构简单,用户使用方便。
(3)层次和网状模型不能直接处理多对多关系,关系模型可以直接处理多对多关系。
(4)就系统的实现和存取效率而言,层次和网状模型都优于关系模型。但近年来,关系模型的查询和优化技术的研究取得了很大进展,使效率大大提高,有些系统已接近层次和网状数据模型系统。
总之,随着关系理论的逐步完善,许多国家都把重点转移到关系模型DBMS的研制和开发上,比较具代表性的原型系统有美同IBM公司的SYSTEMR、德国斯图加特大学的POREL,著名的商品化数据库有Ingrcs、Oracle、Sybase等。
我们必须认识到,数据库不是对现实世界建模,而是对用户关于其业务环境的模型建模。判断一个数据模型好坏的合适准则是看它是否与用户模型吻合,争论哪一个模型最符合现实世界是没有意义的。
参 考 文 献
[1]王炽鸿。计算机辅助设计[M]。北京:机械工业出版社,1998。
[2]丁剑洁,基于度量的软件维护过程管理的研究[D],西北大学,2006■