论文部分内容阅读
摘 要:本文提出了以元数据为核心创建ICAI知识库的方法,并结合《信息安全》课程群的ICAI知识库(以下简称“知识库”)的建立,阐述了元数据的本质,分析并指出了它对创建ICAI知识库产生的影响。
关键词:元数据 ICAI知识库 实现
中图分类号:TP392 文献标识码:A 文章编号:1673-8454(2007)12-0057-03
一、引言
目前,智能辅助教学(ICAI,Intelligence Computer Assisted Instruction)系统的前端实现日渐灵活。然而,在后端如何更好地构造ICAI知识库、保证ICAI知识库中数据的准确性与一致性、保证ICAI知识库适应学校教育规模的发展、有效管理ICAI知识库等问题逐渐突出,处理不好,就会使ICAI系统面临一个知识爆炸的困境,从而导致信息环境下的教学无所适从,教师难于驾驭整个教学过程,学生难于构建目标知识。
采用元数据(meta data)技术能较好地解决上述矛盾。近几年,元数据技术越来越受到领域知识专家的重视,并推出了相关标准和产品。[1-6] 但是将其引入到建立知识库系统中的时间还很短,在实际应用中,人们对元数据知识还缺乏深入理解。
二、元数据的概念
在希腊语中,字首“meta-”意味着在其他事物中“伴随”或“超过”之意。Meta-data的字面意思就是指伴随数据或超越数据之上的数据。[7] 应用到文中可认为:元数据是指“描述数据的数据”,它包含所描述数据的大小、来源、时间、内容摘要、派生、用法等多种信息,其主要目的就是对指定数据进行有意义的模型化描述。
在知识库中,元数据通常由资源、属性、属性值、操作规则和联合操作规则五项内容组成,如图1所示。其中,资源可以是任何使用URI(统一资源标识符)标识的内容,它可以包含多个属性和多种操作规则,每个属性有一个确定的属性值。当有两种及以上操作规则时,就需要声明它们之间的联合操作规则。若没有定义任何操作规则,则元数据仅由资源、属性和属性值三项内容构成。
从图2中可以看出,上层是对下层的提炼结果,下层是上层的转化形式。
例如,以下是由30个数字组成的信息编码数据:
238065716932534956455350481128
如果没有任何定义,这些数字就是一些令人费解的内容,可能被看作噪声;如果对噪声进行描述并指明它是一个编码,则它就变成了数据;如果对数据再进行描述并定义一个规则1,那么用规则1对数据加工后,就会产生具有明确含义的信息:PAGE 518-520;若对该信息进一步描述,就会得到专门化的信息,即知识。
规则1的内容如下:
1)从左至右每两个数字分为一组;
2)忽略所有小于32的两位数;
3)用ASCII字符代替两位数。
在上述示例中,如果上层对下层的描述定义不确定(或者说不采用元数据技术),则上层对下层的理解就会因人而异了,不同描述显然会产生不同的结果,对数据真正含义的误解是难免的。所以,要保证系统的推理逻辑的正确性,就必须明确知识库中存有哪些数据、数据的来源以及数据所代表的真正含义和价值,从而有效发挥ICAI专家系统的作用。
(2)“知识超市”孤岛
在知识库中,我们把培养专业人才的某种职业能力所需要的跨学科的知识集合称为知识超市,一个知识超市对应一种职业能力,一个知识库由若干个知识超市构成,各知识超市间具有一定的相关性和互操作性,并且信息共享。ICAI系统就是通过控制知识超市来实现对信息资源管理的。
如果不用元数据技术,则可能导致各知识超市间在构造上和操作规则上存在差异,其数据交换和共享难以实现,进而产生一个个孤立的知识超市(即:“知识超市”孤岛),使整个知识库中的数据一致性受到严重威胁,将会极大降低知识库的应用效率,并增加了对知识库的管理难度。
(3)“知识超市”僵化
在以就业为导向的高职教育体系中,职业教学要紧紧围绕就业市场的变化而变化。根据职业市场变化,职业能力的培养方向要及时调整,教学内容、教学环境、教学方法也要适时变化,学习方式要变,教学管理要变。任何内容的改变都将影响着知识库中的内容、结构和操作规则。因此,知识库系统必须具有应对各种变化的能力,才能保持其在高职教学中的优势和价值。
如果不用元数据技术,则可能产生“知识超市”僵化现象。这时,由于各知识超市间是相互孤立的,没有互操作性,难于统一管理,所以,对知识库的更改必须针对所有知识超市的结构和规则进行,甚至需要重写某个知识超市。这就意味着要满足因就业市场变化而改变的教学需求,还要追加更多的资金和资源投入。
2.应用元数据技术时带来的优势
(1)模型化
把定义数据及其相关信息的元数据集中管理可以形成基于中心的元数据定义和结构化的元数据组织模型。这种模型有利于防止知识库中数据及相关信息的重复定义,有利于对分布存储的数据统一描述和集中管理,使被管理的数据在系统中具有确定性和唯一性。
运用元数据管理技术可以迅速消除各知识超市间在构造上和操作规则上存在的差异,也可消除来自不同教学系统数据结构上的影响。通过使用定制的应用模型,能够由系统控制产生满足特殊要求的元模型并支持其扩展。如果采用标准的API接口,则这些元模型还可以使系统中的数据信息跨平台共享并能实现对各种数据结构与操作规则的统一管理。
(2)自动化
查询和报表功能:借助命名查询和报表生成程序能够准确地将查询程序传递给其它工具,使查询程序的生成与执行自动化。同时,能够产生所需要的报表,以提供更多有价值的决策支持信息。
另外,通过特定工具还可以实时查询系统中所有数据的定义,以帮助使用者对所获数据结果进行深入理解。
分析功能:借助影响分析功能可以完全无限制地进行元数据定义和导航定义。通过影响分析可以方便地确定所描述数据的相关信息,为数据的重用和维护提供了规范化的操作。
(3)灵活性
借助详细的数据定义和元数据的映射逻辑图,使命名方法和被定义信息的重用更为灵活,从而降低数据的冗余度和开发成本,提高数据的共享性和开发效率。
四、以元数据驱动建立知识库的过程
1.必须考虑的问题
(1)当教学中相关要素(主要指教师、学生和环境资源)改变而引起ICAI系统中的数据或操作规则变化时,如何维护和确保系统中数据的一致性?
(2)当ICAI系统中某些定义被改变时,整个系统将会发生哪些变化?
(3)每个可能的变化将会影响什么地方?
澄清上述问题对于建立具有集中控制特性并实现资源共享的知识库非常重要。它能让系统开发者开拓视野,创建较理想的数据描述模型和操作规则。
2.建立知识库的过程
以元数据驱动建立知识库的过程主要是一个重复创建元数据和构造知识超市的过程,如图3所示。经过这样的循环往复,以元数据为核心的知识超市就会逐步建立了。
在图3中,数据源由许多经过加工的具有潜在意义的数据组成。这些数据具有异构性和存储独立性,可通过URI标识进行链接确定。每个数据可能是一个课件、一个网站或一个文件,也可能是一个网页、一条记录或一个数字等。职业能力是对知识的描述,是知识超市中各种知识的综合体现。
元数据的创建是针对数据源中的数据,其创建内容包括:定义数据的来源、定义数据的属性和属性值、定义数据的操作规则、声明数据的联合操作规则。
知识超市的构造是针对元数据操作的,主要涉及以下三方面内容:
(1)确定知识,即:对元数据进行描述。同创建元数据类似,需要定义元数据的来源、定义元数据的属性和属性值、定义元数据的操作规则、声明元数据的联合操作规则。
(2)向知识超市迁移数据。在明确知识后,通过元数据对数据进行提取、转换、净化、分类和聚合处理后加载到知识超市中。
(3)定制前端界面。通过元数据设计用于展示知识超市中数据及相关信息的界面。
五、结束语
事实上,元数据一直是存在的。人们对某事物的看法和特征描述就是一个元数据,这种元数据或者保存在人脑记忆中或者存储在电脑文件中。通过元数据,人们可以很快认识并掌握相关事物的属性特征和操作规则。如果没有高质量的元数据,人们就不能在短时间内对相关数据进行确切的分析,甚至永远得不到有价值的结果。
元数据只是信息层面的数据描述方法,其基本思想可以扩展到数据层、知识层和元知识层。在知识库中,信息层面重点描述教学资源及其结构关系,知识层面重点描述教学概念及其逻辑关系,元知识层面重点描述职业能力及评价。
图3所示的过程与教师完成教学任务的工作过程极其相似。首先,教师按照一定的教学模型对教学资源(包括培养方案、教学大纲、教学计划、讲稿等)进行认真分析并设计出教案,即创建元数据;然后,根据教案对教学资源做进一步分析、精炼和归纳得出有关知识,并以某种形式将其表现出来,从而给出知识的确切含义,即构造知识超市;不断重复这个过程,直到完成全部教学要求;最后,对教学和学生对知识的掌握程度进行综合分析与评价。正是这种高度的相似性以及元数据技术的优势,使得以元数据驱动建立的知识库系统更贴近现实教学,系统管理更加方便、灵活。
参考文献:
[1]杨德婷,阎保平. 科学数据库元数据标准体系设计[J]. 微电子学与计算机,2003(7):3-6.
[2]袁小一, 苏智星. 元数据深度与元数据标准[J]. 图书馆理论与实践, 2006(4):110-111.
[3]路秋丽, 魏顺平. 网络教育资源标准及标准应用的调查分析[J].中国电化教育,2005(7):80-83.
[4]杨小花,杨宗凯,吴砥. 基于XML数据库的标准化教育资源内容服务系统的设计与实现[J]. 计算机应用研究,2006(9):198-200.
[5]丘威. 基于XML的在线多媒体课件设计与实现[J]. 计算机工程与设计,2007(1): 247-250.
[6][美] Akmal B. Chaudhri, Awais Rashid, Robrerto Zicari著,邢春晓,张志强,李骅竞等译. XML数据管理:纯XML和支持XML的数据库系统[M]. 北京:清华大学出版社, 2006.
[7][美] Efrem G.Mallach著,李昭智,李昭勇等译. 决策支持与数据仓库系统[M]. 北京:电子工业出版社, 2001.
[8][美] Joseph Giarratano, Gary Riley 著,刘星成,汤庸译. 专家系统原理与编程[M]. 北京:机械工业出版社, 2000.
关键词:元数据 ICAI知识库 实现
中图分类号:TP392 文献标识码:A 文章编号:1673-8454(2007)12-0057-03
一、引言
目前,智能辅助教学(ICAI,Intelligence Computer Assisted Instruction)系统的前端实现日渐灵活。然而,在后端如何更好地构造ICAI知识库、保证ICAI知识库中数据的准确性与一致性、保证ICAI知识库适应学校教育规模的发展、有效管理ICAI知识库等问题逐渐突出,处理不好,就会使ICAI系统面临一个知识爆炸的困境,从而导致信息环境下的教学无所适从,教师难于驾驭整个教学过程,学生难于构建目标知识。
采用元数据(meta data)技术能较好地解决上述矛盾。近几年,元数据技术越来越受到领域知识专家的重视,并推出了相关标准和产品。[1-6] 但是将其引入到建立知识库系统中的时间还很短,在实际应用中,人们对元数据知识还缺乏深入理解。
二、元数据的概念
在希腊语中,字首“meta-”意味着在其他事物中“伴随”或“超过”之意。Meta-data的字面意思就是指伴随数据或超越数据之上的数据。[7] 应用到文中可认为:元数据是指“描述数据的数据”,它包含所描述数据的大小、来源、时间、内容摘要、派生、用法等多种信息,其主要目的就是对指定数据进行有意义的模型化描述。
在知识库中,元数据通常由资源、属性、属性值、操作规则和联合操作规则五项内容组成,如图1所示。其中,资源可以是任何使用URI(统一资源标识符)标识的内容,它可以包含多个属性和多种操作规则,每个属性有一个确定的属性值。当有两种及以上操作规则时,就需要声明它们之间的联合操作规则。若没有定义任何操作规则,则元数据仅由资源、属性和属性值三项内容构成。
从图2中可以看出,上层是对下层的提炼结果,下层是上层的转化形式。
例如,以下是由30个数字组成的信息编码数据:
238065716932534956455350481128
如果没有任何定义,这些数字就是一些令人费解的内容,可能被看作噪声;如果对噪声进行描述并指明它是一个编码,则它就变成了数据;如果对数据再进行描述并定义一个规则1,那么用规则1对数据加工后,就会产生具有明确含义的信息:PAGE 518-520;若对该信息进一步描述,就会得到专门化的信息,即知识。
规则1的内容如下:
1)从左至右每两个数字分为一组;
2)忽略所有小于32的两位数;
3)用ASCII字符代替两位数。
在上述示例中,如果上层对下层的描述定义不确定(或者说不采用元数据技术),则上层对下层的理解就会因人而异了,不同描述显然会产生不同的结果,对数据真正含义的误解是难免的。所以,要保证系统的推理逻辑的正确性,就必须明确知识库中存有哪些数据、数据的来源以及数据所代表的真正含义和价值,从而有效发挥ICAI专家系统的作用。
(2)“知识超市”孤岛
在知识库中,我们把培养专业人才的某种职业能力所需要的跨学科的知识集合称为知识超市,一个知识超市对应一种职业能力,一个知识库由若干个知识超市构成,各知识超市间具有一定的相关性和互操作性,并且信息共享。ICAI系统就是通过控制知识超市来实现对信息资源管理的。
如果不用元数据技术,则可能导致各知识超市间在构造上和操作规则上存在差异,其数据交换和共享难以实现,进而产生一个个孤立的知识超市(即:“知识超市”孤岛),使整个知识库中的数据一致性受到严重威胁,将会极大降低知识库的应用效率,并增加了对知识库的管理难度。
(3)“知识超市”僵化
在以就业为导向的高职教育体系中,职业教学要紧紧围绕就业市场的变化而变化。根据职业市场变化,职业能力的培养方向要及时调整,教学内容、教学环境、教学方法也要适时变化,学习方式要变,教学管理要变。任何内容的改变都将影响着知识库中的内容、结构和操作规则。因此,知识库系统必须具有应对各种变化的能力,才能保持其在高职教学中的优势和价值。
如果不用元数据技术,则可能产生“知识超市”僵化现象。这时,由于各知识超市间是相互孤立的,没有互操作性,难于统一管理,所以,对知识库的更改必须针对所有知识超市的结构和规则进行,甚至需要重写某个知识超市。这就意味着要满足因就业市场变化而改变的教学需求,还要追加更多的资金和资源投入。
2.应用元数据技术时带来的优势
(1)模型化
把定义数据及其相关信息的元数据集中管理可以形成基于中心的元数据定义和结构化的元数据组织模型。这种模型有利于防止知识库中数据及相关信息的重复定义,有利于对分布存储的数据统一描述和集中管理,使被管理的数据在系统中具有确定性和唯一性。
运用元数据管理技术可以迅速消除各知识超市间在构造上和操作规则上存在的差异,也可消除来自不同教学系统数据结构上的影响。通过使用定制的应用模型,能够由系统控制产生满足特殊要求的元模型并支持其扩展。如果采用标准的API接口,则这些元模型还可以使系统中的数据信息跨平台共享并能实现对各种数据结构与操作规则的统一管理。
(2)自动化
查询和报表功能:借助命名查询和报表生成程序能够准确地将查询程序传递给其它工具,使查询程序的生成与执行自动化。同时,能够产生所需要的报表,以提供更多有价值的决策支持信息。
另外,通过特定工具还可以实时查询系统中所有数据的定义,以帮助使用者对所获数据结果进行深入理解。
分析功能:借助影响分析功能可以完全无限制地进行元数据定义和导航定义。通过影响分析可以方便地确定所描述数据的相关信息,为数据的重用和维护提供了规范化的操作。
(3)灵活性
借助详细的数据定义和元数据的映射逻辑图,使命名方法和被定义信息的重用更为灵活,从而降低数据的冗余度和开发成本,提高数据的共享性和开发效率。
四、以元数据驱动建立知识库的过程
1.必须考虑的问题
(1)当教学中相关要素(主要指教师、学生和环境资源)改变而引起ICAI系统中的数据或操作规则变化时,如何维护和确保系统中数据的一致性?
(2)当ICAI系统中某些定义被改变时,整个系统将会发生哪些变化?
(3)每个可能的变化将会影响什么地方?
澄清上述问题对于建立具有集中控制特性并实现资源共享的知识库非常重要。它能让系统开发者开拓视野,创建较理想的数据描述模型和操作规则。
2.建立知识库的过程
以元数据驱动建立知识库的过程主要是一个重复创建元数据和构造知识超市的过程,如图3所示。经过这样的循环往复,以元数据为核心的知识超市就会逐步建立了。
在图3中,数据源由许多经过加工的具有潜在意义的数据组成。这些数据具有异构性和存储独立性,可通过URI标识进行链接确定。每个数据可能是一个课件、一个网站或一个文件,也可能是一个网页、一条记录或一个数字等。职业能力是对知识的描述,是知识超市中各种知识的综合体现。
元数据的创建是针对数据源中的数据,其创建内容包括:定义数据的来源、定义数据的属性和属性值、定义数据的操作规则、声明数据的联合操作规则。
知识超市的构造是针对元数据操作的,主要涉及以下三方面内容:
(1)确定知识,即:对元数据进行描述。同创建元数据类似,需要定义元数据的来源、定义元数据的属性和属性值、定义元数据的操作规则、声明元数据的联合操作规则。
(2)向知识超市迁移数据。在明确知识后,通过元数据对数据进行提取、转换、净化、分类和聚合处理后加载到知识超市中。
(3)定制前端界面。通过元数据设计用于展示知识超市中数据及相关信息的界面。
五、结束语
事实上,元数据一直是存在的。人们对某事物的看法和特征描述就是一个元数据,这种元数据或者保存在人脑记忆中或者存储在电脑文件中。通过元数据,人们可以很快认识并掌握相关事物的属性特征和操作规则。如果没有高质量的元数据,人们就不能在短时间内对相关数据进行确切的分析,甚至永远得不到有价值的结果。
元数据只是信息层面的数据描述方法,其基本思想可以扩展到数据层、知识层和元知识层。在知识库中,信息层面重点描述教学资源及其结构关系,知识层面重点描述教学概念及其逻辑关系,元知识层面重点描述职业能力及评价。
图3所示的过程与教师完成教学任务的工作过程极其相似。首先,教师按照一定的教学模型对教学资源(包括培养方案、教学大纲、教学计划、讲稿等)进行认真分析并设计出教案,即创建元数据;然后,根据教案对教学资源做进一步分析、精炼和归纳得出有关知识,并以某种形式将其表现出来,从而给出知识的确切含义,即构造知识超市;不断重复这个过程,直到完成全部教学要求;最后,对教学和学生对知识的掌握程度进行综合分析与评价。正是这种高度的相似性以及元数据技术的优势,使得以元数据驱动建立的知识库系统更贴近现实教学,系统管理更加方便、灵活。
参考文献:
[1]杨德婷,阎保平. 科学数据库元数据标准体系设计[J]. 微电子学与计算机,2003(7):3-6.
[2]袁小一, 苏智星. 元数据深度与元数据标准[J]. 图书馆理论与实践, 2006(4):110-111.
[3]路秋丽, 魏顺平. 网络教育资源标准及标准应用的调查分析[J].中国电化教育,2005(7):80-83.
[4]杨小花,杨宗凯,吴砥. 基于XML数据库的标准化教育资源内容服务系统的设计与实现[J]. 计算机应用研究,2006(9):198-200.
[5]丘威. 基于XML的在线多媒体课件设计与实现[J]. 计算机工程与设计,2007(1): 247-250.
[6][美] Akmal B. Chaudhri, Awais Rashid, Robrerto Zicari著,邢春晓,张志强,李骅竞等译. XML数据管理:纯XML和支持XML的数据库系统[M]. 北京:清华大学出版社, 2006.
[7][美] Efrem G.Mallach著,李昭智,李昭勇等译. 决策支持与数据仓库系统[M]. 北京:电子工业出版社, 2001.
[8][美] Joseph Giarratano, Gary Riley 著,刘星成,汤庸译. 专家系统原理与编程[M]. 北京:机械工业出版社, 2000.