以元数据驱动构建ICAI知识库的方案

来源 :中国教育信息化·高教职教 | 被引量 : 0次 | 上传用户:woainiyuying
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘 要:本文提出了以元数据为核心创建ICAI知识库的方法,并结合《信息安全》课程群的ICAI知识库(以下简称“知识库”)的建立,阐述了元数据的本质,分析并指出了它对创建ICAI知识库产生的影响。
  关键词:元数据 ICAI知识库 实现
  中图分类号:TP392 文献标识码:A 文章编号:1673-8454(2007)12-0057-03
  
  一、引言
  
  目前,智能辅助教学(ICAI,Intelligence Computer Assisted Instruction)系统的前端实现日渐灵活。然而,在后端如何更好地构造ICAI知识库、保证ICAI知识库中数据的准确性与一致性、保证ICAI知识库适应学校教育规模的发展、有效管理ICAI知识库等问题逐渐突出,处理不好,就会使ICAI系统面临一个知识爆炸的困境,从而导致信息环境下的教学无所适从,教师难于驾驭整个教学过程,学生难于构建目标知识。
  采用元数据(meta data)技术能较好地解决上述矛盾。近几年,元数据技术越来越受到领域知识专家的重视,并推出了相关标准和产品。[1-6] 但是将其引入到建立知识库系统中的时间还很短,在实际应用中,人们对元数据知识还缺乏深入理解。
  
  二、元数据的概念
  
  在希腊语中,字首“meta-”意味着在其他事物中“伴随”或“超过”之意。Meta-data的字面意思就是指伴随数据或超越数据之上的数据。[7] 应用到文中可认为:元数据是指“描述数据的数据”,它包含所描述数据的大小、来源、时间、内容摘要、派生、用法等多种信息,其主要目的就是对指定数据进行有意义的模型化描述。
  在知识库中,元数据通常由资源、属性、属性值、操作规则和联合操作规则五项内容组成,如图1所示。其中,资源可以是任何使用URI(统一资源标识符)标识的内容,它可以包含多个属性和多种操作规则,每个属性有一个确定的属性值。当有两种及以上操作规则时,就需要声明它们之间的联合操作规则。若没有定义任何操作规则,则元数据仅由资源、属性和属性值三项内容构成。
  
  从图2中可以看出,上层是对下层的提炼结果,下层是上层的转化形式。
  例如,以下是由30个数字组成的信息编码数据:
  238065716932534956455350481128
  如果没有任何定义,这些数字就是一些令人费解的内容,可能被看作噪声;如果对噪声进行描述并指明它是一个编码,则它就变成了数据;如果对数据再进行描述并定义一个规则1,那么用规则1对数据加工后,就会产生具有明确含义的信息:PAGE 518-520;若对该信息进一步描述,就会得到专门化的信息,即知识。
  规则1的内容如下:
  1)从左至右每两个数字分为一组;
  2)忽略所有小于32的两位数;
  3)用ASCII字符代替两位数。
  在上述示例中,如果上层对下层的描述定义不确定(或者说不采用元数据技术),则上层对下层的理解就会因人而异了,不同描述显然会产生不同的结果,对数据真正含义的误解是难免的。所以,要保证系统的推理逻辑的正确性,就必须明确知识库中存有哪些数据、数据的来源以及数据所代表的真正含义和价值,从而有效发挥ICAI专家系统的作用。
  (2)“知识超市”孤岛
  在知识库中,我们把培养专业人才的某种职业能力所需要的跨学科的知识集合称为知识超市,一个知识超市对应一种职业能力,一个知识库由若干个知识超市构成,各知识超市间具有一定的相关性和互操作性,并且信息共享。ICAI系统就是通过控制知识超市来实现对信息资源管理的。
  如果不用元数据技术,则可能导致各知识超市间在构造上和操作规则上存在差异,其数据交换和共享难以实现,进而产生一个个孤立的知识超市(即:“知识超市”孤岛),使整个知识库中的数据一致性受到严重威胁,将会极大降低知识库的应用效率,并增加了对知识库的管理难度。
  (3)“知识超市”僵化
  在以就业为导向的高职教育体系中,职业教学要紧紧围绕就业市场的变化而变化。根据职业市场变化,职业能力的培养方向要及时调整,教学内容、教学环境、教学方法也要适时变化,学习方式要变,教学管理要变。任何内容的改变都将影响着知识库中的内容、结构和操作规则。因此,知识库系统必须具有应对各种变化的能力,才能保持其在高职教学中的优势和价值。
  如果不用元数据技术,则可能产生“知识超市”僵化现象。这时,由于各知识超市间是相互孤立的,没有互操作性,难于统一管理,所以,对知识库的更改必须针对所有知识超市的结构和规则进行,甚至需要重写某个知识超市。这就意味着要满足因就业市场变化而改变的教学需求,还要追加更多的资金和资源投入。
  2.应用元数据技术时带来的优势
  (1)模型化
  把定义数据及其相关信息的元数据集中管理可以形成基于中心的元数据定义和结构化的元数据组织模型。这种模型有利于防止知识库中数据及相关信息的重复定义,有利于对分布存储的数据统一描述和集中管理,使被管理的数据在系统中具有确定性和唯一性。
  
  运用元数据管理技术可以迅速消除各知识超市间在构造上和操作规则上存在的差异,也可消除来自不同教学系统数据结构上的影响。通过使用定制的应用模型,能够由系统控制产生满足特殊要求的元模型并支持其扩展。如果采用标准的API接口,则这些元模型还可以使系统中的数据信息跨平台共享并能实现对各种数据结构与操作规则的统一管理。
  (2)自动化
  查询和报表功能:借助命名查询和报表生成程序能够准确地将查询程序传递给其它工具,使查询程序的生成与执行自动化。同时,能够产生所需要的报表,以提供更多有价值的决策支持信息。
  另外,通过特定工具还可以实时查询系统中所有数据的定义,以帮助使用者对所获数据结果进行深入理解。
  分析功能:借助影响分析功能可以完全无限制地进行元数据定义和导航定义。通过影响分析可以方便地确定所描述数据的相关信息,为数据的重用和维护提供了规范化的操作。
  (3)灵活性
  借助详细的数据定义和元数据的映射逻辑图,使命名方法和被定义信息的重用更为灵活,从而降低数据的冗余度和开发成本,提高数据的共享性和开发效率。
  
  四、以元数据驱动建立知识库的过程
  
  1.必须考虑的问题
  (1)当教学中相关要素(主要指教师、学生和环境资源)改变而引起ICAI系统中的数据或操作规则变化时,如何维护和确保系统中数据的一致性?
  (2)当ICAI系统中某些定义被改变时,整个系统将会发生哪些变化?
  (3)每个可能的变化将会影响什么地方?
  澄清上述问题对于建立具有集中控制特性并实现资源共享的知识库非常重要。它能让系统开发者开拓视野,创建较理想的数据描述模型和操作规则。
  2.建立知识库的过程
  以元数据驱动建立知识库的过程主要是一个重复创建元数据和构造知识超市的过程,如图3所示。经过这样的循环往复,以元数据为核心的知识超市就会逐步建立了。
  在图3中,数据源由许多经过加工的具有潜在意义的数据组成。这些数据具有异构性和存储独立性,可通过URI标识进行链接确定。每个数据可能是一个课件、一个网站或一个文件,也可能是一个网页、一条记录或一个数字等。职业能力是对知识的描述,是知识超市中各种知识的综合体现。
  元数据的创建是针对数据源中的数据,其创建内容包括:定义数据的来源、定义数据的属性和属性值、定义数据的操作规则、声明数据的联合操作规则。
  知识超市的构造是针对元数据操作的,主要涉及以下三方面内容:
  (1)确定知识,即:对元数据进行描述。同创建元数据类似,需要定义元数据的来源、定义元数据的属性和属性值、定义元数据的操作规则、声明元数据的联合操作规则。
  (2)向知识超市迁移数据。在明确知识后,通过元数据对数据进行提取、转换、净化、分类和聚合处理后加载到知识超市中。
  (3)定制前端界面。通过元数据设计用于展示知识超市中数据及相关信息的界面。
  
  五、结束语
  
  事实上,元数据一直是存在的。人们对某事物的看法和特征描述就是一个元数据,这种元数据或者保存在人脑记忆中或者存储在电脑文件中。通过元数据,人们可以很快认识并掌握相关事物的属性特征和操作规则。如果没有高质量的元数据,人们就不能在短时间内对相关数据进行确切的分析,甚至永远得不到有价值的结果。
  元数据只是信息层面的数据描述方法,其基本思想可以扩展到数据层、知识层和元知识层。在知识库中,信息层面重点描述教学资源及其结构关系,知识层面重点描述教学概念及其逻辑关系,元知识层面重点描述职业能力及评价。
  图3所示的过程与教师完成教学任务的工作过程极其相似。首先,教师按照一定的教学模型对教学资源(包括培养方案、教学大纲、教学计划、讲稿等)进行认真分析并设计出教案,即创建元数据;然后,根据教案对教学资源做进一步分析、精炼和归纳得出有关知识,并以某种形式将其表现出来,从而给出知识的确切含义,即构造知识超市;不断重复这个过程,直到完成全部教学要求;最后,对教学和学生对知识的掌握程度进行综合分析与评价。正是这种高度的相似性以及元数据技术的优势,使得以元数据驱动建立的知识库系统更贴近现实教学,系统管理更加方便、灵活。
  
  参考文献:
  [1]杨德婷,阎保平. 科学数据库元数据标准体系设计[J]. 微电子学与计算机,2003(7):3-6.
  [2]袁小一, 苏智星. 元数据深度与元数据标准[J]. 图书馆理论与实践, 2006(4):110-111.
  [3]路秋丽, 魏顺平. 网络教育资源标准及标准应用的调查分析[J].中国电化教育,2005(7):80-83.
  [4]杨小花,杨宗凯,吴砥. 基于XML数据库的标准化教育资源内容服务系统的设计与实现[J]. 计算机应用研究,2006(9):198-200.
  [5]丘威. 基于XML的在线多媒体课件设计与实现[J]. 计算机工程与设计,2007(1): 247-250.
  [6][美] Akmal B. Chaudhri, Awais Rashid, Robrerto Zicari著,邢春晓,张志强,李骅竞等译. XML数据管理:纯XML和支持XML的数据库系统[M]. 北京:清华大学出版社, 2006.
  [7][美] Efrem G.Mallach著,李昭智,李昭勇等译. 决策支持与数据仓库系统[M]. 北京:电子工业出版社, 2001.
  [8][美] Joseph Giarratano, Gary Riley 著,刘星成,汤庸译. 专家系统原理与编程[M]. 北京:机械工业出版社, 2000.
其他文献
今天户外活动时,轩轩拿着跳绳跳了几个之后,就无所事事地拖着绳子开始在操场上到处溜达起来。我走了过去,笑着说:“轩轩,绳子都被你拖疼了。”他明白了我的意思,辩解道:“孙老师,跳绳太累了,而且没意思。”  当以快乐为核心的游戏被孩子描述为“没意思”“太累”时,说明它已经不适合孩子了,老师需要积极对材料或者游戏活动进行替换或改进。  正当我在努力思索应该如何让跳绳变得更有趣时,耳边传来了一阵强有力的“啪
【案例一】 我不愿意上幼儿园  孩子的情绪往往受成人情绪的影响,在小班入园阶段表现尤其明显。如果父母对孩子入园忧心忡忡,充满焦虑,无形中也会将其传达给孩子,为孩子适应幼儿园生活增加阻碍。为了让家长更好地了解这个现象,我们将生活中遇到的类似情况演绎并拍成视频短片,在我班新生入园前召开的家长会上进行播放。  同小区的贝贝妈妈和小雅妈妈同时收到了小区幼儿园的入学通知,她们的女儿都被小区配套幼儿园录取了,
摘 要:广东省是中国经济最发达的省份,珠江三角洲制造业、信息服务业的发展需要大量的应用型IT人才。加拿大阿尔伯塔省因石油工业已成为加拿大最富有的省,对应用型技术人才的需求巨大。本文根据我们近两年来对加拿大北阿尔伯塔理工学院(NAIT)和广东金融学院(GDUF) 应用型IT人才培养模式的研究和实地考察,探讨了应用型本科院校信息技术应用型人才培养模式的教学改革基本思路。  关键词:应用型本科院校 应用
今年的两会,我们如约采访到庞丽娟委员。  此次两会期间,庞委员提交了6份提案,归纳起来,此次提案有3条线索,一是关于学前教育事业发展的,二是教育助力脱贫攻坚战略的,三依然是她情系十余年的农村教育与乡村教师。近几年,尽管庞委员关注的面较广,从学前教育到义务教育,从农村教师队伍到免费师范生教育,从普通基础教育到中高等职业教育,但是作为学前教育本科专业出身的专家学者,学前教育事业发展政策一直是庞委员惦念
摘 要:基于ERP思想的URP数字化校园建设理念为我国大学特别是综合性大学信息化带来了全新的解决方案,这一建设思想正被众多院校广泛借鉴和使用。但高职高专院校本身规模相对较小,核心业务较为单一,技术力量较为薄弱等,针对这种现状,本文在ERP和URP的基础上提出了针对高职高专院校的高校资源计划(CRP)系统解决方案。  关键词:CRP系统 高校资源计划 数字化校园 紧松互补耦合 高职高专  中图分类号
在教育界,“幼儿教师爱培训”是被公认的,然而,热爱学习、培训的幼儿教师群体并未得到相应的专业认可,“幼儿园老师不就是跳跳唱唱嘛!”“幼儿园老师搞研究?没有必要吧。”这种并不完全认同幼儿教师是专业者的观点仍然存在,甚至部分教育界其他学段的同行也这么认为。  为何如此?原因是多方面的。从培训组织方得到的反馈可以管窥一斑。“幼儿园老师培训中偏爱听各种优质课,找各种新课程模式、参观各种名园;学习中特别喜欢
一、感恩  1.孔子学堂有感:每周一行政会后是孔子学堂开讲的时间。今天陈怡教授为我们讲了孔子的孝、义、礼的观点,我对“君子不争……其争也君子”一言有了更新的理解:君子的争体现在超越自己,而非排挤他人……已是耄耋之年的陈怡教授为了给我们讲课,每周不辞辛苦往返于北京和南京之间。他本是工科出身,40岁时毅然跨界转而研究诸子散文,他的研究成果得到业界名家的赞赏。对我们而言,陈怡教授本身就是一部好的教科书,
2019年10月28日,孩子们在幼儿园四楼屋顶的阳光农场种下了小麦,从播种第一天开始,大家都充满了期盼。当小麦种子遇小鸟侵袭时,大家用搭遮盖网、扎稻草人、为小鸟提供食物等办法来保护小麦,终于,小麦发芽了,孩子们给每一株都起了名字、量了身高。大家带着对小麦的牵挂进入了寒假,原以为很快就能再见到它们,但突如其来的新冠肺炎疫情让大家不能如期回到幼儿园。老师感受到孩子们对小麦的思念,于是思考通过网络平台满
摘 要:本文简要介绍了高校就业网站的主要功能、存在问题及未来与CRM结合的发展趋势,在此基础上对CRM的内涵进行了一定的阐述。在寻求两者的共通点后,提出了基于CRM理念来建设高校就业网站的设想,并通过具体的解决方案加强了对网站中各种信息的收集、监管和分析利用。  关键词:高校就业网站 CRM 统计 分析  中图分类号:TP393.02 文献标识码:B 文章编号:1673-8454(2008)03-
摘 要:对照本科教学评估中有关毕业设计(论文)教学环节中的评价指标,将本科毕业设计教务管理工作与现代计算机网络技术相结合,采用ASP.NET技术与短信平台相结合,开发了适合我校农业工程类本科毕业设计教务管理实践的计算机信息管理系统,实现了学生、教师、教务管理人员的信息交流和互动,提高了管理效率和水平,节约了管理成本。  关键词:ASP.NET技术 短信息(SMS)技术  中图分类号:TP315 文