论文部分内容阅读
【摘要】:智能组卷是目前个性化网络辅助教学中的一个重要的组成部分和研究方向,高效、合理的的智能组卷算法才可以协助教学平台实现个性化的教学分析、组建合理的教学策略,最大程度的实现智能化的辅助教学。本文首先介绍了智能组卷算法目前基本性况,并针对自动组卷的特点和要求,分析了基于网络教学平台的智能组卷算法设计,对实现高效的智能组卷算法具有一定的参考价值。
【关键词】:网络教学平台 智能组卷算法 分析
1、智能组卷算法概述
智能组卷算法也称之为自动组卷系统,可以依据给定的一些组卷参数和组卷约束条件,从试题数据库中抽取适应这些参数和条件的试题,自动高效地组合生成一套符合教学大纲及学习主体自身能力的试卷。目前在这方面常用的组卷方式有几种:回溯算法、改进的随机抽题算法及遗传算法。但从目前实际应用情况来看,回溯及改进的随机抽题方法都存在一定的缺陷:回溯算法对计算机资源占用较大,程序结构庞大且比较复杂,组卷效率较低;改进的随机抽题方法条件设置相对简单,所生成的试卷随意性较大,试题的针对性、难度系数、区分度等较难控制。综合以上两种组卷算法的的缺点,遗传算法在智能组卷上具备了自身的优势。
2、遗传算法在组卷问题上的优势
使用类似控随机法及回溯法等传统的组卷方式进行组卷,往往会因为这些组卷算法的自身条件限制而使得组卷的成功率比较低,造成失败的原因大多数时候是因为满足了个别约束字段的局部条件, 为了提高组卷的成功机率有人提出了针对约束条件局部的改进算法, 但这种算法必须满足更多的前提条件。
根据遗传算法(CA)的特点,在解决类似的问题方面还是存在很大优势的。遗传算法可以在较少先决条件的情况下随机产成初始族群,另外,可以较好的在最优解上进行族群的遗传。对于遗传算法来说,最根本的问题是解决染色体编码、组合数过大、建立函数以达到合理的适应范围等。下面将给出具体的解决方案。
3 、基于网络教学平台的只能组卷算法模式
3.1试卷指标
判断一份试卷是否合理,需要从多个方面进行评定,例如内容范围、难易程度、区分度等等,因此,试卷的属性指标有以下几个.
3.1.1题型
一般来说,试卷主要分为客观题和主观题两大部分,客观题常见的题型有单项选择题、多项选择题、判断题、填空题等,主观题常见题型有简答题、分析题、计算题、论述题等等。一份合格的试卷,应当从试卷的题目类型组合、教学内容权重、知识点类型等各角度进行设计。
3.1.2 知识点
教学知识与试卷之间有着密不可分的关联,试题的分布情况应该与知识点在教材中的重要程度分布相同。
3.1.3 难度
试卷的难度系数反映了试题的综合难易程度,一份合格的试卷应该是呈正态分布并能激发学生学习积极性的,因此,难易程度是试卷的重要评价条件之一。这可以用数学公式(1)表示,由公式1得知试卷难度系数N与试卷的平均分之间呈反比关系,即试卷平均分越低,表示该试卷的难度越大,反之则表示试卷越容易。当f=0时,N=1;当f=w时,N=0。为了降低组卷复杂度把题目难度划分为较难、难、中等、容易、较易五个等级,难度系数在[0,0.2]区间为较易,在[0.2,0.4]区间为容易等级,[0.4,0.6]区间为中等,[0.6,0.8]区间为难等级,[0.8,1]区间为较难等级。
N=1-(f/w) (1)
3.2 目标函数
归根结底,自动组卷就是一个针对试题库进行最优排列组合的方案。但是,对于在染色体编码中很难通过某种算法找到最合适的排列组合方式,最终结果与期望值总会存在一定的偏差。因此,为了保证在偏差最小的情况下最大程度的得到最优解,可在保留重要约束条件的同时对剩余约束条件进行有选择性的删除,这样组卷的偏差值就等同于所有约束条件权值的总和。组卷函数可以通过计算公式(2)来计算。 在函数中约束条件的权值由V表示,di表示第i个约束条件的误差值。
(2)
3.3 算法设计
在经过多次实验及分析后,我们将使用实数编码的分段机制,在这种实数编辑机制中染色体由题型题号构成,即遗传算法中的基因。试卷中题型的题目数量决定了染色体的长度,染色体长度=题目数量位数X该题型试题数,为了能够缩短解码所需的时间并且加快效率,我们选择取消编码。但是,这种方式得到的染色体长度远远短于之前的编码得出的结果,想要保存染色体多样性的特点,增加族群的数量及规模是非常必要的,遗传算子也随之要进行修改和设计,而不能再照搬Holland遗传理论的传统方式。
3.3.1 交叉
G1=sx1+ (1-z) x2 1≤a≤10 ; G1=sx2+ (1-z) x1
在进行实数编码后,使用算术交叉方式产生染色体,当出现非法的编码时,例如该编码不属于当前题型的编码范圍,可进行选择,要么再次使用交叉运算计算新编码,要么直接在族群中强行淘汰当前编码。
3.3.2 变异
在产生的族群染色体中随机去除其中一个编码数,再使用随机函数生成一个非族群的基因号,只要是符合当前题型编号范围的,就直接插入到该位置,以较小的变异率重新选择染色体。
3.3.3 迭代终止条件
假设最小误差控制在ε范围内,且适应度期望值为P,则新族群中个体的适应度可以表示为p(t)-P≤ε。判断族群数量是否达到指定的规模,若族群规模未达到最大值,且新族群也不存在该个体,则把它添加到新族群里,否则停止进化。
3.3.4 局部修正
当前,在试题库之中,仅仅依靠Ga来设计试卷,往往难以满足教师对试卷的实际目标,因此,必须将所生成的试卷进一步进行调整、修改,以便更加满足教师对此的要求、及目标,也就是使得所生成的试卷更加满足出卷的约束条件。一般来说,试卷的约束条件有四种情况:其一,弱约束,即估计该试卷的填写、完成实际;其二,柔性约束,即试题中所有类型题目中各自占据的比例;其三,亚约束,即试卷中所有题型在教材中各章节中的实际比例;其四,强约束,即试卷中各相关知识点的比例,以及此试卷的总分。
4、 结语
智能组卷是个性化网络教学平台中的重要组成部分,一个网络教学平台是否能体现出教学过程的自主性和个性化,很大程度是依靠智能组卷来实现的。为了进一步加强学习课程试题库的组卷建设,本文介绍了基于网络教学平台的智能组卷算法设计及模型,包括遗传算法在智能组卷中的具体应用,促使课程试题库中的题目数量适宜、各参数分布合理,使其满足试卷的各目标,充分提高试题库组卷的效率及实用性。
参考文献:
[1] 姜赛达,楚志凯.基于遗传算法的智能组卷研究[J].商丘职业技术学院学报,2012-05-11.
[2] 涂振宇, 王 勇,曾王宣.智能组卷算法研究[J].江西教育学院学报,2012-12-06.
[3] 何 宏,钱 锋.遗传算法参数自适应控制的新方法[J].华东理工大学学报,2006,32(05):601-603.
[4] 郑志军, 郑守淇. 用基于实数编码自适应遗传算法进化神经网络[J] . 计算机工程与应用,2000(09) .
【关键词】:网络教学平台 智能组卷算法 分析
1、智能组卷算法概述
智能组卷算法也称之为自动组卷系统,可以依据给定的一些组卷参数和组卷约束条件,从试题数据库中抽取适应这些参数和条件的试题,自动高效地组合生成一套符合教学大纲及学习主体自身能力的试卷。目前在这方面常用的组卷方式有几种:回溯算法、改进的随机抽题算法及遗传算法。但从目前实际应用情况来看,回溯及改进的随机抽题方法都存在一定的缺陷:回溯算法对计算机资源占用较大,程序结构庞大且比较复杂,组卷效率较低;改进的随机抽题方法条件设置相对简单,所生成的试卷随意性较大,试题的针对性、难度系数、区分度等较难控制。综合以上两种组卷算法的的缺点,遗传算法在智能组卷上具备了自身的优势。
2、遗传算法在组卷问题上的优势
使用类似控随机法及回溯法等传统的组卷方式进行组卷,往往会因为这些组卷算法的自身条件限制而使得组卷的成功率比较低,造成失败的原因大多数时候是因为满足了个别约束字段的局部条件, 为了提高组卷的成功机率有人提出了针对约束条件局部的改进算法, 但这种算法必须满足更多的前提条件。
根据遗传算法(CA)的特点,在解决类似的问题方面还是存在很大优势的。遗传算法可以在较少先决条件的情况下随机产成初始族群,另外,可以较好的在最优解上进行族群的遗传。对于遗传算法来说,最根本的问题是解决染色体编码、组合数过大、建立函数以达到合理的适应范围等。下面将给出具体的解决方案。
3 、基于网络教学平台的只能组卷算法模式
3.1试卷指标
判断一份试卷是否合理,需要从多个方面进行评定,例如内容范围、难易程度、区分度等等,因此,试卷的属性指标有以下几个.
3.1.1题型
一般来说,试卷主要分为客观题和主观题两大部分,客观题常见的题型有单项选择题、多项选择题、判断题、填空题等,主观题常见题型有简答题、分析题、计算题、论述题等等。一份合格的试卷,应当从试卷的题目类型组合、教学内容权重、知识点类型等各角度进行设计。
3.1.2 知识点
教学知识与试卷之间有着密不可分的关联,试题的分布情况应该与知识点在教材中的重要程度分布相同。
3.1.3 难度
试卷的难度系数反映了试题的综合难易程度,一份合格的试卷应该是呈正态分布并能激发学生学习积极性的,因此,难易程度是试卷的重要评价条件之一。这可以用数学公式(1)表示,由公式1得知试卷难度系数N与试卷的平均分之间呈反比关系,即试卷平均分越低,表示该试卷的难度越大,反之则表示试卷越容易。当f=0时,N=1;当f=w时,N=0。为了降低组卷复杂度把题目难度划分为较难、难、中等、容易、较易五个等级,难度系数在[0,0.2]区间为较易,在[0.2,0.4]区间为容易等级,[0.4,0.6]区间为中等,[0.6,0.8]区间为难等级,[0.8,1]区间为较难等级。
N=1-(f/w) (1)
3.2 目标函数
归根结底,自动组卷就是一个针对试题库进行最优排列组合的方案。但是,对于在染色体编码中很难通过某种算法找到最合适的排列组合方式,最终结果与期望值总会存在一定的偏差。因此,为了保证在偏差最小的情况下最大程度的得到最优解,可在保留重要约束条件的同时对剩余约束条件进行有选择性的删除,这样组卷的偏差值就等同于所有约束条件权值的总和。组卷函数可以通过计算公式(2)来计算。 在函数中约束条件的权值由V表示,di表示第i个约束条件的误差值。
(2)
3.3 算法设计
在经过多次实验及分析后,我们将使用实数编码的分段机制,在这种实数编辑机制中染色体由题型题号构成,即遗传算法中的基因。试卷中题型的题目数量决定了染色体的长度,染色体长度=题目数量位数X该题型试题数,为了能够缩短解码所需的时间并且加快效率,我们选择取消编码。但是,这种方式得到的染色体长度远远短于之前的编码得出的结果,想要保存染色体多样性的特点,增加族群的数量及规模是非常必要的,遗传算子也随之要进行修改和设计,而不能再照搬Holland遗传理论的传统方式。
3.3.1 交叉
G1=sx1+ (1-z) x2 1≤a≤10 ; G1=sx2+ (1-z) x1
在进行实数编码后,使用算术交叉方式产生染色体,当出现非法的编码时,例如该编码不属于当前题型的编码范圍,可进行选择,要么再次使用交叉运算计算新编码,要么直接在族群中强行淘汰当前编码。
3.3.2 变异
在产生的族群染色体中随机去除其中一个编码数,再使用随机函数生成一个非族群的基因号,只要是符合当前题型编号范围的,就直接插入到该位置,以较小的变异率重新选择染色体。
3.3.3 迭代终止条件
假设最小误差控制在ε范围内,且适应度期望值为P,则新族群中个体的适应度可以表示为p(t)-P≤ε。判断族群数量是否达到指定的规模,若族群规模未达到最大值,且新族群也不存在该个体,则把它添加到新族群里,否则停止进化。
3.3.4 局部修正
当前,在试题库之中,仅仅依靠Ga来设计试卷,往往难以满足教师对试卷的实际目标,因此,必须将所生成的试卷进一步进行调整、修改,以便更加满足教师对此的要求、及目标,也就是使得所生成的试卷更加满足出卷的约束条件。一般来说,试卷的约束条件有四种情况:其一,弱约束,即估计该试卷的填写、完成实际;其二,柔性约束,即试题中所有类型题目中各自占据的比例;其三,亚约束,即试卷中所有题型在教材中各章节中的实际比例;其四,强约束,即试卷中各相关知识点的比例,以及此试卷的总分。
4、 结语
智能组卷是个性化网络教学平台中的重要组成部分,一个网络教学平台是否能体现出教学过程的自主性和个性化,很大程度是依靠智能组卷来实现的。为了进一步加强学习课程试题库的组卷建设,本文介绍了基于网络教学平台的智能组卷算法设计及模型,包括遗传算法在智能组卷中的具体应用,促使课程试题库中的题目数量适宜、各参数分布合理,使其满足试卷的各目标,充分提高试题库组卷的效率及实用性。
参考文献:
[1] 姜赛达,楚志凯.基于遗传算法的智能组卷研究[J].商丘职业技术学院学报,2012-05-11.
[2] 涂振宇, 王 勇,曾王宣.智能组卷算法研究[J].江西教育学院学报,2012-12-06.
[3] 何 宏,钱 锋.遗传算法参数自适应控制的新方法[J].华东理工大学学报,2006,32(05):601-603.
[4] 郑志军, 郑守淇. 用基于实数编码自适应遗传算法进化神经网络[J] . 计算机工程与应用,2000(09) .