论文部分内容阅读
神经网络能精确地对复杂问题进行预测,但易受训练过度的影响且训练速度慢。遗传算法是一种全局优化搜索算法,具有简单通用,鲁棒性强等特点,然而,它的拟合度函数变化很大。这种方法的要求是拟合度函数必须收敛于最小误差,这为具体的实现方案留下了许多自由空间。将遗传算法与神经网络结合起来使用可以在较高的层次上提高模型的可理解性。本文提出了改进的遗传算法结合BP人工神经网络的肺癌治疗手段预测系统,本文工作主要包括:1.对遗传算法和人工神经网络进行了详细的研究包括遗传算法原型,遗传算法编码的方式,基于误差逆传播算法(BP算法)的神经网络方法。对遗传算法和人工神经网络的优缺点进行了讨论。2.提出了改进的遗传算法结合BP人工神经网络的预测方法参考了目前遗传算法与神经网络的结合方法:一是对神经网络初始权值进行优化;二是采用进化的神经网络方法(Evolving Neural Networks,简称ENN),完全用遗传算法替代BP学习,以避免梯度下降法的缺陷。但这两种结合方法都存在着较大的缺陷:对于前者,遗传算法本身也存在早熟收敛问题,因此该方法仍然不能保证后继的网络训练不会陷入局部极小区域;对于后者,由于遗传算法本身局部搜索能力较弱的特性使得进化神经网络需要一个较大范围的初始权值区域,由此造成的复杂度升高使得训练出的神经网络泛化能力并不理想,同时,遗传算法的种群计算常常使得其训练开销比BP算法的时间开销大得多。基于上述分析,本文提出了改进的遗传算法结合BP人工神经网络方法。考虑到遗传算法在搜索过程中不断地向可能包含最优解的方向调整搜索空间,搜索到全局最优解的概率比起单纯的神经网络算法来说要大得多,而在局部搜索方面则不如神经网络算法,本文尝试分两阶段使用遗传算法改善网络训练质量,首先通过遗传算法进行粗调得到一个全局的近似解,以此为初值,再采用遗传算法和BP人工神经网络算法交替运行训练,BP人工神经网络算法到遗传算法的切换可通过所指定的精度或局部最大步数来实现,遗传算法到BP人工神经网络算法的切换可通过一次完整的遗传算子操作(选择算子,交叉算子,变异算子)来实现,这样互以对方的训练结果作为自己的初始权值或初始群体,反复交替训练,直到达到所指定的精度或最大交替步数为止。通过在典型数据集上进行实验,发现改进的遗传算法结合BP人工神经网络方法(GBP算法)在误判率上比参与比较的其他算法要好,在收敛速度上略慢于HAAM算法。实验表明,HAAM算法虽然在收敛速度上比GBP算法快,但其泛化性能却有所下降;而GBP算法通过在训练初期单独使用遗传算法和训练中期与BP算法交替使用,既优化了网络初始权值,又能有效地调整每次BP算法所使用的初始权值,同时,BP算法也增强了遗传算法的局部搜索能力;使得网络训练不易陷入局部极小点,得到的网络具有更好的泛化能力。3.基于GBP算法开发了数据预测系统,并应用于肺癌治疗手段预测在本文提出的改进的遗传算法结合BP人工神经网络方法基础上,实现了肺癌治疗手段预测系统,该系统由数据预处理,训练和结果显示三部分组成。数据预处理部分主要是将数据库中的数据表进行处理,将表中缺失的数据补全,对错误数据进行修改;根据用户的需要有选择地对表中的数据进行训练,如可以对表的属性列和记录行进行精简。训练部分将训练要用到的各项参数以窗体的形式显示给用户,供其根据需要设置,如训练精度,最大训练次数等。结果显示部分,以数据表的形式将结果显示给用户。最后,本工程使用了美国卡内基梅隆大学中的关于肺癌治疗数据库,将细胞类型、病人存活时间、状态、患者生活质量评分、治疗起始时间、年龄的数据作为输入因子,将要预测的肺癌治疗手段作为输出因子,跟传统的BP和最近的HAAM算法比较,收到良好的应用效果。