论文部分内容阅读
摘 要:应用BP人工神经网络原理,设计一种系统性红斑狼疮疾病诊断的方法。选用对系统性红斑狼疮敏感的四个指标(ANA,dsDAN-ab,C3,C4),作为BP人工神经网络的输入数据。通过对121例样本的分析,其中训练集的71例,训练正确率为95.7%;预测集的50例,预测正确率为88.0%。由此可以得出,BP人工神经网络能为系统性红斑狼疮作出较准确的诊断,能提高诊断的客观性。
关键词:人工神经网络 系统性红斑狼疮 预测
中图分类号:R593.241 文献标识码:A 文章编号:1674-098X(2012)07(b)-0246-02
系统性红斑狼疮(Systemic Lupus Erythematosus)是一种多器官、多系统受累的自身免疫性疾病。患者体液免疫失调,细胞免疫功能紊乱,而使患者体内产生一些特异性自身抗体[1]。由于系统性红斑狼疮早期诊断困难,致残率与死亡率均高,给患者及家属带来许多的痛苦和遗憾,而本研究应用的人工神经网络对系统性红斑狼疮的诊断,不仅能排除各种人为因素的干扰,而且也能得到较准确和客观的结果。人工神经网络是种理论化的数学模型,是模仿人脑神经的网络结构及其功能而建立起来的一种信息处理系统,具有自适应性、自组织性、容错性、联想性等特点[2,3]。本文通过系统性红斑狼疮疾病的4个敏感的诊断指标(ANA,dsDAN-ab,C3,C4),应用人工神经网络对疾病进行预测诊断,结果表明人工神经网络可用于系统性红斑狼疮的疾病诊断。
1 人工神经网络原理
1.1 人工神经元
人工神经网络由多个层次组成,每一个层次包含若干个神元。如图1显示了一个具有n个输入分量的人工神经元模型。
在神经网络中,除了第一层次的其它神经元,都是由来自上层神经元的输入变量(,,…,)和相对的连接权重(,,…,)的点乘积的和构成其总输入。神经元总输入值在函数f的作用下并同时给与适当的阈值θ刺激,就能够产生信号输出。图中的连接权重表示的意义是上级神经元对下级神经元的影响程度,f是神经元的激活函数,一般采用S型函数。
1.2 人工神经网络
人工神经网络是一个以有向性拓扑结构的动态系统,通过连续或断续方式的输入状态而进行处理[4]。目前根据各个层次神经元的连接方法不同,其中使用最多、具代表性的是误差反向传播的多层前馈式网络,即BP(Back—Propagation)网络。BP神经网络是由大量“神经元”互连而成的网络,通常由输入层、隐含层和输出层3个层次组成。神经网络输入层的神经元首先接受外界的信息,然后通过一个连接权重传递给下一隐含的神经元,其次隐含层神经元对数据进行分析处理,把得到的结果传递给输出层神经元,最后输出层神经元经过转换把信号传给外界。
1.3 人工神经网络工作原理
人工神经网络通过特定的学习算法得到了神经元之间的连接权,同时也获得了病例样本的各种信息,这一过程称作训练,人工神经网络经过训练就能得到疾病诊断的各种规则。人工神经网络应用以上学到的诊断规则,就能在新的样本病例中进行疾病预测。基于以上这点,本文首设定一个人工神经网络的期望值,当这些期望值,提供给人工神经网络学习后,神经元就能够获得网络的输入响应并产生相对应的连接权值。然后人工神经网络按减小期望输出与实际输出误差的方向,从输出层经各中间层逐层修正各连接权值,最后回到输入层。如果计算结果给出了错误的判断,此时人工神经网络通过下一步的学习,就可以减少犯同样错误的可能性,这种过程将反复交替的进行,直至整个人工神经网络的全局误差趋向预期目标,此时人工神经网络完成学习的过程。人工神经网络通过这种训练,提高了疾病判断的准确率,这就表明人工神经网络对疾病规则的学习已经获得了成功,同时也能够对疾病作出迅速、准确的判断。
2 神经网络诊断SLE实例
2.1 BP神经网络的算法
首先将训练和预测用的病例数据整理成易于MATLAB读取的文本,其次设定人工神经网络的期望值,将训练病例数据导入其中进行训练,训练完成后,将预测数据导入到训练好的神经网络里面进行仿真,最后输出仿真结果。
2.2 病例选取
试验病例样本来源为1996年至2008年期间哈尔滨医科大学附属医院收治的门诊或住院的系统性红斑狼疮患者。共计350例,其中女320例,占91.4%;男30例,占8.6%;男女之比为1:10.67,年龄1~79岁,平均年龄为40.53岁。所有患者均符合1982年美国风湿病协会(ARA)制定的SLE诊断标准[5]。SLE患者均进行各项免疫学指标检查及结果记录。病历询问及体检均由有临床经验的医生进行,所有患者均进行详细的病史询问和体格检查。每例病历包括了100多个计量、分级指标,包括该病人入院时的基本资料、体格检查结果、实验室化验结果。其中,体格检查99项,实验室检查34项,病人资料12项。本文将以上的指标进行因子分析取得目标数据。所谓的因子分析,是在为数众多的因素中,不损失或很少损失原有信息的基础上,把原来多个彼此相关的因素转化为少数几个彼此独立的、能综合反映原有信息的综合指标的一种多元统计方法。通过求出每个公因子的方差贡献,取累计方差贡献率大于80%(可根据相关的专业知识,对此值进行调整)的前m个公因子,根据各影响因素在公因子中所起的作用,确定其是否为主要影响因素。其基本思想是根据相关性大小把原始变量分组,使得同组内的变量之间相关性较高,而不同组的变量间相关性则较低。按照前面所述的思想对数据进行筛选,最后得到权重比较大的4个指标,即ANA,dsDAN-ab,C3,C4,进行神经网络的模拟分析。
随机抽取临床样本26例,取19例作为神经网络训练样本(7例正常,12例不正常),取剩余的7例数据进行预测(预测数据如表1所示),使用MATLAB作为算法的实现工具。
2.3 建立神经网络
使用newff语句建立BP网络,设置隐藏神经元数目为4,并且选择各神经元的传递函数分别为tansig和purelin,设置反传递函数为: 2.4 设定网络参数
使用函数train对人工神经网络进行训练之前,先要设置网络训练参数。本文设输人工神经元个数为4,输出神经元个数为1,期望目标输出值用0表示正常,用1表示系统性红斑狼疮,隐含层用tansig函数,训练时间为5000个单位时间,训练目标为误差小于0.01,显示速度为50ms,学习速率为0.05,网络连接权重初始值设为【-1,1】之间的随机数,MATLAB程序编写如下:
2.5 训练及预测结果
将训练病例的四个指标输入到人工神经网络的算法程序中,神经网络训练次数达到5000后,期望误差值缩小到了0.0923,训练完毕后,将训练结果与实际值进行比较,见图2。
将预测用的病例数据导入到训练好的神经网络中进行疾病预测,预测输出以0.5为阈值,>0.5者为系统性红斑狼疮患者,<0.5为正常对照样本,预测结果如下图3所示。
将训练与预测两项结果作如下统计,结果见表1。
3 讨论
本课题所采用的基于人工神经网络的系统性红斑狼疮的诊断结果能较好地与病例数据相符合,具有较高的准确性,同时有利于疾病的早期发现和治疗。然而在神经网络的预测过程当中,神经网络的建立是至关重要的。如果选取了不恰当的参数,或者输入的训练数据不够典型(不具关联性),这样建立的网络往往达到不到预期要求,其预测结果也就往往和实际有所偏差,而本文设定的网络参数能较好的满足实际情况的要求。
临床上由于各种原因,试验中有些病例数据不够完整,这些缺失的数据会给临床疾病的诊断造成一定的影响,但由于神经网络具有较强的容错性,所以输入数据在某些项上的缺失或是错误对神经网络最终运算的结果影响不大,同时由于神经网络所具有的优点和特性使得它成为医学诊断研究的有效工具。在神经网络应用中,只要我们建立适当的网络模型,确定完整的数据样本,经过网络模型训练医学专家的知识和经验,就可以使操作智能化、自动化,并具有较高的可信度,将极大减轻医务人员的工作负担,所以神经网络在医学诊断领域具有很大的发展潜力。
参考文献
[1] 王国丽,胡鹭芳.671例系统性红斑狼疮临床及自身抗体检测结果分析[J].中国麻风皮肤病杂志,May2006,Vol.22No.5:430-430.
[2] 毛政利,闫继涛,赖健清.金属矿山[J].2009,(07):66-68.
[3] 卜宪敏,郑智勇,玉英豪.神经网络在病理学自动识别中的应用[J].中国体视学与图像分析,2005,10(2):122-126.
[4] 巫影,陈定方,唐小兵等.神经网络综述[J].科技进步与对策,2002,(6):133-134.
关键词:人工神经网络 系统性红斑狼疮 预测
中图分类号:R593.241 文献标识码:A 文章编号:1674-098X(2012)07(b)-0246-02
系统性红斑狼疮(Systemic Lupus Erythematosus)是一种多器官、多系统受累的自身免疫性疾病。患者体液免疫失调,细胞免疫功能紊乱,而使患者体内产生一些特异性自身抗体[1]。由于系统性红斑狼疮早期诊断困难,致残率与死亡率均高,给患者及家属带来许多的痛苦和遗憾,而本研究应用的人工神经网络对系统性红斑狼疮的诊断,不仅能排除各种人为因素的干扰,而且也能得到较准确和客观的结果。人工神经网络是种理论化的数学模型,是模仿人脑神经的网络结构及其功能而建立起来的一种信息处理系统,具有自适应性、自组织性、容错性、联想性等特点[2,3]。本文通过系统性红斑狼疮疾病的4个敏感的诊断指标(ANA,dsDAN-ab,C3,C4),应用人工神经网络对疾病进行预测诊断,结果表明人工神经网络可用于系统性红斑狼疮的疾病诊断。
1 人工神经网络原理
1.1 人工神经元
人工神经网络由多个层次组成,每一个层次包含若干个神元。如图1显示了一个具有n个输入分量的人工神经元模型。
在神经网络中,除了第一层次的其它神经元,都是由来自上层神经元的输入变量(,,…,)和相对的连接权重(,,…,)的点乘积的和构成其总输入。神经元总输入值在函数f的作用下并同时给与适当的阈值θ刺激,就能够产生信号输出。图中的连接权重表示的意义是上级神经元对下级神经元的影响程度,f是神经元的激活函数,一般采用S型函数。
1.2 人工神经网络
人工神经网络是一个以有向性拓扑结构的动态系统,通过连续或断续方式的输入状态而进行处理[4]。目前根据各个层次神经元的连接方法不同,其中使用最多、具代表性的是误差反向传播的多层前馈式网络,即BP(Back—Propagation)网络。BP神经网络是由大量“神经元”互连而成的网络,通常由输入层、隐含层和输出层3个层次组成。神经网络输入层的神经元首先接受外界的信息,然后通过一个连接权重传递给下一隐含的神经元,其次隐含层神经元对数据进行分析处理,把得到的结果传递给输出层神经元,最后输出层神经元经过转换把信号传给外界。
1.3 人工神经网络工作原理
人工神经网络通过特定的学习算法得到了神经元之间的连接权,同时也获得了病例样本的各种信息,这一过程称作训练,人工神经网络经过训练就能得到疾病诊断的各种规则。人工神经网络应用以上学到的诊断规则,就能在新的样本病例中进行疾病预测。基于以上这点,本文首设定一个人工神经网络的期望值,当这些期望值,提供给人工神经网络学习后,神经元就能够获得网络的输入响应并产生相对应的连接权值。然后人工神经网络按减小期望输出与实际输出误差的方向,从输出层经各中间层逐层修正各连接权值,最后回到输入层。如果计算结果给出了错误的判断,此时人工神经网络通过下一步的学习,就可以减少犯同样错误的可能性,这种过程将反复交替的进行,直至整个人工神经网络的全局误差趋向预期目标,此时人工神经网络完成学习的过程。人工神经网络通过这种训练,提高了疾病判断的准确率,这就表明人工神经网络对疾病规则的学习已经获得了成功,同时也能够对疾病作出迅速、准确的判断。
2 神经网络诊断SLE实例
2.1 BP神经网络的算法
首先将训练和预测用的病例数据整理成易于MATLAB读取的文本,其次设定人工神经网络的期望值,将训练病例数据导入其中进行训练,训练完成后,将预测数据导入到训练好的神经网络里面进行仿真,最后输出仿真结果。
2.2 病例选取
试验病例样本来源为1996年至2008年期间哈尔滨医科大学附属医院收治的门诊或住院的系统性红斑狼疮患者。共计350例,其中女320例,占91.4%;男30例,占8.6%;男女之比为1:10.67,年龄1~79岁,平均年龄为40.53岁。所有患者均符合1982年美国风湿病协会(ARA)制定的SLE诊断标准[5]。SLE患者均进行各项免疫学指标检查及结果记录。病历询问及体检均由有临床经验的医生进行,所有患者均进行详细的病史询问和体格检查。每例病历包括了100多个计量、分级指标,包括该病人入院时的基本资料、体格检查结果、实验室化验结果。其中,体格检查99项,实验室检查34项,病人资料12项。本文将以上的指标进行因子分析取得目标数据。所谓的因子分析,是在为数众多的因素中,不损失或很少损失原有信息的基础上,把原来多个彼此相关的因素转化为少数几个彼此独立的、能综合反映原有信息的综合指标的一种多元统计方法。通过求出每个公因子的方差贡献,取累计方差贡献率大于80%(可根据相关的专业知识,对此值进行调整)的前m个公因子,根据各影响因素在公因子中所起的作用,确定其是否为主要影响因素。其基本思想是根据相关性大小把原始变量分组,使得同组内的变量之间相关性较高,而不同组的变量间相关性则较低。按照前面所述的思想对数据进行筛选,最后得到权重比较大的4个指标,即ANA,dsDAN-ab,C3,C4,进行神经网络的模拟分析。
随机抽取临床样本26例,取19例作为神经网络训练样本(7例正常,12例不正常),取剩余的7例数据进行预测(预测数据如表1所示),使用MATLAB作为算法的实现工具。
2.3 建立神经网络
使用newff语句建立BP网络,设置隐藏神经元数目为4,并且选择各神经元的传递函数分别为tansig和purelin,设置反传递函数为: 2.4 设定网络参数
使用函数train对人工神经网络进行训练之前,先要设置网络训练参数。本文设输人工神经元个数为4,输出神经元个数为1,期望目标输出值用0表示正常,用1表示系统性红斑狼疮,隐含层用tansig函数,训练时间为5000个单位时间,训练目标为误差小于0.01,显示速度为50ms,学习速率为0.05,网络连接权重初始值设为【-1,1】之间的随机数,MATLAB程序编写如下:
2.5 训练及预测结果
将训练病例的四个指标输入到人工神经网络的算法程序中,神经网络训练次数达到5000后,期望误差值缩小到了0.0923,训练完毕后,将训练结果与实际值进行比较,见图2。
将预测用的病例数据导入到训练好的神经网络中进行疾病预测,预测输出以0.5为阈值,>0.5者为系统性红斑狼疮患者,<0.5为正常对照样本,预测结果如下图3所示。
将训练与预测两项结果作如下统计,结果见表1。
3 讨论
本课题所采用的基于人工神经网络的系统性红斑狼疮的诊断结果能较好地与病例数据相符合,具有较高的准确性,同时有利于疾病的早期发现和治疗。然而在神经网络的预测过程当中,神经网络的建立是至关重要的。如果选取了不恰当的参数,或者输入的训练数据不够典型(不具关联性),这样建立的网络往往达到不到预期要求,其预测结果也就往往和实际有所偏差,而本文设定的网络参数能较好的满足实际情况的要求。
临床上由于各种原因,试验中有些病例数据不够完整,这些缺失的数据会给临床疾病的诊断造成一定的影响,但由于神经网络具有较强的容错性,所以输入数据在某些项上的缺失或是错误对神经网络最终运算的结果影响不大,同时由于神经网络所具有的优点和特性使得它成为医学诊断研究的有效工具。在神经网络应用中,只要我们建立适当的网络模型,确定完整的数据样本,经过网络模型训练医学专家的知识和经验,就可以使操作智能化、自动化,并具有较高的可信度,将极大减轻医务人员的工作负担,所以神经网络在医学诊断领域具有很大的发展潜力。
参考文献
[1] 王国丽,胡鹭芳.671例系统性红斑狼疮临床及自身抗体检测结果分析[J].中国麻风皮肤病杂志,May2006,Vol.22No.5:430-430.
[2] 毛政利,闫继涛,赖健清.金属矿山[J].2009,(07):66-68.
[3] 卜宪敏,郑智勇,玉英豪.神经网络在病理学自动识别中的应用[J].中国体视学与图像分析,2005,10(2):122-126.
[4] 巫影,陈定方,唐小兵等.神经网络综述[J].科技进步与对策,2002,(6):133-134.