神经网络作为分类器的算法研究及在信息检索中的应用

被引量 : 23次 | 上传用户:flnlucifer
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文以统计理论为基础,主要讨论在计算机上用软件模拟实现的神经网络分类器。在综述了神经网络作为分类器的研究现状及存在问题的基础上,着重对构造性学习方法中的覆盖算法进行深入的探讨和改进,以达到缩短学习时间、简化网络结构、提高分类精度的目的。主要的研究内容及创新如下: (1) 提出了覆盖算法的概率模型,并利用有限混合模型的极大似然拟合,用期望最大化算法对覆盖算法进行优化处理。将用原覆盖算法所得到的覆盖结果看作是一个预处理,将覆盖某一类样本的覆盖数看作是有限混合模型中的分量数目,解决了有限混合模型中分量数目难以估计这一难题,而不是主观地去估计分量的数目。某一类样本有多少个覆盖,就认为有限混合模型中的分量数目是多少,将覆盖某一类样本的每个覆盖看成一个Gauss分布,利用混合模型的极大似然拟合,用期望最大化算法来对覆盖算法进行优化处理。扩大了覆盖算法的应用范围,模拟结果表明新算法提高了测试精度。 (2) 对覆盖算法中的参数与测试精度的关系进行了研究。得出的结论如下:当原空间的k维样本向特征空间的k+1维投影时,超球半径的大小R与测试精度、拒识样本数之间几乎没有关系;对覆盖半径中参数n的取值与测试精度关系进行了研究,当n=1/2(即覆盖半径取同类样本中的最大距离与异类样本中的最小距离的算术平均)时测试精度达到了最高,这相当于SVM中的最优超平面;对覆盖算法中样本的学习顺序与网络性能的关系进行了分析实验,实验结果表明将样本按类别排序后所得到的网络,其性能比未排序时所得到的网络有不同程度的提高。 (3) 研究了覆盖算法中覆盖半径的大小与识别精度之间的关系。 本文提出通过扩大覆盖半径和加入异类点,来减少覆盖数目和隐层神经元个数,在网络规模尽可能小的情况下,虽然增加了有限的学习时间,但提高了学习的精度。实验证明PBCA对神经网络的训练是有效的。 在网络结构上,提出了由前馈网络和反馈网络组成的神经网络的混合结构。前馈网络完成样本的第一次分类,用反馈网络对边界样本或拒识样本进行第二次分类。
其他文献
随着以信息技术为核心的知识经济时代的到来,高新技术企业作为中国经济增长的原动力,通过技术创新实现可持续发展,日益受到人们的关注。然而,在中国高新技术企业的蓬勃发展过程中
元代宫廷服饰制度是蒙古社会进入封建中央集权阶段以后出现的一种必然性产物。它的形成、建立是元代政治、经济、文化、制度等多重因素综合作用的结果。元代宫廷服饰制度恪守
商务智能是对商务信息的搜集、管理和分析过程,使企业决策者获得知识或洞察力,做出更有利的决策。当前数据爆炸的信息时代,企业决策者对提取智能决策知识的分析方法提出更高
自从改革开放以来,我国与世界各国加强文化交流。其中影视交流占了较大比例。随着国际间文化交流日益频繁,信息时代数码技术不断发展,影视作品的对外译介和引进外国影视作品在数
语文教育的内容有读写听说四大支柱,其中阅读可谓重中之重。读是输入,写是输出,读既是写的基础,同时又带动着听说。这足见阅读在教育中举足轻重的地位和担纲的意义。所以,学习语文
目的 研究D15S659和D9S925基因座的群体遗传学和等位基因序列特征,积累群体遗传学数据,探讨其法医学应用价值,为法医遗传学提供新的候选遗传标记。 方法 以109名华东地区汉族
用于电线电缆的绝缘料和护套料大都是有机聚合物,在一定的温度和氧气浓度下会引发燃烧。为减少火灾隐患,对电线电缆所用的聚合物进行阻燃处理是十分必要的。目前,工业上阻燃聚烯
面对知识经济和高技术的挑战,培养具备科学素质和人文素质的高素质人才乃是当前教育的共同目标。科学教育和人文教育是时代发展的必然要求,是当代教育发展的必然选择,是未来教育
语文学科是人文教育学科。人文教育就是塑造人的灵魂的教育,塑造民族灵魂的教育。学语言,从某种意义上说就是学文化。学习语言的过程,就是对民族意识的体验过程。《高中语文
目的:通过多胎妊娠孕中期选择性减胎术的临床应用,探讨手术指征、时机、方法、目标胎儿的选择标准和减灭胎儿的数目,不断积累临床经验,确保其安全性和有效性,以改善多胎妊娠的不良