基于神经网络的数据挖掘方法研究

来源 :武汉大学 | 被引量 : 0次 | 上传用户:wxsshj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着现代信息技术的迅速发展,许多领域都积累了大量的数据,我们渴望发现潜在于这些数据中的知识与规律,正是这一需求造就了数据挖掘学科的兴起及数据挖掘技术的发展.作为一个多学科交叉的综合性领域,数据挖掘涉及了数据库、统计学、机器学习、高性能计算、模式识别、神经网络和数据可视化等学科.数据分类作为一种重要的数据挖掘技术有着广泛的应用,在这一研究方向上,目前已提出了多种分类方法,如决策树归纳分类、贝叶斯分类、神经网络分类和K最邻近分类等.传统的挖掘算法对于数据有噪声、信息有冗余、数据不完整、数据稀疏等情况下,效果往往不佳.而神经网络由于其本身良好的鲁棒性、自组织自适应性、并行处理、分布存储、高度容错等特性,特别适用于现实生活中大型的数据库的知识发现.因此,该文提出了一种基于神经网络的数据挖掘方法.该文力求融合智能算法中的多重技术来全面解决数据挖掘问题:神经网络、模糊规则和遗传算法,提出了从数据准备、主元分析消减变量、神经网络分类到规则提取、规则裁剪的一整套挖掘流程.采用了一种随机神经网络模型进行数据分类,利用模拟退火算法(SA)对网络进行训练学习,将随机机制引入到神经网络的学习算法中,有效的改善了目前普遍存在的神经网络局部收敛问题.在神经网络的解释机制上,提出了一种简单实用的基于结构分解的模糊规则提取算法,将神经网络连接权值中的信息表达为"if-then"规则.为了更准确的进行知识表达,将提取出的规则库应用遗传算法进行规则裁剪,删除掉冗余、不准确的规则,保留能最大限度的概括所有知识的最精简的规则.论文选取了四个有代表的数据库,对所提出的数据挖掘方法在MATLAB中进行了仿真,同时与目前比较流行的C4.5决策树算法进行了仿真结果的比较.结论表明,该文提出的数据挖掘方法的有效性明显高于C4.5算法.
其他文献
学位
学位
无线通信系统处于不断的演进之中,新旧系统同时存在,在同一个终端上还会有适合不同应用场景的无线通信系统。将多种无线通信收发器集成在一个芯片上是一种节省电路面积,降低成本的方式。可重配置的无线收发器非常具有价值。基于Delta Sigma调制器(Delta Sigma Modulator,DSM)的射频发射机是一种实现可重配置多标准发射机的方案。基于DSM的射频发射机由DSM和开关功率放大器构成。这种
纳米晶及稀土离子掺杂玻璃呈现出独特的光电特性,如:荧光、非线性、导电性等,广泛应用于激光、传感、照明等领域。均匀分布的半导体氧化物纳米晶共掺可以有效促进稀土离子掺杂玻璃的发光性能,然而精确调控半导体氧化物纳米晶的尺寸和分布是一个难题。本文以纳米多孔石英玻璃为基体,使用溶液掺杂的方法,制备出半导体氧化物纳米晶单掺杂的石英玻璃以及稀土和半导体氧化物纳米晶共掺的石英玻璃,研究了相应的荧光增强性能并揭示了
读出电路作为红外探测器的核心组件,其性能对红外探测器的成像质量至关重要。本文设计了一种基于TSMC0.18μm5VCMOS工艺的阵列规模384×288的氧化钒非制冷红外探测器的读出电路的信号处理电路。该部分电路包含了基准源电路、积分电路、采样/保持电路、多路选择器电路、高速输出缓冲器电路、温度传感器电路,完成各部分电路的仿真并绘制了版图。  基准电压源电路的电源抑制比为77dB@1KHz,其温漂系
宽禁带半导体材料GaN具有极其优异的物理和化学特性,其与AlN组成的三元合金AlxGa1-xN(0<x<1)禁带宽度可以在3.4eV~6.2eV之间连续调节,并且任意组分的AlxGa1-xN三元合金都是直接带隙,这就为紫外探测器的制作提供了优良的材料,随着Al组分的增加,GaN基紫外探测器的工作波段可以从可见光盲转向太阳光盲,后者是目前国际上的研究热点。由于Al原子的寄生反应严重、表面迁移能力差及
学位
为了保护我国领海不受侵犯,维护海洋权益,需要建立一个近海防御与远海防备兼具的海洋防御系统。岸发/GEO星发-船收双基地逆合成孔径雷达(inverse synthetic aperture radar,ISAR)具有全天时、全天候的特性,能够实现对近海/远海海域上舰船目标远距离持续性跟踪、成像和识别。此外,这两种双基地ISAR成像系统还具有隐蔽性高、抗打击能力强、灵活性高、成像模式多以及获得的目标信
乳腺癌已成为女性中常见的恶性肿瘤之一,并且发病率正在逐年升高。乳腺癌的早期诊断有助于乳腺癌提早发现并及时治疗。基于乳腺组织的病理学检查仍然是当前乳腺癌诊断的金标准。随着计算机辅助诊断方法的发展,研究者提出利用计算机辅助乳腺组织病理学显微图像进行诊断的方法。然而,基于手工特征的分类方法依赖于精确的细胞分割和特征提取。由于图像质量的问题,精确分割和有效的特征提取仍然具有挑战性。深度学习方法可以从原始数
学位
智能信息大数据时代的到来,数据量以及数据类型海量地增长。伴随着机器学习理论不断地完善,使得机器学习在现实的生活应用中取得了长足的发展。传统机器学习的目的是通过最小化训练数据上的正则化经验风险来寻找测试数据上期望风险最小的模型,但该模型假设训练数据和测试数据具有相同的联合概率分布。而在自然语言处理、文本处理、计算机视觉、数据挖掘等实际的应用中,上述模型假设基本上无法满足。如何基于存在的不同分布数据散
学位
喷射器可以同时实现流体升压、喷射和混合三方面功能,其以相对简单的机械结构和无运动部件的工作特点,以及低成本易维护、易密封、高可靠、长寿命、工质适应性强等突出优势,是热法低温多效蒸馆(MED-TVC)海水淡化系统和质子交换膜燃料电池(PEMFC)氢循环系统的核心部件。本文在传统喷射器结构与理论基础上,综合应用机理分析、模型仿真和实验验证手段,对喷射器内部流体流动现象、机理以及整体性能进行了深入研究,