基于BP神经网络的WEB数据挖掘

来源 :中南民族大学 | 被引量 : 0次 | 上传用户:leobear
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
WEB文本挖掘是WEB数据挖掘的一个研究方向,WEB文本挖掘过程中最重要的是如何对文档内容进行有效分类,文本分类精度越高,WEB查询结果就越接近于理想的要求,在实际的应用中越能够让使用者满意,所以如何设计一个高效的文本分类算法至关重要。在众多的分类算法里,BP神经网络算法因其:可以把一组样本的I/O问题变为一个非线性问题;实现I/O非线性映射;全局逼近网络;泛化能力等特点而被广泛应用。本文对WEB数据挖掘的发展和应用作了介绍,讨论了WEB数据挖掘的相关内容,并对使用的算法进行了概述,在前人工作的基础上,对WEB内容挖掘过程中涉及到的WEB文档分类的相关算法进行了讨论,着重对BP神经网络算法进行了深入的探讨,并在此基础上给出了自己的BP神经网络改进算法,将此算法应用在多子网并联拓扑结构上对WEB文档内容进行分类,实验结果表明改进算法的性能有了明显改善。论文具体的研究内容包括以下几方面:⑴介绍了论文的研究背景及意义,对数据挖掘的概念、数据挖掘的分类、使用的挖掘算法、数据挖掘的过程等进行了详细的阐述。⑵着重对WEB数据挖掘的内容,WEB数据挖掘的分类,WEB数据挖掘的过程进行了阐述,尤其对WEB内容挖掘的挖掘内容、挖掘过程、相关算法进行了详细的阐述。在WEB内容挖掘过程中,对文档内容进行分类非常重要。⑶论文对神经网络算法的内容、原理进行了阐述,尤其对BP神经网络算法详细阐述了其概念、原理、拓扑结构及优缺点等,针对其收敛率不高和误差偏大等特点,对算法进行了改进,提出了BP神经网络改进算法,提高了算法的收敛率并降低了误差。⑷多子网并联神经网络算法是通过优化普通三层BP神经网络算法的拓扑结构,从而提高BP神经网络算法性能的一种方法。本文把改进的BP神经网络算法和多子网并联拓扑结构结合使用,使得算法的分类能力有了更大的改进。实验结果表明使用多子网并联结构的BP改进算法进行WEB文档分类可行,且性能有了较大的提高。
其他文献
单元测试是集成测试与系统测试的基础,是测试驱动开发与软件重构的基石。随着测试驱动开发方法的流行,单元测试愈发重要。本文主要研究Java程序的单元测试。通过对单元测试理
并发签名体制作为一种特殊的数字签名公平交换协议,自2004年Chen et al.在欧洲密码学会上提出以来,并发签名体制得到了广泛的关注和研究。运行这类协议使得交易双方或者同时
目前,细分曲面造型技术已被广泛的用于计算机动画,多分辨率分析等领域。细分曲面以其实现简单、可表示任意拓扑结构以及能更好的解决曲面间拼接问题的巨大优势,正逐渐取代NUR
随着网络和多媒体通信的发展,不同网络上各种视频信息的交流需求在不断增加。由于网络和终端设备的多样性,编码得到的视频流不一定是最优的。当在具有不同的信道特征的网络上
在当今互联网高速发展的时代,人们已经逐渐倾向于从网络上获取各种各样的信息。但是,随着用户和应用的日益增长,随之而来的流量剧增却使得网络变得更加拥塞,并直接导致了网络
在线社交网络中,异常账户是始终存在的。在现代社会,对于异常账户的检测通常使用的是信息本身的特征来设计,使用基于交互、基于排名、基于数据特征等方式来达到相应的检测目
视频目标跟踪是计算机视觉领域待解决的核心问题之一,它是一系列后续工作任务的基础。尽管视频目标跟踪已经经过了数十年的研究,且已经开发出许多高效的跟踪算法,但这些算法
近年来,随着3D显示技术的迅速发展,3D电视已成为我们日常生活中的一个重要电子产品。基于深度图像绘制(depth-image-based rendering,DIBR)是3D显示的关键技术。它能够合成一
人脸识别技术是一种利用计算机提取人脸图像中特殊表征信息并基于该信息实现对象匹配和分类的身份识别技术。在实际生活中,人脸图像的采集更方便和直接,因此人脸识别技术被广
计算机通信技术的飞速发展给数字产品的传播带来了极大的便利,与此同时数字产品也面临着日益严重的版权纠纷问题。如何对数字产品进行有效保护已经成为信息化时代一个迫切需