【摘 要】
:
WWW是一个开放的全球性资源,它是世界上最丰富和最密集的信息来源。随着WWW上信息的爆炸性增长,在如此海量的数据中发现有用的信息变得越来越困难。数据挖掘就是从大量的数据
论文部分内容阅读
WWW是一个开放的全球性资源,它是世界上最丰富和最密集的信息来源。随着WWW上信息的爆炸性增长,在如此海量的数据中发现有用的信息变得越来越困难。数据挖掘就是从大量的数据中发现隐含的规律性的内容,解决数据的应用质量问题。充分利用有用的数据,废弃虚伪无用的数据,是数据挖掘技术最重要的应用。因此,采用数据挖掘技术从WWW上提取隐含的、未知的、非平凡的及有潜在应用价值的信息,具有十分重要的现实意义和广泛的应用前景。本文首先简要论述了WWW发展的基本现状以及当前存在的一些问题。随后,简要介绍了数据挖掘技术的基本概念、原理,接着,概要的介绍了本文对于Web数据挖掘所用到的技术—Java和XML技术,在此基础上研究了数据挖掘技术在WWW上的应用,针对Web数据内容挖掘进行了详细地论述。文中通过一个具体的案例详细论述了实现Web数据内容挖掘的一种方法以及对该方法的分析。最后,对全文进行了总结。
其他文献
工作流管理系统有效的适应了现代企业和政府业务变化较快的特点,可以灵活的根据预定的目标优化工作流程,其在企业和政府的应用会给企业和社会带来巨大的效益.但是现有的系统
随着互联网络的发展,当前拒绝服务攻击工具随处可得,且易操作,使得分布式拒绝服务攻击的发生频率越来越高。分布式拒绝服务攻击已被公认为互联网上最难解决的问题之一,尤其是带宽
在当今信息化时代,教育作为人类社会生活的重要领域,不管从教育形式、教学方法乃至师生关系都正在发生巨大的变化.计算机及网络对各个国家都产生了广泛而深刻的影响,并渗透到
随着软件的规模越来越大,内容越来越庞杂,先进的软件开发过程和方法成为软件项目开发成败的关键。通过对国内一些中小软件企业的调研,结果显示我国的软件开发现状十分不容乐观,一
在现实世界中,很多问题都要涉及对多个目标进行优化。因此多目标优化也成为近30年来迅速发展起来的一门新兴学科。 本文提出了一种新的方法来进行多目标优化。根据对GA存在
该文首先介绍了移动Agent的基本概念、技术优势、面临的挑战.然后,该文提出一种基于Agent和Place的层次结构移动Agent模型,以及基于此模型的移动Agent系统FreeMA.在该模型中,
直接体绘制技术可以高效地对复杂的三维体数据进行部分或整体绘制,其较高的绘制速度以及灵活性可以满足用户不同的需要。直接体绘制的结果直观、立体,但往往缺乏一定的真实感,难
本文作为国家高技术研究发展计划(863计划)课题“基于颅骨的身份认证与鉴别技术”的一部分,对计算机辅助颅像重合中的一些关键技术和主要算法做了深入的研究。主要工作包括以
随着国民经济的快速发展,高速公路以“高速”的突出优势日益成为公路运输的主要交通设施。如何减少交通拥挤和交通事故造成的损失,以更加科学的手段对高速公路状况进行监控和显