面向Web日志数据挖掘的研究与应用

被引量 : 0次 | 上传用户:hwyvvv
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘是近年来随着数据库和人工智能技术的发展而出现的一种全新信息技术,也是计算机科学与技术,尤其是计算机网络的发展和普遍使用所提出的而且迫切需要解决的重要课题。数据挖掘是指从数据中提取模式的过程,数据挖掘的提出,让人们最终有能力认识数据的真正价值,即蕴藏在数据中的信息和知识。数据挖掘技术的产生,使得用户可以从大量的数据中发现隐含的规律,从而为决策提供更可靠的依据。数据挖掘必须建立在结构化良好的数据基础之上,传统的数据库都有一定的数据模型,可以根据模型来具体描述特定的数据,同时可以很好的定义和解释相关的查询语言。由于web上存在许多半结构化数据,即便在web上得到一些相关数据,将其用于挖掘和分析也是相当困难的,因此,面向web的数据挖掘要比面向单个数据仓库中的数据挖掘要复杂的多。由于Internet和WWW的广泛应用,出现了基于异构数据源的数据挖掘,如文档数据挖掘、时间序列数据挖掘、电子商务系统中的数据挖掘。伴随数据库技术的发展,多媒体数据库的数据挖掘、空间数据库的数据挖掘等也引起了许多人的关注。Internet的迅猛发展,尤其是Web的全球普及,使得Web上信息量无比丰富。通过对Web的挖掘,可从Web页面中提取所需的知识:对总的用户访问行为、频度、内容的分析,可得到关于群体用户访问行为和方式的普遍知识,用以改进Web服务设计。更重用的是,通过对这些用户特征的理解和分析,有助于开展有针对性的电子商务活动。随着数据挖掘和万维网技术的结合,使得从收集到的访问Internet网页的网站日志记录中进行数据挖掘成为可能。将数据挖掘技术应用于Web日志记录,来发现用户访问Web页面的模式,便形成了Web访问模式挖掘。它对于优化站点结构、为不同类别的用户提供个性化服务,有效地实现信息获取和信息推送是非常必要的。Web访问模式挖掘是目前数据挖掘领域的热点课题之一,也是Web日志挖掘的主要目标之一,本文的研究目的是发现更多有意义的序列模式。本文系统地阐述了从数据挖掘、Web数据挖掘到Web日志挖掘整个过程。通
其他文献
提出了一个用于任意Web信息系统的通用查询模块,它通过在配置文件中定义查询的方法取代了繁琐的查询页面的编写,使查询功 能开发迅速、维护简便。文中介绍了模块的设计思想、
目的比较椎间盘摘除术与椎间盘融合术治疗再发性腰椎间盘突出症的临床疗效。方法将206例再发性腰椎间盘突出症患者按照病情和手术方式不同分为观察组和对照组各103例。观察组
随着城市的发展,能源消耗日益增加,成为了摆在人们面前的难题。意识到能源节约的重要性,在市政路灯照明电气系统中运用无功补偿技术,可以减少造成的损耗。因此要加强对无功补
随着财政支出规模的加大,政府将加强财政支出的有效性控制。分析省级农业科研事业单位财政预算绩效管理的意义,介绍其实施的政策背景和主要内容,以为省级农业科研事业单位的
目的:白内障术后眼内炎是眼科手术不常见的并发症,但极具破坏性,难以治愈.本文通过探讨手术前后及早预防、早发现、早诊断、早治疗,将病情危害控制到最低程度.方法:术前准备
电主轴作为数控机床的关键部件,其驱动控制的动态性能决定加工工件的质量,是高速数控机床设计和制造所关注的重要指标。直接转矩控制是高速电主轴的控制方法之一,是目前交流
2016年5月1日起,我国全面推进"营改增",至此营业税正式退出历史舞台,基于对政策的理解,对于"营改增"的背景、对于中小企业的影响以及对于中小企业的发展机遇进行探讨。
目的 探讨显微手术应用于输卵管复通中的效果.方法 72例病人采用显微外科技术行输卵管复通术.病人分为绝育术后组,不孕组(输卵管炎性阻塞)及异位妊娠组;3组均使用外科显微器
知识管理是当今管理科学、信息科学交叉融合的最新理论成果之一,日益受到理论界与产业界的关注,知识管理已经建立了一套理论体系。伴随经济全球化知识化步伐,企业的空间聚集、市
社会的不断进步使得医学护理模式发生了很大的转变,其不仅与病人疾病本身固有的因素有关,还与整个社会环境、病人心理情况、以及护理人员的语言行为等因素有关,这种模式越来