Web挖掘在吉林省科技信息网上的应用

来源 :吉林大学 | 被引量 : 0次 | 上传用户：godman007

【摘要】

：

WWW是一个开放的全球性资源,它包含了海量的跟人类生活密切相关的数据,随着WWW上信息爆炸性的增长,Web是复杂度也以惊人的速度发展,大量的客户浏览信息和访问信息被Web服务器

【作者】

：

李剑锋

【机构】

：

吉林大学

【出处】

：

吉林大学

【发表日期】

：

2003年期

【关键词】

：

Web挖掘技术科技信息网据预处理记录挖掘算法模糊聚类算法

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

WWW是一个开放的全球性资源,它包含了海量的跟人类生活密切相关的数据,随着WWW上信息爆炸性的增长,Web是复杂度也以惊人的速度发展,大量的客户浏览信息和访问信息被Web服务器自动收集,并保存在访问日志、引用日志和代理日志中.因此,有效地对这些Web日志文件进行数据挖掘、定量分析,揭示其中的关联关系、时序关系、页面类属关系、客户类属关系和频繁访问路径,可以优化站点结构,发现潜在用户,确立目标,改进决策,使网站获得更大的经济效益和社会效益.该文的主要工作就是Web挖掘技术在吉林省科技信息网上的应用,包括数据预处理技术和具体的算法与实现.通过对国际上几种典型的Web使用记录挖掘算法的研究,我们选取了模糊聚类算法,并对其加以改进和完善,改进后的算法与其它算法相比,简单有效,准确度高,更适合于吉林省科技信息网的挖掘.

其他文献

实时进程调度与死锁处理的研究

该文通过对Linux的进程调度进行分析,发现Linux关于实时进程的优先级没有涉及到实时进程的截止期和进程的紧迫性,为了增强Linux关于实时进程的处理,该文提出了一种优化改进调

学位

进程调度死锁优先级优先级逆转调度策略Linux核心态

固定无线接入网络中TCP拥塞控制的研究与改进

TCP是因特网上的主要传输协议,在数据包丢失主要是由拥塞引起的传统网络上,TCP可以充分发挥其性能.但是在固定无线接入网络中,TCP将信道比特差错引起的数据包丢失误归于网络

学位

固定无线接入网络TCP协议拥塞控制

一种基于RTP协议的实时视频传输反馈拥塞控制算法的研究与实现

因特网的网络带宽具有时变性.视频流传输速率高于网络带宽时会发生阻塞,造成突发的丢包和延时过大;视频流传输速率低于网络可用带宽,就无法有效地利用网络资源.因此,保证与提

学位

RTP协议实时传输拥塞控制服务质量

企业级文件传输及数据处理方案的设计与实现

为了适应企业发展的要求,提高软件抽象的层次,并在此基础上提高软件的质量和软件组织的开发效率,该文应用构件技术,提出一个适合于企业级文件传输与数据处理的系统总体结构.

学位

文件传输数据处理JMSMessage-Driven BeanEntity Bean电子申请系统

基于ONTOLOGY的WEB页面信息抽取

Web数据的组织格式主要以半结构化为主.不像结构化数据,半结构化的数据对于数据查询是十分不易的.该文在信息抽取中引入了Ontology(本体)的技术,提出了一种基于Ontology、能

学位

信息抽取Ontology概念模型

用于家庭网络的IP防火墙管理系统的设计与实现

该文的研究工作就是以此为背景而展开的.该文首先介绍了家庭网络技术.然后讨论防火墙技术和目前用于家庭的主要安全产品.在此基础上对用于家庭网络的防火墙进行了分析了研究.

学位

家庭网络网络安全IP防火墙包过滤管理系统

集群Web服务器中数据复制算法的设计与实现

该文对集群Web服务器的数据复制进行深入的研究之后,提出了一种架构于Linux虚拟服务器基础之上,采用普通PC机作为集群节点的集群Web服务器结构;同时还给出了相应的数据复制算

学位

集群Web服务器数据库集群数据复制

基于Client/Server的应用系统开发支撑框架的研究

该文针对其中比较普遍的问题,分析了MIS的共性,引入了当前比较成熟和先进的COM技术,提出了基于Client/Server应用系统的通用开发框架思想,并将这种思想运用到实践,形成一个MI

学位

管理信息系统COM技术成功率企业

多运营商环境下IP电话经营的竞争模型

该文从IP电话的经营特征出发,建立了多运营商竞争环境下的静态模型,并利用对策理论和优化理论探讨了该模型的解法.有助于指导运营商参与有效的竞争.同时,也为政府进行必要的

学位

IP电话对策论非线性优化多目标规划

公安人口信息的分类挖掘算法研究

将物理的或抽象的对象,根据它们之间的相似程度,分为若干组,其中相似的对象构成一组,这一过程称为聚类过程.由聚类所生成的簇是一组数据对象的集合,这些对象与同一个簇中的对

学位

模糊聚类增量式聚类遗传算法神经网络在线分析处理

Web挖掘在吉林省科技信息网上的应用

其他学术论文