Web挖掘在吉林省科技信息网上的应用

来源 :吉林大学 | 被引量 : 0次 | 上传用户:godman007
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
WWW是一个开放的全球性资源,它包含了海量的跟人类生活密切相关的数据,随着WWW上信息爆炸性的增长,Web是复杂度也以惊人的速度发展,大量的客户浏览信息和访问信息被Web服务器自动收集,并保存在访问日志、引用日志和代理日志中.因此,有效地对这些Web日志文件进行数据挖掘、定量分析,揭示其中的关联关系、时序关系、页面类属关系、客户类属关系和频繁访问路径,可以优化站点结构,发现潜在用户,确立目标,改进决策,使网站获得更大的经济效益和社会效益.该文的主要工作就是Web挖掘技术在吉林省科技信息网上的应用,包括数据预处理技术和具体的算法与实现.通过对国际上几种典型的Web使用记录挖掘算法的研究,我们选取了模糊聚类算法,并对其加以改进和完善,改进后的算法与其它算法相比,简单有效,准确度高,更适合于吉林省科技信息网的挖掘.
其他文献
该文通过对Linux的进程调度进行分析,发现Linux关于实时进程的优先级没有涉及到实时进程的截止期和进程的紧迫性,为了增强Linux关于实时进程的处理,该文提出了一种优化改进调
TCP是因特网上的主要传输协议,在数据包丢失主要是由拥塞引起的传统网络上,TCP可以充分发挥其性能.但是在固定无线接入网络中,TCP将信道比特差错引起的数据包丢失误归于网络
因特网的网络带宽具有时变性.视频流传输速率高于网络带宽时会发生阻塞,造成突发的丢包和延时过大;视频流传输速率低于网络可用带宽,就无法有效地利用网络资源.因此,保证与提
为了适应企业发展的要求,提高软件抽象的层次,并在此基础上提高软件的质量和软件组织的开发效率,该文应用构件技术,提出一个适合于企业级文件传输与数据处理的系统总体结构.
Web数据的组织格式主要以半结构化为主.不像结构化数据,半结构化的数据对于数据查询是十分不易的.该文在信息抽取中引入了Ontology(本体)的技术,提出了一种基于Ontology、能
该文的研究工作就是以此为背景而展开的.该文首先介绍了家庭网络技术.然后讨论防火墙技术和目前用于家庭的主要安全产品.在此基础上对用于家庭网络的防火墙进行了分析了研究.
该文对集群Web服务器的数据复制进行深入的研究之后,提出了一种架构于Linux虚拟服务器基础之上,采用普通PC机作为集群节点的集群Web服务器结构;同时还给出了相应的数据复制算
该文针对其中比较普遍的问题,分析了MIS的共性,引入了当前比较成熟和先进的COM技术,提出了基于Client/Server应用系统的通用开发框架思想,并将这种思想运用到实践,形成一个MI
该文从IP电话的经营特征出发,建立了多运营商竞争环境下的静态模型,并利用对策理论和优化理论探讨了该模型的解法.有助于指导运营商参与有效的竞争.同时,也为政府进行必要的
将物理的或抽象的对象,根据它们之间的相似程度,分为若干组,其中相似的对象构成一组,这一过程称为聚类过程.由聚类所生成的簇是一组数据对象的集合,这些对象与同一个簇中的对