【摘 要】
:
随着因特网的快速发展,Web已经成为人类社会的公共信息资源,信息量成几何级数激增。如何充分利用Web信息资源,快速有效的进行分析加工以获取所需知识,对Web信息系统提出了挑
论文部分内容阅读
随着因特网的快速发展,Web已经成为人类社会的公共信息资源,信息量成几何级数激增。如何充分利用Web信息资源,快速有效的进行分析加工以获取所需知识,对Web信息系统提出了挑战,成为研究人员关注的焦点。本文提出一种基于本体的Web挖掘分类方法,本文工作主要包括以下四个方面:通过对Web数据挖掘和语义网中本体概念的分析,对本文提出的基于本体的Web挖掘分类方法进行了整体设计。该分类方法由用户会话层次和领域层次构成,在用户会话层次的使用挖掘基础之上,充分利用领域本体的潜在语义,通过使用领域本体为一个结构化Web对象集合创建带有语义的聚合轮廓图。在用户会话层次,设计并实现了模糊C-均值(FCM)算法,对算法进行改进,包括算法输入的处理,算法聚类数c的确定,算法权指数m的选择以及算法流程的处理等。创建会话层次的使用轮廓图,表示会话层次的数据挖掘效果。在领域层次,研究本体在分类中的应用,结合Web使用挖掘的结果和领域本体实现了领域本体实例的对象化,进而实现分类结果语义化。通过实例说明了如何为不同类型的对象属性创建联合函数,实现了领域层次数据挖掘,显示用户访问相同页面的原因。创建领域层次的聚合轮廓图来表示这个分类集合代表的用户的共同兴趣。作为应用的参考框架,建立了一个实例模型说明本文提出的方法的应用。通过这些工作,本文实现了一个新型的基于本体的Web挖掘分类方法,建立了一个基于此方法的使用流程和模型,理论上进行了验证,并用实例进行了说明。该方法为实现Web环境下的数据挖掘,Web资源的充分利用以及使Web更个性化的为用户服务提供了有力的工具。
其他文献
随着我国社会主义市场经济体系的建立和完善,现代物流在生产、经营活动中越来越体现出它的重要性,近年来现代物流已经成为国民经济的增长热点,随着全球经济一体化的发展和市场的
随着数字产品的普遍使用以及Internet的快速发展,数字权限管理技术应运而生。在复杂的数字权限管理系统中为了更好的保障权限正确执行,需要一种跟踪机制用以描述并记录用户的
随着互联网的飞速发展和网络业务的丰富,网络规模和业务量急速增长,而目前的Internet只能提供尽力而为的服务,在不支持QoS的网络中多媒体等高带宽要求的业务性能会下降,网络
本文在跟踪DNS动态更新最新进展的基础上,提出了客户端/服务器模式的解决方案——动态DNS自动注册系统。即在IPv6网络的某个节点上安装自动注册服务器,在其他节点上安装客户端,
为了减少在切换过程的时延和数据包丢失率,针对移动IPv6提出了许多改进方案。本文在研究若干移动IPv6的改进方案的基础上,结合目前实时通信业务的要求,研究了基于多播技术的
增强现实技术是一种将真实场景同虚拟场景融合的技术,它的目标是解决真实场景视频和虚拟物体的无缝合成问题。AR现在主要的研究工作集中在跟踪、注册和交互技术方面,光照方面现
在实际生活中,许多问题都可以抽象成为多agent模型进行解决,而分布式约束优化(DCOP)算法是近年解决多agent问题的主要算法。多agent问题的求解具有NP难度,如何能够快速的获得
本文分析了目前已经存在的调度算法,并按一定的标准进行了分类,总结了在篮牙Piconet网内采用的特殊传输机制下影响调度算法性能的因素,并提出了一个新的带有QoS支持的新的调度算
本文研究了HMP的应用和参考体系结构,并基于东进USB模拟电话接口硬件,结合CTI传统技术和数字信号处理算法,设计并实现了HMP软件。 本文简单介绍了CTI技术的发展和HMP的概念,论
生物信息学中,后基因组时代的任务是了解基因表达的功能图谱,由于生物功能的主要体现者是蛋白质,因此研究蛋白质的功能就成为后基因组时代的重要研究内容。要了解蛋白质的功