【摘 要】
:
通过发现web日志数据中有用的访问模式可以帮助我们更好的实现web个性化和web结构再调整。目前,对web日志挖掘还处于深入探索阶段,成熟的理论和方法还没有完全形成,有待进一
论文部分内容阅读
通过发现web日志数据中有用的访问模式可以帮助我们更好的实现web个性化和web结构再调整。目前,对web日志挖掘还处于深入探索阶段,成熟的理论和方法还没有完全形成,有待进一步的研究。传统的关联规则算法已不能处理日益庞大的数据量和多样的数据类型,而基于频率的web日志挖掘技术提取出的信息也往往对于最终用户来说并没有太大的效用。本文研究了基于模糊聚类的web访问模式挖掘算法。首先,为了度量不同用户访问模式之间的相似度与相异度,等长的模糊向量被用来刻画用户浏览网页的时间,其中的每个要素要么为0,要么为模糊语言所表示的模糊变量,该向量不仅能够体现用户是否访问过该网页,而且还可以刻画用户在网页上的浏览时间。数据的浏览时间用模糊语言变量来表示,这符合人们的正常思维方式,并且可以忽略访问时间与访问时间之间的微小差异。由于类与类之间不存在清晰的边界,因此使用模糊粗糙K-Means算法对这些表征用户浏览特征的用户模式进行聚类。实验表明,该方法能够有效降低时间复杂度和提高系统准确性。其次,考虑到网页访问频率、访问时间都可以反映用户兴趣,提出了一个新的方法用来解决网页访问模式的提取问题,这个方法在聚类的基础上可高效提取web访问模式,模式值运用了一个用户自定义的评估函数来计算。基于不同数据集的实验表明,上述解决方案可以从大规模数据集中高效发现web访问模式。
其他文献
市场经济的发展使竞业禁止协议的签订越来越普遍,但是司法实践中,员工常常以竞业禁止协议未约定补偿金而与单位发生纠纷,诉至法庭。由于我国《劳动合同法》的相关规定较为模
<正>宁波城市职业技术学院是经浙江省人民政府批准,在原宁波大学职业技术教育学院基础上组建的、独立设置的普通全日制高校。学院现有教职工439人,全日制在校生9455余人,其中
<正>一、实验设计与原理分析如图1所示,小车上固定一个感应线圈(线圈面积与铁芯相当)和很小的挡光片,感应线圈连接一个电压传感器。让小车从倾斜轨道下滑,当感应线圈靠近电磁
论中西人名文化比较与翻译南开大学教授王秉钦专名(,英文propernames),据《语言与语言学辞典》解释为:个人、地方或事物的名称,它与表示物体或概念的总和的普通名词相对。“语言是文化的载体,文
简要论述了在电子对抗中所使用的干扰技术,提出了3种对现代雷达角度跟踪系统进行欺骗干扰的方法,并对这3种方法进行了比较和分析。
目的:探讨预见性护理对减少腹腔镜下输尿管狭窄段切除端-端吻合术后尿路感染及导尿管不良事件发生率的应用效果。方法:2015年1月-2018年11月收治输尿管狭窄患者98例,均接受腹
切削过程在工件表层产生的残余应力是表征加工表面完整性的重要指标,零件内的残余应力分布状态很大程度上影响材料的疲劳强度,耐磨损及抗应力腐蚀开裂性能,从而影响关键零部
中国银行股份有限公司(以下简称“中国银行”)是中国大型国有控股商业银行之一,在全球范围内为客户提供全面的金融服务,业务范围涵盖商业银行、投资银行、保险、基金管理等领域。
本文介绍了智能蓝牙锁的系统结构和工作原理 ,提出了智能蓝牙锁的硬件设计和软件控制方法 ,并通过实验验证了该智能蓝牙锁的运行可靠性
“儿童作为研究者”是指儿童作为社会当中的成员,有意识地掌握并采用适宜的研究方法参与或领导研究项目,积极主动地对社会生活进行建构并从中谋求儿童自身权利的实践活动。在