结合时间窗的用户访问兴趣聚类分析

来源 :中南大学 | 被引量 : 0次 | 上传用户:zhucaiguai
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,Web技术快速发展和广泛应用促使各站点积累了大量的业务数据,从这些数据中发现具有相似访问兴趣的用户群体具有重要的意义。论文研究了结合时间窗的访问兴趣聚类分析,解决了以往兴趣模型单纯考虑页面喜好所导致的聚类结果准确度不够的问题。在分析影响页面喜好的各因素以及用户访问时间规律性的基础上,本文提出了多用户页面访问兴趣模型、多用户时间窗访问兴趣模型和多用户多页面的时间窗访问兴趣模型,以分别用于描述各用户对于各页面的访问情况、各用户在各时间窗内对站点的访问情况和各用户对于各页面在每一时间窗内的访问情况,从不同角度剖析了用户的访问兴趣。在以上模型的基础上,提出了页面喜好协调时间窗的聚类算法、时间窗协调页面喜好的聚类算法和页面喜好结合时间窗的聚类算法,综合了页面喜好和时间窗访问因素提升了聚类结果的准确度和丰富程度。实验表明,页面喜好协调时间窗的聚类算法和时间窗协调页面喜好的聚类算法在综合页面喜好和时间窗的基础上,有效地改善了单纯地考虑任一因素所导致的准确度不够的问题;页面喜好结合时间窗的聚类算法在结合页面喜好和时间窗因素的基础上,通过优化初始点选择算法有效地克服K-Means算法对初始点过于依赖的问题。
其他文献
随着计算机、网络、通信、传感、微电子等技术研究成果的不断涌现,推动了低功耗、低成本、多功能传感器技术的不断发展,使其在微小体积内能够集成信息采集、数据处理和无线通
如今无线网络接入、移动便携设备以及基于VPN的远程接入在传统企业内网中得到了广泛的应用,原本仅限于内网中使用的,受各类内网安全设备保护的主机有了更多暴露在外部无防护
《外贸英语函电》是外贸业务员岗位的一门重要课程,教学实践中所面临的问题不少.通过分析这些问题以及调查数据,提出函电教学可采用基于合作学习的成果导向教学模式.经教学试
在大数据时代,用户面临对海量数据进行有效概括和快速定位的问题。将同一概念的相关内容以专题的形式展现给用户是解决上述问题的有效途径,如百度百科和维基百科等都以目录的形
容忍入侵作为一种新的技术,它为保护网络系统提供了新的方法和思路,关注的是在攻击不可避免的情况下的系统的生存能力。本论文着重研究了秘密共享技术在保护数据上的应用,设
当前,嵌入式技术已经成为信息产业发展的主流技术,数字音频技术也已渗透到互联网、广播、个人消费电子产品和数字影视等众多领域。随着嵌入式技术和数字音频技术的高速发展,
近年来,随着基坑深度迅速增加到20m-30m,在城市中出现了大量的超深超大的非对称基坑,在含水量丰富的软土地区,基坑开挖不可避免地要遇到地下水问题,若采用止水帷幕或地下连续墙对