基于关联规则的用户日志挖掘研究

来源 :南京大学 | 被引量 : 0次 | 上传用户:szmms
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
网络的飞速发展吸引了越来越多的用户使用互联网,这些互联网使用群体通过互联网来获取信息、帮助决策,甚至解决自己生活所需。根据受教育程度的不同,不同用户群体对网络的操作特征也各不相同,部分用户可以及时改进自己的检索策略来获取自己所需要的信息,但是大部分的用户并不能实现自我改善,他们不知道如何从大量的数据中获取到自己需要的东西,因此需要网站本身提供一些技术支持。如何了解用户使用行为模式来更好的吸引用户以及让用户具有较好的人机交互体验是现阶段网络研究者最需要解决的问题,而日志挖掘作为其中一种研究用户群体特征的方法,具有操作可行性高以及结果准确性高的特点,成为网络环境下用户行为分析的一个重要方法。本研究拟面向大数据应用环境,研究基于日志挖掘的经典算法——FP树挖掘算法,提出一种基于关联规则算法的改进算法——双数组FP树挖掘算法,本文主要分为以下几个部分:论文第一章讲述了研究背景,基于“大数据”以及“互联网+”的背景中,日志挖掘的应用越来越广泛,因此日志挖掘具有很高的研究价值。第二章着重关注了日志挖掘的相关理论以及基于关联规则的日志挖掘算法研究现状,通过将国内外的研究进行整理,了解目前日志挖掘的研究现状,从中找出具有创新性的优化方法。第三章是算法描述,对改进算法进行详细描述,并结合实际示例进行进一步阐述。第四章是算法性能比较分析,利用用户访问日志,通过单组对比实验,将优化算法同原始算法的时间效率进行比较,来进一步验证算法的优势。最后一章是总结与展望,总结目前优化算法的不足以及未来进一步改进的展望。本研究在原有的算法上实现部分改进,减少FP算法的时间复杂度与空间复杂度,提高算法效率,提升算法性能。
其他文献
全球金融危机的蔓延严重影响了中国-东盟双边贸易,双边进出口贸易总额出现大幅的下滑,中国对东盟机电产品出口也遭受重创。据相关数据显示:一方面,2009年全年中国-东盟双边贸
目前,能源问题已成为世界上最引人关注的问题之一,开源节流成为各国共同关注的研究课题。能源紧张已成为制约我国国民经济快速、稳定发展的瓶颈。节约能源已被誉为继煤炭、石
<正>一、引言 今年是美国著名数学家,“控制论之父”N&#183;维纳(Norbert Wiener,1894~1964)出版他的著作《控制论——关于在动物和机器中控制和通讯的科学》一书(1948年,巴黎
<正>随着课程改革的推进,一线教师的困惑在于如何落实立德树人的根本任务,如何在历史课堂教学中培养学生的学科核心素养。我们从接触"核心素养"这一概念至今,仍处于初步理解
目前,随着我国资本市场的日益发展,资产价值评估作为金融领域的重要研究和应用内容,已经越来越受到投资、财务以及银行等行业的关注。每一种金融资产都具有价值,而价值评估是
中国作为造纸术和印刷术的发源地,有大量的历代纸质书籍流传至今,这些在辛亥革命以前采用中国传统排版、装帧方式的书籍被称之为“古籍”。流传至今的古籍图书经历了各种天灾
目的评估社区管理-自我管理相结合的疾病管理模式对出院老年2型糖尿病患者服药依从性及生活质量的干预效果。方法顺序入选2015年8月—2016年7月于秦皇岛市第一医院全科医疗科
农户施肥调查和土壤检测结果表明,目前龙川县农户施肥主要存在有机肥施用意识淡薄,养分投入不均衡,土壤中有机质、速效磷含量属中上,全氮、碱解氮属中下,速效钾缺乏。根据龙川县耕
随着时代和科学的发展及进步,人才作为企业最重要的战略性资源,日渐彰显人力资源管理工作的重要性。而心理学是研究人的心理现象发生发展活动的科学,心理学知识的运用为人力
老舍的最后这部长篇小说,无疑是最有独创性的。作品所蕴藉的历史内涵本身就证明了它的独特性。过去有过许多次,抗战前或抗战中,《骆驼祥子》的作者表达过想写一部自传体 Lao