基于用户点击流数据挖掘的推荐系统研究

来源 :电子科技大学 | 被引量 : 5次 | 上传用户:yun_breakcode
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息时代的到来,互联网上的信息呈现爆炸式增长,人们开始面临信息过载问题,找到自己需要的信息开始变得具有挑战性。信息过滤技术应运而生,信息过滤技术旨在为用户过滤掉无用信息,帮助用户精准快速的获取信息。推荐系统是信息过滤技术的一种具体应用,旨在帮助用户从海量信息内容中找到用户感兴趣的信息,并发掘用户可能感兴趣的物品。推荐系统将这些物品形成一个短小的推荐列表呈现给用户,从而提高信息提供商对客户的吸引力以及用户的使用体验。推荐系统已经成为现代互联网内容提供商的不可或缺的模块,比如电商网站包括京东,亚马逊等都在网站首页展示给用户个性化的物品推荐。这些推荐的物品常常是因人而异的,商家会根据用户的浏览记录分析和挖掘用户的兴趣,推荐与用户兴趣相匹配的物品。而用户也会有更大的概率发现自己喜欢的物品,免去了从海量商品中去随机搜寻的过程。本文研究的出发点就是通过分析用户在浏览网站时的点击记录数据,建立用户的兴趣分布,并分析用户兴趣变化过程,进而将该过程融合到推荐算法来,设法提高推荐系统的实时性与准确性。本文基于传统的LDA算法提出了改进的Session-based LDA算法,该算法利用了用户兴趣的间断性,即用户在某一个连续的浏览记录段内会表现比较一致的兴趣,而在不同的时间段内兴趣分布又比较分散。本文在真实数据集上验证了这个假设的合理性,并且基于这个假设,将兴趣的间断性原则融合到LDA算法中,形成了一个带有两个参数的Session-based LDA算法。其中第一个参数0可以用来控制用户在一个时间段内的兴趣是否与用户总体的兴趣分布一致,另一个参数1用来控制用户兴趣随时间发生跳转的概率大小。通过这两个参数的调节,可以更好的对用户的行为进行建模,从而提出更合理的用户兴趣分布函数,实现更加精准的推荐效果。本文在三个真实的数据上验证的改进算法的有效性,相比传统的LDA算法,准确性都得到提高。并认为该算法应该有较好普适性,因为通过调节参数0与1的值,可以使得Session-based LDA可以拟合不同的数据集,即使在最坏的情况下也可调节到接近原始LDA算法的准确性。
其他文献
近年来随着互联网技术的发展,Web信息量飞速增长,如何从大量信息中迅速有效地检索出所需的信息成为了人们关注的问题,搜索引擎也因此走入了人们的生活。如今,搜索引擎的功能
随着Internet的快速发展,互联网已经发展成为一个巨大的分布式信息空间,为用户提供了一个极具价值的信息源。然而,在利用搜索引擎进行信息检索时,返回的搜索结果数目非常庞大
在数据仓库中,概念模型对系统的成功起着关键的作用,可在实践中,由于时间和成本的限制,人们却没有把它很充分的做好,这可能会导致系统在开发过程中出现一系列的问题。参考模
安全协议是网络安全的保障,网络中实体间通信的实现都是经过安全协议来协助完成的,然而由于网络处在复杂的环境之中以及安全协议本身所具有的缺陷,使得攻击者能够借助这些缺
随着地面自主机器人的发展,地面自主机器人的测试评估系统得到了愈来愈广泛的研究。测试评估系统研究如何通过定性和定量的方法对地面自主机器人进行客观准确的性能测试和科
随着传感器技术、计算机技术和信息技术的飞速发展,图像融合技术已经成为图像理解、计算机视觉等领域的一个研究热点,在军事、遥感、自动目标识别、计算机视觉和医学图像处理等领域取得了广泛的应用。本文以高分辨率全色图像(PAN)和低分辨率多光谱图像(MS)的融合为研究对象,并以小波变换、Contourlet变换和非下采样Contourlet变换(NSCT)等多分辨率分析理论为基础,围绕遥感图像融合中存在的突
随着城市建设的不断发展,城市道路状况作为城市文明和现代化程度的重要标志,受到越来越多的关注,道路状况的好坏关系到每一位市民出行的便利和交通的安全。因此,研发一套稳定
学位
随着互联网技术的不断发展和应用范围的不断扩大,信息安全越来越成为政府,企业和个人所关注的焦点。近年来,以病毒、蠕虫、木马、后门和rootkit等为主要形式的恶意程序正成为
本文针对传统的高校教务管理系统普遍存在柔性不足,无法及时应对需求变化和业务流程变更等问题,寻找对策与解决方案,主要研究内容如下:   ⑴针对当前高校教务管理业务涉及部门
随着当今社会的快速发展,语音合成技术已经渗透到了社会生活中的各个方面。为了使合成语音的自然度能够进一步提高,本文研究了在语音合成技术中占据重要地位的韵律结构预测问
学位