【摘 要】
:
随着互联网和信息技术的飞速发展,网络上已有的电影,视频等资源仍然以指数的速度增长,人们进入了“信息过载”的时代。在这个时代,如何让用户从海量的资源中找到自己感兴趣的
论文部分内容阅读
随着互联网和信息技术的飞速发展,网络上已有的电影,视频等资源仍然以指数的速度增长,人们进入了“信息过载”的时代。在这个时代,如何让用户从海量的资源中找到自己感兴趣的物品,同时也让生产者生产的物品脱颖而出,受到广大用户的喜爱。为此,推荐算法的研究应运而生。在目前常用的推荐算法中,协同过滤算法作为最经典的个性化推荐算法,一直受到广大研究学者的关注,而深度学习算法作为近几年最热门的研究方向,更被各领域广泛研究。但是这两种算法几乎都没有考虑到时间上下文信息是如何影响推荐的,没有把用户行为发生的时间信息作为推荐的参考因素。然而在实际生活中,用户的喜好很可能会随着时间的推移发生改变,因此研究用户行为发生的时间上下文信息,对提高推荐算法的性能具有重要的影响。本文在经典协同过滤算法的基础上,首先,将数据集中的用户行为时间戳转换成具体的时间信息,将该时间上下文信息作为重要特征纳入推荐考虑中。接着考虑到协同过滤算法存在稀疏性问题,故而采用矩阵分解模型方法来降低矩阵的维度,将离散型的时间参数引入矩阵分解模型中,针对用户所处的时间上下文环境为用户进行推荐,以提高准确率,采用Spark集群实现协同过滤算法的并行计算,缓解数据规模增加带来的可扩展性问题。考虑到目前数据量仍在不断增长,采用传统的协同过滤算法性能会受到限制,而对于卷积神经网络来说,获取的数据越多,训练得到的性能越好,因此在考虑时间上下文信息的情况下,针对更大的数据集,采用Tensorflow框架实现卷积神经网络算法为用户进行推荐,不仅提高了推荐的准确率,还提高了推荐效率。本文主要研究在考虑时间上下文信息的情况下,分别采用基于Spark的矩阵分解的协同过滤算法和基于Tensorflow框架的卷积神经网络算法来为用户进行推荐。将Movie Lens-100k和Movie Lens-1m两个数据集分别作为两种推荐算法的数据来源,并设计实验来实现对用户的电影推荐,通过与其他几种推荐算法的MAE、RMSE和MSE等指标进行比较,来说明本文提出的算法确实有效,对未来的研究有一定的参考价值。
其他文献
随着易于冶炼的黑钨精矿资源不断耗竭,钨提取理论和技术也随之不断完善。然而目前主流工艺如碱热球磨法、氢氧化钠压煮法、磷酸钠分解法以及磷酸钠焙烧法中均存在磷浓度过量
当今世界处于一个科技信息高速发展的新时代,教育也随着时代在进步,大学作为高等教育培养人才的摇篮,承担着十分重要的责任。大学图书馆作为大学的文献信息中心,在大学的教学
农业、农村和农民问题一直是我国农村改革与农业发展中的重大问题。2004年至2020年,中共中央连续17年通过中央一号文件的形式聚焦“三农”问题,由此可见国家对当前社会主义改
随着计算机技术的高速发展,高维度的数据不断积累,这些高维数据中存在着大量的冗余和无关特征,因此需要从大量的数据中提取出需要的信息,降维法是很重要提取数据的一种方法。降维法通过将高维数据减少或映射到低维空间来保存重要信息。降维常用的两种方法是特征选择和特征提取;特征选择是从原始的特征集合中挑选出使特征评价标准函数值最大的特征,并生成最优特征子集,是数据预处理的步骤之一,它可以去除数据中的噪声,节省数
随着社会经济的飞速发展,能源过度消耗与环境污染加剧等现象已不容忽视,而众多应对资源环境问题的措施实质上是实施能源替代的具体体现。本文通过运用超越对数成本函数在似不
随着智能化时代的到来,信息过载问题越来越严重。搜索引擎通过用户输入指定的关键词来筛选出与之相关的信息,在一定程度上缓解了信息过载的问题,但是其它用户可能喜欢但与关键词不相关的信息并未被充分挖掘运用,个性化推荐系统因此诞生,协同过滤则是其中的主流技术之一。协同过滤算法不依赖于某一特定领域的专业知识,主要通过收集和分析大量关于用户以往行为的数据信息来产生推荐,不足之处则为存在冷启动,数据稀疏与扩展性差
我国自20世纪80年代以来,信用卡业务得到了长足的发展。随着互联网信用借贷的兴起,传统信用借贷行业迎来了新一轮的增长,由此引起了对客户信用问题的重视。数据挖掘技术评估
无线传感器网络(Wireless sensor networks,WSNs)由大量传感器节点组成,实现对目标监测区域内数据采集。由于其通常部署在恶劣的环境中,均衡节点能量消耗、延长网络生命周期是网络设计的重要目标,而分簇拓扑控制是节能和延长网络寿命的有效方法之一,目前已成为无线传感器网络领域研究热点。传统分簇拓扑控制算法通常存在最优簇数难确定、分簇不均匀、簇头(Cluster Head,CH)选举
本文主要检验了东日本大地震和海啸对受灾地区的企业经济表现有何短期和中期影响。企业的经济表现由雇佣和资本积累、以及代表产出的销售净利率这三个指标衡量。本文中的短期
超分辨率重建技术可以节约大量的人力物力,在不改变硬件的基础上,使图像的分辨率得到了大幅度的提升。在实际的研究中,根据处理方式的不同,主要把图像重建分为两种,一种是单帧图像的重建,一种是多帧图像的重建。论文从这两类重建出发,分别研究了基于稀疏表示的单帧遥感图像超分辨率重建和基于总变分正则化的多帧遥感图像的超分辨率重建。首先研究了基于稀疏表示的单帧遥感图像超分辨率重建。针对文献[33]中Yang提出的