基于信息熵与Mahout的推荐算法的研究

来源 :计算机与数字工程 | 被引量 : 1次 | 上传用户:skyliou
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对传统Mahout提供的推荐算法中的噪音数据问题,提出了用户信息熵模型。用户信息熵模型采用了信息论中信息熵的概念,利用信息熵的大小衡量用户信息的含量,利用用户评分数据得到用户的信息熵,过滤信息熵低的用户以及它们的相关数据,从而达到过滤噪音数据的目的。利用Mahout提供的推荐算法,即基于用户的协同过滤,基于物品的协同过滤以及Slope-One推荐算法对该模型进行验证。实验结果表明,该模型可有效过滤噪音数据,并在平均绝对误差上有了一定的降低。
其他文献
保险业的改革和发展取得的成绩和重视加强党的工作是密不可分的。近年来,保监会党委始终坚持以邓小平理论、“三个代表”重要思想为指导,深入贯彻落实科学发展观,始终坚持和加强
运用物理方法就弱激光对血液中蛋白质活性的调节,主要是对酶活性的激发与抑制进行了分析.认为在激光照射下,血液中蛋白质分子发生了喇曼散射吸收,分子的振动和转动能级发生了
对束宽的不同定义作了比较研究.结果表明,不同定义束宽的数值是不同的.在自由空间中传输时,二阶矩束宽遵守ABCD定律,熵束宽的传输曲线近似于双曲线,但环围功率束宽一般不满足
论文针对测量参数未知的随机系统提出一种对偶控制算法。利用多个子模型代替参数未知的系统模型,把大系统的分解-协调思想引入到多模型控制中,以各子模型的后验概率作为协调变量,将多个子模型的控制律进行融合归一,利用归一后的模型对系统进行控制,获得一种新的对偶控制策略。仿真结果表明了论文算法的有效性。
本文采用差异吸收光谱法对化学增强型细菌视紫红质的状态变化进行了实验研究.发现在585 nm处明显存在一个稳定的中间过程.从分子动力学和实验出发,提出了一个适用于差异吸收
对于高校学生思想政治工作如何抓落实,在实践中我体会到,关键要在做实上下功夫,重点要把握好如下几方面。
思想解放是建设中国特色社会主义的法宝,贯穿于改革开放的全过程。在新的历史起点上推进改革开放,需要新的思想解放。本文从主题、要务、关键、目标等几个方面,阐述了新的思想解
为了深化对中国特色社会主义理论体系的认识和研究,本刊记者采访了武汉大学原党委书记、新任校长顾海良教授。
ARPU值即月均用户账单额,它代表着每个电信用户的利润贡献率,也反映着电信企业经营效益成果的动态.造成电信ARPU值下滑的主要原因是:①由于电信资费调整,使得一些电信业务的
针对受随机故障等随机事件影响的直线型生产线系统,提出一种多种群粒子群分析技术,解决生产线在缓冲区总量固定、生产率最大的目标条件下的缓冲区容量优化分配技术问题。该技