论文部分内容阅读
针对传统Mahout提供的推荐算法中的噪音数据问题,提出了用户信息熵模型。用户信息熵模型采用了信息论中信息熵的概念,利用信息熵的大小衡量用户信息的含量,利用用户评分数据得到用户的信息熵,过滤信息熵低的用户以及它们的相关数据,从而达到过滤噪音数据的目的。利用Mahout提供的推荐算法,即基于用户的协同过滤,基于物品的协同过滤以及Slope-One推荐算法对该模型进行验证。实验结果表明,该模型可有效过滤噪音数据,并在平均绝对误差上有了一定的降低。