【摘 要】
:
为了解决数据过载的问题,个性化推荐服务应运而生。其中协同过滤算法为应用最为广泛的推荐算法,利用用户-物品观测数据(评分、点击)以及额外的辅助信息(用户社交关系、上下文
论文部分内容阅读
为了解决数据过载的问题,个性化推荐服务应运而生。其中协同过滤算法为应用最为广泛的推荐算法,利用用户-物品观测数据(评分、点击)以及额外的辅助信息(用户社交关系、上下文信息、物品文本信息等),将用户-物品矩阵分解成低秩的用户潜在偏好因子矩阵和物品潜在特征因子矩阵,通过建立模型对未知的用户-物品评分(点击)进行预测。在隐式反馈数据的推荐中,由于未观测到的用户-物品对具有二义性:一是用户确实没有见过物品,该部分数据一般含有大量噪音;二是用户见过了物品但是不感兴趣,该部分数据真实反映了用户潜在偏好。为了更好地利用已有社交信息来改进隐式反馈推荐性能,本文提出了基于用户社交网络和物品曝光度的概率矩阵分解推荐算法,一方面通过对用户-用户社交矩阵进行矩阵分解来约束用户偏好潜在因子,一定程度缓解数据稀疏性;另一方面将物品曝光度作为观测值的条件,并结合物品本身的流行度和用户的社交信息对物品曝光度进行建模,更好地解决未观测数据的二义性,从而提升推荐性能。最后,通过期望最大化算法学习到用户的潜在偏好矩阵和物品的潜在特征矩阵,对模型进行预测。本文在Lastfm公开数据集上进行多个层次的实验和分析。结果表明,将用户影响力和用户社交关系引入物品曝光度和概率矩阵分解模型中能够在数据稀疏的情况下避免过拟合,提升系统的推荐性能,相比已有的推荐算法在召回率、平均准确率和归一化折损累计增益三个评价指标上均有一定的提高。
其他文献
蜜蜂授粉的增产机理主要足蜜蜂采集花粉后将异花的花粉带到花器官上,实现受精,受精后产生一系列的生理反应。蜜蜂使植物及时和较好地实现异花授粉,对于丰富其遗传物质基础,提高其
轴的抗弯刚度是影响转子动力学特性的重要因素,转子圆盘厚度对抗弯刚度影响较大。应用有限元软件Ansys建立某铁路机车牵引电机转子系统的一维和三维模型。分析圆盘厚度对临界
保持架为球笼式等速万向节的重要部件,当球笼式等速万向节处于极限角度时保持架为危险部件,因此极限角度下保持架的强度是否满足需求对其设计制造非常重要。通过试验以及仿真
高速冷打成形是一个多因素耦合作用下的复杂成形过程,其中由于滚滑摩擦产生的热效应将影响工件金属的流动性,进而对成形零件质量和性能产生影响。为了深入了解热效应引起的工
人力资源的管理和培训是所有企业都必须关注的重点,它是促进企业发展的巨大推动力,国有企业也不例外。然而现在我国国有企业人力资源管理培训中存在着一些问题,文章简要分析
针对船式拖拉机样机在试验过程中出现中间轴已疲劳破坏和轴承损坏的现象,拟采用多点激励模态分析方法对其船壳动力学特征参数进行测试。试验研究中采用输出噪声估计模型获得
当今的时代是网络化、信息化的时代,在新时代背景下,人们的思维意识得到了很大的提升,而蒙古族作为我国少数民族之一,有着非常悠久的历史文化,在新媒体发展的朝代里,蒙古族文
法学方法论之于法律解释方法位阶问题的主流观点内隐着矛盾性,即一方面认为各类法律解释方法之间不存在典型的并列关系,另一方面又否认他们之间可以被固定的位阶谱系所表述。
通过HHT边际谱提取铁路轨道不平顺频率结构信息,对具有相同运营条件的铁路轨道不平顺HHT边际谱进行聚类分析,形成适合描述不同运营速度及影响铁路安全、舒适运行动力学指标的
近年来随着乳腺癌筛查工作的广泛开展,乳腺癌的发病率逐渐升高,并有年轻化的趋势,已成为妇女常见恶性肿瘤之一,严重威胁着妇女的身心健康。钼靶摄影计算机成像已成为目前检查乳腺