基于半监督学习的个性化推荐研究

被引量 : 0次 | 上传用户:pz421769788
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着社交网络和电子商务等互联网技术的发展,人们逐渐从信息匮乏的时代步入“信息超载”的时代。海量信息在给用户带来极大便利的同时,也使用户迷失在信息的海洋中,很难找到自己感兴趣的信息。个性化推荐是解决该问题最有效的工具,它通过主动挖掘用户的兴趣偏好,为用户推送个性化的信息。当前,主流的个性化推荐方法包括:基于协同过滤的方法和基于内容的方法。协同过滤的方法通过计算用户兴趣偏好的相似性,从而为目标用户过滤和筛选感兴趣的物品,它主要是基于用户的行为信息进行推荐,而没有真正利用物品的内容信息和用户的标签信息,同时也存在着数据稀疏和冷启动等问题;基于内容的推荐本质上则是一种信息过滤技术,仅仅通过学习用户历史选择的物品信息,缺乏对用户反馈信息的挖掘,这也往往会造成推荐结果过度特殊化。针对上述推荐方法存在的问题,本文提出了利用半监督学习的方法实现基于用户行为信息与物品内容信息的个性化推荐。其主要工作如下:①针对协同过滤推荐方法存在计算相似度方式单一等问题,提出了基于距离度量与高斯混合模型的半监督聚类的推荐方法。传统的协同过滤方法时间复杂度和用户数的增长近似于平方关系,当用户数很大时,计算非常耗时。本文提出利用聚类分析的方法替代用户兴趣的相似度计算,且综合考虑了用户行为偏好和物品内容信息。具体在聚类分析中,算法不仅考虑了数据的几何特征,也兼顾了数据的正态分布信息。②针对个性化推荐中用户兴趣标签偏少的问题,提出了基于主动学习和协同训练的半监督推荐方法。传统的基于分类模型的推荐方法,当有标签数据偏少时,对挖掘用户潜在兴趣偏好非常不利,本文利用主动学习的策略抽取数据集中具有最大信息量的样本,通过咨询(Query)方式或领域专家标注的方式获得相应的标签,增加了训练模型的样本空间,以改进个性化推荐的质量。③针对主动学习的方法加重了用户的负担或增加了人力成本的问题,提出了基于高斯对称分布的自增量学习的半监督推荐方法。该方法充分利用了大量的无标签的数据,并结合一定的有标签数据进行建模。具体在算法中,通过挑选具有高置信度且高斯对称分布的数据进行自增量学习,以改进个性化推荐的质量。④针对在构建特征向量过程中,用户行为特征与物品内容特征的权重不易权衡的问题,提出了基于图模型的半监督推荐方法。算法通过SELF等方法计算权衡因子,且根据用户的行为信息构造基于最近邻图的权重矩阵。算法利用Sigmoid映射函数来度量两个用户的兴趣相似度,并在算法的损失函数中包括用户行为相似性约束和物品内容相似性约束,且两部分约束的权重由一个平衡因子权衡。
其他文献
目前我国饮用水源地重大污染事故频繁发生,严重破坏了自然环境及资源,同时对人民群众身体健康与财产安全构成了极大威胁,影响社会稳定发展。本论文以佛山市为研究对象,收集佛山市
随着综合国力的增强和国际地位的提升,中国已经成为国际舞台上不可或缺的重要角色,外界了解中国的愿望也日益强烈。一年一度的《政府工作报告》作为中国政府的代言人,是外界了解
电机车作为一种轨道车辆运输设备在诸多行业中得到了广泛的应用。近年来在采矿业中,由于生产安全的需要,用蓄电池电机车替代架线式电机车成为技术改造的热点,而充电机是蓄电池电
<正>快时尚增长放缓,销售方式正在转型快时尚源自20世纪的欧洲,快速、时尚、平价、款多量少是快时尚的显著特点。但是伴随着互联网和电商的冲击,线下实体商业遇冷,"快、准、
随着信息时代的发展,高校的不断扩展,利用网络和信息化手段实现教务管理的现代化、及时化、规范化显得尤为重要。本文在目前高校教务管理系统的特点和发展现状基础上,提出一
郑和七下西洋,每次都有不同行业的近两万余名人员随行。正是由于他们的贡献,共同成就了郑和航海的壮举。上海是郑和船队经过和停泊的地方,同时也是郑和下西洋重要的人员、物
在微型,超微型以及轻型汽车上,许多需要远距离操纵的部位都采用了软操纵拉索。这种拉索具有结构简单、灵活、轻便、维修调整便利等优点。例如,常见的拉索总成有:换选档拉索,
飞利浦Brilliance 16排螺旋CT在血管造影检查、结肠镜、常规检查中均具有较高的使用价值,一般在0.42 s以内即可完成对受检者360&#176;扫描。目前飞利浦Brilliance 16排螺旋CT
为拓展职校升学渠道,提升从业者层次,同时推进国际化教学改革,培养具有国际视野、符合新时代要求的高素质人才,提出了土木工程应用型人才的标准化、国际化、模块化的培养模式
随着我国国民经济的快速发展,城市立交和高架桥的作用逐渐体现了出来。弯梁桥作为城市立交和高架桥的重要组成部分,其重要意义已经逐渐被桥梁工作者所认可。我国开始修建混凝土