【摘 要】
:
经典的推荐系统着重于推荐的准确性,随着用户多样化需求的增加,推荐结果的多样性受到越来越多的关注。推荐的精度与多样性存在冲突,传统的推荐算法往往也忽略系统中的用户活跃度差异。因此,本文从数据分布的特点着手,提出面向不同用户的层次化推荐模型,该模型以快速非支配排序遗传算法NSGA-II(Fast Non-dominated Sorting Genetic Algorithm)为多目标进化算法载体,以推
论文部分内容阅读
经典的推荐系统着重于推荐的准确性,随着用户多样化需求的增加,推荐结果的多样性受到越来越多的关注。推荐的精度与多样性存在冲突,传统的推荐算法往往也忽略系统中的用户活跃度差异。因此,本文从数据分布的特点着手,提出面向不同用户的层次化推荐模型,该模型以快速非支配排序遗传算法NSGA-II(Fast Non-dominated Sorting Genetic Algorithm)为多目标进化算法载体,以推荐列表中物品的预测评分平均值衡量推荐精度和以覆盖率衡量推荐多样性这个两个优化目标,从算法的初始化方法,到交叉操作和变异率这三个方面对现有的多目标推荐算法进行了改进,具体内容如下:(1)对基于概率的多目标进化算法的改进传统推荐算法在推荐精度上表现较优,但目前在推荐多样性方面已经难以满足用户的需求。为了使推荐结果更符合个性化推荐,通过翻阅大量近年关于多目标推荐算法的相关文献,本文将对已有基于概率的多目标进化算法在初始化和参数上进行改进,获得更优的算法交叉和变异方式。分别在三种传统推荐算法上进行实验测试,实验结果验证了改进后的基于概率的多目标进化算法在推荐精度和多样性方面都能找到更优的结果。(2)本文提出的三种初始化方案在对传统推荐算法进行充分了解的基础上,以及在基于概率的多目标进化算法实验测试探索下,发现在多目标推荐算法的完整结构中,在初始化阶段加入本文提出的三种不同初始化方案可以获得注重不同优化目标的推荐结果。其中IT100初始化方案更注重推荐结果的推荐精度,IT50-IC50初始化方案能使多目标推荐算法找到兼顾推荐精度和多样性折中的推荐结果,IC100初始化方案则更注重推荐结果的多样性。最后,通过从不同维度以及不同场景下的三个真实数据集,以及在基于三个传统推荐算法上,多目标推荐算法得到的帕累托前沿图具有明显的分布特征,其分布特征可以证实本文提出的三种初始方案会得到注重不同优化目标的推荐结果的有效性。(3)基于用户分层的推荐方案根据本文提出的三种初始化方案在帕累托前沿图分布的特征,以及用户评价数据的分布特点,本文按照用户对物品的评价次数将用户分为高、中、低三种用户集。然后在三个不同维度以及不同场景下的真实数据进行实验,将三种用户集对应的两个优化目标和两个评价指标整理列出结果,总结出基于用户分层的推荐方案。其中IT100初始化方案更适用于评价次数高的用户集,IT50-IC50初始化方案更适用于评价次数适中的用户集,而IC100初始化方案更适用于评价次数较少的用户集。
其他文献
滚动轴承是旋转机械设备中应用最为广泛的重要零部件之一,它的健康状态对于设备系统能否安全可靠地运行起着决定性作用,深入研究滚动轴承的故障诊断与剩余使用寿命预测技术,可以在有效保障人员和机械设备安全的同时降低经营成本,具有重大的学术意义和工程应用价值。因此,本文基于数据驱动的方法,对轴承的故障诊断和寿命预测进行了研究。(1)选取西储大学轴承故障数据集作为研究对象,针对轴承振动信号存在不同故障种类的特点
表情识别技术可以分析人的情感,提供用户的情感反馈,检测疲劳驾驶和疲劳作业等,在很多领域有着广阔应用前景。目前,针对正脸无遮挡的人脸图像表情识别研究,深度学习方法已经取得非常好的效果。然而,在自然场景下,头发、手、胳膊、食物等都可能引起遮挡,这些物体可能遮挡脸部的任何部分,表情识别的准确性和鲁棒性也会因此急剧下降。由于被遮挡区域的位置、大小和形状各不相同,所以遮挡下的表情识别仍然是一个巨大的挑战。因
随着社会的发展和时代的进步,互联网技术给人们的生活提供了极大的便利。尤其是近些年来,大量的社交媒体平台兴起。不仅为人们的交流提供了便利,也改变了人类获取信息和传播信息的方式。在社交媒体平台上,人们可以自由的创造、发布和提取热点信息。许多人也利用它的时效性散布和传播谣言,博取网民们的眼球,吸引人们的关注,从而谋取利益。谣言被定义为没有事实根据的消息,它往往会误导读者。它不仅会伤害到个人、社会甚至整个
在现代电力系统向高比例电力电子化发展过程中,宽频带下的谐波谐振问题日益引起关注。这些谐波谐振问题会带来严重危害,轻则影响供电系统的电能质量,重则引发谐波谐振事故,损毁供电系统设备,严重威胁供电系统的安全稳定运行。无论是单相供电系统还是三相供电系统,系统固有的阻抗频率特性既是刻画谐波谐振问题的关键指标之一,也是制定谐波谐振抑制方法的重要依据,但是阻抗频率特性仅仅依靠建模和仿真计算的方法难以准确获得。
伴随全球化产业深层次变化的发生,机械臂技术为多领域多产业提供了有力支撑。当前,机械臂在实际作业场景下仍面临环境复杂多变、目标模型未知,自主感知交互能力不足带来的严峻挑战。因此,本文以七自由度机械臂作为研究对象,围绕未知多变的机械臂应用场景,以机械臂抓取问题作为研究主线,融合机器视觉与深度学习方法深入探索机械臂抓取位姿检测问题,同时针对机械臂路径规划问题展开分析研究,旨在为复杂未知环境中的机械臂自主
现在市场中的企业都不是孤立运营的,而是处于整个供应链上,所以对于核心企业来说,供应链上的供应商的配合程度在日常业务运营方面很重要。在供应商管理整个流程中,供应商的选择是很重要的一环,直接决定了合作供应商的质量以及后续的合作关系,也是现在市场竞争中的重点,但是,现在公司在供应商选择的过程中还存在很多的问题。基于此,本文以A公司为研究对象,对供应商的选择进行优化研究,主要的研究内容如下:(1)现状分析
针对阿尔兹海默症的计算机辅助诊断近年来得到了极大的发展,但是已有的大多数该类研究都是使用监督学习的方法来展开的。但医学图像的标注需要标注者具有对应的医学知识,从而导致带标签的医学图像数据比较稀缺,进而影响了该领域研究的进展。虽然该方面的带标签数据较少,但是在实际中有大量的无标签数据由于没有标签而没有被有效利用。因此,如何使用这些无标签数据去提高阿尔兹海默症病灶分割和分类的性能是本文拟解决的问题。同
电子医疗数据是患者生理/心理的病情记录,亦或是人体日常健康监测数据,在疾病治疗与病理研究中充当着相当重要的角色;同时,作为隐私数据,如何实现其安全共享成为研究的热点。目前,医疗数据主要以中心化存储的形式,通过公有云或私有云集中存储在医疗机构服务器中。在此主流方式下,医疗数据共享系统一旦遭受攻击可能导致单点故障,患者无法对自身医疗隐私数据进行访问控制,更无法对分散的医疗数据进行安全共享。因此,本文立
随着医学信息化程度不断增加,产生了大量的医学文本数据,通过信息挖掘与分析,从非结构化的数据中抽取三元组成为重要的研究方向。传统的中文医学文本的实体关系抽取方法存在词组分割歧义、信息缺失和关系重叠等问题,本文通过词组信息嵌入和指针标注框架,融合自注意力机制,提出一个融合词汇增强的基于注意力机制的指针标注模型,以此来解决中文医学文本关系抽取中存在的问题,提升关系抽取的性能。本文的主要研究内容如下:在嵌
随着全球贸易化的不断深入,汽贸企业面临着诸多新局面和新问题,一方面,是愈演愈烈的中美贸易战以及欧洲多国的“双反”政策,导致汽贸企业面临的市场环境愈加严峻。另一方面,“构建国内大循环为主体、国内外双循环、国内外双循环相互促进的发展新格局”的重大战略部署,也为汽车贸易企业的发展带来了良好机遇。作为国内汽车贸易行业的领头羊,庞大汽车贸易集团如何在诸多机遇和风险面前突破自身局限,有效实现企业发展的战略目标