基于约束分区多目标优化的推荐算法

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:mengshenabc
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
推荐系统在诸如电子商务,社交媒体渠道和内容提供商等应用程序中迅速普及,发展迅猛。尽管当前推荐系统中的推荐技术主要侧重于提高推荐准确率,然而考虑到用户的多种需求,满足多种评估准则的推荐算法更适合于现代推荐系统。当前已经有个性化推荐的任务被建模为多目标优化问题,将一些评估指标作为冲突的目标进行优化。考虑到应用场景中不同评估指标的重要程度不同,本文将个性化推荐的任务建模为约束多目标优化问题,提出了一个满足更多应用场景需求的约束多目标推荐框架,并研究了一种新的约束多目标优化算法,对推荐项目列表进行优化。本文中的主要研究工作和创新点有以下几点:首先,在第三章中,本文针对约束多目标优化算法进行了研究,提出了一种基于极小极大策略(CPM/MS)的约束分区方法来解决CMOP问题。这项研究工作的创新点有:(1)分析了不可行解的分布对于解选择的影响,并给出了不可行解的预处理方法;(2)设计了一种基于极小极大策略的约束预处理方法;(3)针对种群中的个体提出基于分区的约束处理。实验部分采用了CEC2009问题集,将CPM/MS算法的有效性在一组10个约束的数值优化问题上进行了广泛的评估。其结果表明,与一些最先进的多目标进化算法相比,CPM/MS算法能够在一些问题上获得更好的前沿。在第四章中,本文研究了推荐系统中存在的多种需要考虑的评估指标,这项研究工作的创新点有:(1)考虑到这些评估指标并不都是同等重要的,本文提出了基于约束多目标优化的推荐框架,将有要求但不需要最大化的指标作为约束来处理,从而使算法能够生成满足更多应用场景的推荐项目列表;(2)在生成候选项目集的过程中,传统取并集的方式会导致一些极端解在混合过程中产生较大影响。因此,本节我们引入了项目评分空间中支配解的概念,提出了最多支配项优先的候选项目集生成方法。实验部分采用了Movie Lens离线电影数据集,按照25%的比例划分测试数据集,从10个测试用户的评估结果可以看出,本章提出的算法能够为用户生成准确率、多样性、新颖度三种指标更优化的推荐项目列表,同时满足系统在覆盖率上的约束条件,使得推荐系统可以根据不同应用场景平衡多种评估指标。
其他文献
双聚类技术作为一种局部关联分析方法,被提出用于从数据矩阵中挖掘符合子矩阵模型条件的子矩阵模式,进而发现数据中有趣的局部相关性。然而,在双聚类技术研究过程中,如果只关
目的构建野生型和突变型SMARCAL1慢病毒载体,初步研究Schimke免疫-骨发育不良(SIOD)新发致病突变对SMARCAL1蛋白表达的影响。方法采集一例新确诊SIOD患儿外周血样本进行基因测序,通过检测发现新发突变位点,利用蛋白质分析软件初步预测新发突变蛋白功能。利用PCR技术合成野生型和突变型SMARCAL1基因序列,突变型SMARCAL1基因序列包含新发突变位点。准备载体pHBLV-CM
强子间的相互作用、强子的内部结构以及强子态是粒子物理研究的前沿课题。目前实验上关于h1(1380)的实验数据很少,PDG上只有三个实验组的数据,h1(1380)态的内部结构特性一直
数据分析已成为当今时代讨论和研究的核心内容,大数据时代下对具备数据分析素养人才的培养有很大需求。现代数学教学更加注重学生的数学基本活动经验的积累,但是目前有关将数学基本活动经验运用在教学设计与实践操作中的研究还很匮乏。概率与统计教学中蕴含着大量的数学活动,非常适合开展相关活动课程来提升中学生的数据分析素养。为了提升初中生的数据分析素养,本论文以明确数据分析素养的培养策略为主要任务。根据对现有文献的
我国是青椒产量最高的国家,拥有着广阔的种植面积。青椒生产采摘属于劳动密集型产业,随着劳动成本的升高,需要通过对农业自动化机械装备的研发,以推动青椒产业的健康持续发展
监督学习中,训练数据标签的质量对学习的效果至关重要,然而现实数据常常存在着标签被错误标记的情况,这些标签错误的样本被称为标签噪声。标签噪声通常会对分类模型的训练产
人工免疫系统对外部入侵的精确识别是通过模拟生物的免疫机制来完成的,在网络入侵检测上的应用非常的普遍。但是因为网络数据的流量越来越多,一般应用的基于否定选择算法检测
当前生活中,交通拥堵日益严重。智能交通系统的目标是尽可能缓解交通拥堵问题,改善交通痛点,交通状态预测是智能交通系统对交通实行控制优化的依据,占有非常重要的地位。由于
随着信息化技术在工业上的应用和发展,工业物联网应运而生,它对传统工业的产业链进行升级,全面完善产品从生产、库存、运输和销售等过程的自动化和智能化。工业无线网络由于
随着通信技术的快速发展,无线网络设备接入和流媒体服务需求爆发式增长,使得高数据速率通信的需求与日俱增,导致现有频谱可用资源相对不足。因此,能够更高效的利用频谱资源、