【摘 要】
:
近些年,由于信息技术的飞速发展,越来越多的信息出现在人们的身边,用户在使用互联网的过程中自身也在不停地生产着数据,信息过载的问题愈发严重。推荐系统作为一个信息筛选的工具,能够实现从海量的数据中找出用户感兴趣的内容,逐渐成为了互联网平台中不可缺少的一部分。由于数据量的不断膨胀,协同过滤这种传统的推荐算法的缺陷不断暴露——无法应对冷启动问题、面对稀疏数据时效果不理想,这些问题的出现意味着对推荐系统的改
论文部分内容阅读
近些年,由于信息技术的飞速发展,越来越多的信息出现在人们的身边,用户在使用互联网的过程中自身也在不停地生产着数据,信息过载的问题愈发严重。推荐系统作为一个信息筛选的工具,能够实现从海量的数据中找出用户感兴趣的内容,逐渐成为了互联网平台中不可缺少的一部分。由于数据量的不断膨胀,协同过滤这种传统的推荐算法的缺陷不断暴露——无法应对冷启动问题、面对稀疏数据时效果不理想,这些问题的出现意味着对推荐系统的改进至关重要。近年来,深度学习在多个领域都展现出了不俗的效果,它在特征选择和特征组合等方面的出色表现为推荐系统的改进方向提供了参考。本文通过结合协同过滤和深度学习的优势,提出了一种基于深度学习的混合模型——DCCFN模型对电影推荐问题进行了研究。具体工作主要是:(1)将协同过滤与深度学习相互融合。为了充分利用用户和项目的辅助信息,解决冷启动问题,本文将深度学习技术引入推荐系统,能够实现特征的自动交叉组合,从而挖掘出高阶数据特征。(2)利用矩阵分解降低数据稀疏性。为了解决数据稀疏的问题,本文利用用户的评分和电影的属性构建了用户和电影属性的关系矩阵,并利用矩阵分解的方式对矩阵进行重构、填充,大幅降低了数据的稀疏程度。(3)引入用户隐特征向量来反映出用户的兴趣特征。由于用户辅助信息对个人兴趣表现不足的问题,本文在模型中引入了矩阵分解中的用户隐特征向量,将用户隐特征作为一个输入特征加入到模型当中,从而使模型能够在一定程度上体现出用户不同的兴趣。(4)通过公开数据集Movie Lens 1M和Movie Lens 100K验证模型性能。实验结果表明,本文提出的DCCFN模型在两个数据集中的表现均优于单一的DCN模型和协同过滤模型。
其他文献
计算机断层扫描成像(Computed tomography,CT)具有成像速度快、清晰度高等优点,被广泛应用于病理诊断中,但成像中的X射线辐射存在危害患者健康的潜在风险,低剂量CT成像应运而生。降低辐射剂量会带来量子噪声与电子噪声,使重建图像质量降低,为临床诊治带来不便。传统的低剂量CT去噪方法基于单图处理能够去除噪音,但得到的去噪图像本质还是低剂量CT图像;深度学习的方法基于数据库和计算机性能的
医药制造业是关系国计民生的重要产业。随着健康中国建设战略的逐渐推进和居民健康消费的不断升级,我国医药市场规模大幅增长。同时,新冠疫情的爆发使得各国愈发重视医药制造业的战略地位。面对这些新形势新任务,我国医药制造行业增长急需培育壮大创新动能。研发活动是医药行业发展的重要驱动因素,中国在医药制造业中的研发投入总体上不断增长。同时,非研发投入作为一种非传统的创新方式逐渐发挥作用,越来越多的企业通过非研发
随着生活水平的不断提高,人们对产品的可靠性要求也越来越高。可靠性指的是部件、产品等在规定的条件下与规定的时间内,完成规定的功能的能力。定量分析可以较为精准的评估和比较产品的可靠性。通过寿命试验,获取并分析产品的失效数据是一种常用的定量分析方法。因此,采用合适的分布拟合产品的寿命十分重要。近年来,广义半正态分布引起了一些学者的注意。与现在常用的分布相比,广义半正态分布具有更厚的弹性左尾。对于不同的参
预测是现代社会预知未来发展的重要手段之一,合理科学的目标评价信息是得到准确预测结果的前提和关键。然而,由于人脑认知的局限性、目标环境的不确定性和事件的经验性,模糊环境下的事件预测问题得到了广泛关注。为此,本文利用案例推理(CBR)模型,对离散和连续情形下的直觉模糊事件预测问题进行研究,并以海洋输油管道泄露为背景进行实证分析,主要内容有:第一,基于直觉模糊集的CBR预测方法及应用。针对事件预测中的模
随着经济全球化的不断推进和科学技术的不断进步,创新驱动已经成为当代社会经济增长的重要动力源。当下我国正处于向高质量发展阶段转型的重要时期,企业作为我国市场经济的重要组成部分也是创新的主要来源之一,研究其创新质量的影响因素就显得十分必要。根据社会网络理论,企业的各类生产经营活动不仅取决于企业本身,同时也受到供应链网络中其他节点的影响,企业在供应链网络中的位置不同所能获取到的资源和信息也不同。因此基于
全球气候变暖已经成为严重危害人类生存的重大问题,世界各国都相继承诺自主减排任务,在此背景下,中国承诺在2030年左右完成碳达峰,并将其写入十四五规划相关文件中,碳减排、碳达峰成为中国必须要面对的急迫问题。目前中国已经成为全球第一大碳排放国,不管是国际责任还是国内的高质量发展转型,碳达峰都势在必行,本文在收集整理国内外文献的基础上,对中国的碳达峰进行了研究,得到以下几点结论:(1)首先运用IPCC(
直觉梯形模糊数具有信息表达的连续性和完整性的优势,在不同量纲上描述评价对象的复杂性、模糊性和不确定性。信息集成算子是集成各种模糊、不确定以及语言信息的一种有效工具。本文从算子角度,结合Choquet积分和前景理论,探讨直觉梯形模糊评价中IT-HAG算子、IT-SCIH算子和前景IT-SCI算子的价值,并以企业数字化改革成效评估为例进行实证分析,主要内容有:第一,在指标间相互独立、互不关联的假设基础
随着时代的进步,互联网越来越深地渗透入人们的生活,在网络上发表言论以及查看他人的言论,几乎是每个网民都会做的事情。而对于企业来说,一旦在线下发生负面事件,当事人很有可能将自身的经历发布到网上,从而引起大量网民的关注,当对企业舆情持负面态度的人达到一定数量时,会形成企业负面舆情。企业负面舆情一旦开始孕育,如果不及时采取干预措施,很有可能会对其形象造成一定的影响,从而阻碍企业的经营发展。因此研究企业负
2019年末的新冠肺炎疫情让全球遭遇了一场前所未有的公共卫生危机,也让世界经济进入衰退期。由于疫情来势汹汹,传播速度快、传染性强,政府不得不采取居家隔离、园区封锁、“封城”等措施,这也使得民众恐慌情绪迅速蔓延,大规模物资抢购事件频发,造成商品供应链断裂,经济发展停滞。为了恢复良好的市场秩序,政府采取了相关干预措施遏制恐慌抢购现象的蔓延,降低其对社会的不利影响。基于此,本文以恐慌抢购现象为研究对象,
命名实体识别是自然语言的基础任务之一,往往被视为序列标注任务来进行处理,能够为自然语言下游任务提供基础支撑。目前,平面实体识别的技术已经相当成熟,然而嵌套命名实体往往被忽略了。在嵌套情形下,普通的序列标注方法变得不再适用。因此有人基于跨度解决嵌套命名实体识别问题,然而这种方法会产生过多的子序列,导致计算量太大,此外,由于边界信息没有得到充分运用,噪声区域与非噪声区域差别过大。所以,为了能利用边界信