【摘 要】
:
随着互联网信息规模的增长和用户交互模式的转变,推荐系统在现代互联网中的重要性日益增长,对推荐系统的性能要求也与日俱增。随着推荐系统中用户和物品规模的增长,为了更好
论文部分内容阅读
随着互联网信息规模的增长和用户交互模式的转变,推荐系统在现代互联网中的重要性日益增长,对推荐系统的性能要求也与日俱增。随着推荐系统中用户和物品规模的增长,为了更好的提取用户和商品特征,排除噪音干扰,同时降低计算规模,研究人员将聚类技术引入推荐系统。通过聚类划分用户和商品类别,缩小相似用户的范围,提升算法的速度和质量。本文主要研究了基于聚类的矩阵分解推荐技术。主要工作如下:1.分析了用户对不同类别商品的兴趣差异,在商品聚类的基础上提出了用户对于不同商品类别的偏好度模型。并在矩阵分解推荐模型的基础上,分析了其全局偏置参数的优点与局限,提出用户对各个商品类的偏置参数并引入到模型当中。从而使得模型能更好的捕捉用户对不同类别物品的偏好差异。实验结果表明,相比于传统的全局偏置参数,引入用户对商品类别的偏置能有效提升推荐算法的精确度。另外,在实际系统中,新评分数据总是在不断增长。而传统的矩阵分解算法在模型生成后就保持不变。时间一长,模型会逐渐陈旧,引起推荐准确度的下降。为了适应实际推荐系统中新数据不断增长引起的模型数据陈旧,减缓推荐精确度的下降趋势,本文还提出了一种增量更新的模型。该模型通过增量数据动态更新偏置参数,但不改变原始的用户和物品特征矩阵,在较小的计算开销下,保证推荐精确度的稳定。2.提出了基于用户聚类的局部矩阵分解模型,将原始评分矩阵分割成小块矩阵,再分别应用矩阵分解推荐。局部模型有利于捕捉用户的局部特征,降低噪声干扰。试验结果表明,局部模型有利于部分用户推荐效果的提升,但由于缺失了许多评分信息,因此总体效果不及传统矩阵分解。在此基础上,为了降低聚类划分准确性对推荐效果的影响,加入动态类调整模型,在迭代中动态调整每个用户的归属类,从而进一步提升该模型的推荐准确度。最后,基于这一局部矩阵分解模型和传统全局矩阵分解模型,提出了一项融合二者的混合算法。实验结果表明,混合算法能有效融合两种模型的优点,相比原始矩阵分解模型,其推荐精确度有所提升。
其他文献
现实生活的不同领域中存在着形形色色的复杂网络,在复杂网络理论体系中,搜索问题一直是重要的研究课题之一,并且有着大量的实际应用。很多实际网络中的搜索,例如万维网中网页
随着我国医疗与经济水平的进一步提高,我国医疗保险覆盖面已非常广,老百姓享受到了医保政策带来的真切好处。与之相对的,医保基金滥用的情况也有愈演愈烈的趋势,越来越多的基金被套取,打击非法欺诈行为势在必行。目前,医保经办机构主要利用规则系统对结算信息进行审核,规则依赖于少数指标,由于规则的不完善性与更新的滞后性使得相对不变的规则很容易被精心伪造的数据欺骗,利用计算机技术辅助审查迫在眉睫。本文分析医保数据
随着科技的高速发展,智能手机已成为人们必不可少的生活用品。Android系统由于平台的开放性获得了很多开发者和厂商的支持,Android应用的范围不断扩大。随着应用和用户不断增
本文主要研究将top-k查询算法应用于高维海量数据时算法的优化及与之相适应的数据的存储和调度方法。Top-k查询算法根据给定的评分函数对海量数据集中的记录进行计算,返回总
条码技术是在计算机、光电技术和通信技术的基础上发展起来的一项综合性科学技术,是信息数据自动识别、输入的重要方式和手段。由于条码技术具有准确、快速、方便、经济的特点
在应用领域,可将无线通信分为专用无线通信和公众无线通信两类。随着数字技术的飞速发展,数字化的优越性越来越明显,专用无线通信也势必将与公众无线通信一样进入数字化时代
软件可靠性模型是软件可靠性研究的核心与关键。合理的软件可靠性模型,能支撑软件可靠性定量分析技术,指导软件开发过程。目前已有的软件可靠性模型己不下百种,但模型应用一
高压输电线路是电力系统的关键设备,维持它的正常运转是电网稳定运作的重要前提。通过图像处理技术实现高压输电线路危险状态的识别,以便及时察觉高压输电线路潜在的安全隐患,对电力系统的正常运作有着十分重要的意义。针对传统Canny边缘检测算法中漏检弱边缘、需依靠经验设定双阈值的缺陷,本文提出一种自适应的Canny边缘检测算法,利用其完成高压线图像的边缘检测。该算法先通过几何均值滤波器与中值滤波器构成的混合
蛋白质出现在所有生物中,是一类重要的生物大分子,它们在几乎所有生物过程中起了关键的作用。蛋白质由氨基酸构成,氨基酸按序连接形成蛋白质的初始结构。蛋白质二级结构的基本元
保证用户的服务等级协议(SLA)与能源的高效利用是目前云计算极为关注的两大重点问题。虚拟化技术是云计算资源管理中的关键技术,其中,虚拟机迁移技术和策略都是极为引人关注