基于社会化标签和概率化矩阵分解推荐算法的研究

来源 :浙江大学 | 被引量 : 0次 | 上传用户:yuantao22222
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网和Web2.0技术的迅猛发展,社会化标签被越来越广泛地应用于个性化的信息服务系统中。标签体现了群体智慧,它有效地联系了用户与资源,同时描述了用户的兴趣爱好和资源的特征,具有较高的挖掘价值。现存的个性化推荐技术还存在着一定的问题,在带有标签的推荐系统中,有效地利用标签信息势必会给推荐系统领域带来新的机遇。论文结合国家科技支撑项目——老年人健康服务平台,面向基于标签的推荐算法技术展开了相应的研究。  论文首先对当前推荐系统技术做了一个简要的综述,介绍了主流的协同过滤、基于内容、矩阵分解和混合推荐算法的工作原理、实现步骤和优缺点,并对未来推荐系统的研究提出了一些问题和展望。  论文通过分析社会化标签的结构和特点,结合文本语义挖掘技术,提出了包括基于Jaccard、TF-IDF、LDA主题模型三种物品标签相似度的计算方法,它们具有不同的聚类特点和应用。概率化矩阵分解模型(PMF)在推荐系统中有着广泛的应用,论文提出了一种基于社会化标签的改进PMF算法Tag-PMF。该算法将用户对物品的评分分解为两部分,即物品自身隐含因子对用户的吸引评分和与之标签相似的邻居物品的参考评分,通过对两者的线性拟合得到了一个新的矩阵分解算法。  接下来,论文对Tag-PMF算法进行了验证,相关的实验证明了与传统主流推荐算法相比,该算法在推荐准确度上平均可提升4.6%。另外,论文还对Tag-PMF算法的α、Top-K、D等几个主要因子进行了独立的实验,分析它们对算法推荐准确度的影响。  最后,论文简要介绍了老年人健康服务平台,并将Tag-PMF算法融入到平台的个性化服务推荐模块中,提出了一个基于Tag-PMF算法的推荐系统架构,详细介绍了系统各主要模块的设计和实现。
其他文献
自然景观模拟是虚拟仿真研究领域中一个重要的研究内容。众多自然景观中,喷泉、火焰、烟雾、降雨、河流、瀑布等都具有不规则几何状态、动态性和随机性,这些特殊自然景观的模型
随着汽车工业的发展和人们生活水平的提高,人均汽车拥有率逐渐提高,车流量不断增大,导致交通事故频发。如果能在驾驶过程中及时检测交通标志并将标志上的信息反馈给驾驶员,则可以
医学图像配准是针对两个图像或体数据,找到一个几何变换让一个图像上的点映射到另一个图像上,使两图像达到空间位置上的对齐。随着医学研究的深入,单一模态下的图像信息已经
肝脏解剖结构复杂,且存在门静脉、肝静脉、肝动脉、胆管等四套管道系统,变异较为常见,因此对肝脏肿瘤的手术治疗难度大,风险高。  随着CT、MRI等造影技术的完善,及三维技术
随着智能电网的快速发展,电力行业已经进入了“大数据时代”。变压器是电网平稳运行的关键设备,变压器故障诊断方法能够保证电力系统平稳运行。在电力系统中,利用变压器在线监测技术可以及时发现其故障类型。但是由于监测的数量点多,且在一段时间内会多次获取监测数据,因此,其数据量规模急剧增长。通过对数据挖掘算法并行化,实现对海量的电力变压器监测数据快速分析。Spark是分布式内存计算框架,具有轻量级快速处理、兼
基于脑机接口技术的动物机器人,是以活体动物作为运动载体,将外部的控制指令直接施加于动物大脑,实现对动物感受和行为的干预控制,从而构建的新型动物-机器混合系统。受限于动物
当前,个人和组织的信息呈现急剧增长趋势且非结构化数据所占比重在不断的增加,这些属于某个主体的海量、分布、异构和共存的数据构成了一个数据空间,如何为用户提供高效、便捷和
随着物联网中的智能化物体数量急剧增长,如何对物联网进行高效的查询成为一个研究热点。目前,物联网中采用的查询系统为ONS(对象名称服务)系统,但随着互联网地址空间爆炸性的增长,O
跨文档共指消解(CrossDocumentCoreference,CDC)是以分散在不同文本来源中的相同名词实体为对象,通过信息抽取、信息表示和聚类等技术最终判定这些名词实体与客观概念之间的
web服务是从传统中间件技术演变而来的,是能通过网络使用的自描述、自包含、开放的软件模块,能够很好的支持基于web的企业级集成。web服务的目标是构建分布式应用,能够按照不同