基于聚类和Spark框架的加权SlopeOne算法

来源 :计算机应用 | 被引量 : 19次 | 上传用户:enjoy12_east
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对传统Slope One算法在相似性计算时未考虑项目属性信息和时间因素对项目相似性计算的影响,以及推荐在当前大数据背景下面临的计算复杂度高、处理速度慢的问题,提出了一种基于聚类和Spark框架的加权Slope One算法。首先,将时间权重加入到传统的项目评分相似性计算中,并引入项目属性相似性生成项目综合相似度;然后,结合Canopy-K-means聚类算法生成最近邻居集;最后,利用Spark计算框架对数据进行分区迭代计算,实现该算法的并行化。实验结果表明,基于Spark框架的改进算法与传统Slop
其他文献
针对安全两方计算中隐私集合交集计算问题,提出了一种改进的基于Bloom Filter数据结构的隐私集合交集协议。该协议能够保证双方在各自隐私安全的前提下,计算出两者数据集合的交集,其中只有一方能够计算出交集元素,另外一方无法计算得到交集,并且双方都不能获得或推测出对方除交集以外的任何集合元素,确保了参与双方敏感信息的安全保密。所提协议引入了基于身份的密钥协商协议,能够抵抗非法用户的恶意攻击,达到隐
当前,国内天然气价格水平与国外相差较大,有些矛盾较为突出。主要表现在:首先,价格调整无法及时适应供需的变化,我国近几次调价,既不和国际气价走势一致,也体现不出供需变化.
针对量子计算机技术的迅速发展使得传统公钥密码体制的安全性面临严重威胁的现实性问题,提出一种新型的基于环上误差学习(RLWE)问题的后量子认证密钥交换协议。协议通过使用Peikert式误差协调机制,双方通过计算可直接得到均匀分布的共享比特值,从而使得通信双方得到相同的会话密钥。使用理想格上的解码基对协议正确性进行了分析,并设置合理参数从而保证协议双方以显著概率得到相同密钥值。该协议在BR(Bella
目的:探讨孕期高危妊娠的筛查和管理。方法:对松滋市妇幼保健院2010年和2011年2年门诊孕期高危因素进行回顾性分析。结果:高危妊娠发生率逐年增高。结论:应加强孕期高危因素的筛
目的观察减压与重建稳定平衡手术在腰椎间盘突出症治疗中的临床效果.方法:抽取腰椎间盘突出患者86例,将其按照治疗方法分成对照组与观察组,观察组患者接受减压与重建稳定平衡
子宫内膜异位症(endometriosis,EMs)是育龄期妇女的常见病,发病机制尚不清楚.其病变广泛,极具侵袭性和复发性,常呈现恶性临床行为.微小RNA(microRNA,miRNA)在细胞增殖、分化和凋
目的:探讨造影剂在介入手术中出现不良反应的类型、临床表现及采取的观察、护理措施,对减少不良反应发生机率的方法。方法:我院947例行介入治疗的患者,术前行静脉注射碘过敏试验,
目的:客观评价有限内固定结合组合式外固定支架治疗胫腓骨多段开放性骨折的疗效、并发症、手术方法及注意事项。方法:选择病例23例,均为开放性3段或3段以上伴不同程度粉碎性骨折
针对自然排序树(CAN-tree)算法构建的树结构节点个数过多、压缩性不高等问题,提出一种基于重构的改进CAN-tree算法。首先,使用自然排序法直接构建树结构,将频繁项集挖掘算法实现中数据库扫描次数减少至1;然后,对构建的树结构以支持度降序方式结合剪枝操作实现树结构的重构,得到高压缩性的树结构;最后,对重构的树结构进行频繁项集挖掘。实验结果表明,基于重构的改进CAN-tree算法所构建的树结构节
目的探讨针对十二指肠溃疡患者加强综合性护理干预对预后影响情况。方法选取2015年5月~2017年5月我院消化内科收治的十二指肠溃疡患者200例作为研究对象,将其随机分为对照组