基于标签和隐私保护的聚类推荐算法的研究与应用

来源 :北京工业大学 | 被引量 : 0次 | 上传用户:PEARTREE123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
推荐系统作为当下信息检索的重要工具,在电子商务等诸多领域得到了广泛的应用和发展。随着2004年web2.0概念的提出,互联网进入了用户自由标注产生内容的时代。社会化标签在电子商务领域被普遍使用,用户通过自由标注能够更好的对资源按自己喜好分类,推荐系统也能够根据标签进行用户兴趣预测,进行高效的推荐。推荐算法根据用户的信息、资源的信息和浏览信息等内容进行偏好预测推荐,使得推荐系统面临着以下几方面的问题:数据量的膨胀使其面临着数据稀疏性的问题,根据用户的信息和浏览记录预测兴趣偏好时的隐私泄露问题,用户兴趣随时间迁移改变的问题等等。针对以上情况进行相应的研究和改进,主要内容如下。(1)针对数据稀疏性问题进行了研究,提出利用Slope one算法对用户没有评价过的资源进行评分预测填充,缓解稀疏性问题。标签作为连接用户和资源之间的桥梁,通过评分更能反应用户在使用标签时对资源的态度,因此将评分和标签融合。通过评分矩阵对标签进行加权更有利于提高推荐准确性。(2)针对隐私泄露问题进行了研究,提出在对用户进行模糊c均值聚类时引入差分隐私保护思想的方法;在聚类过程中加入Laplace噪声,保护聚类中心点,产生带有隐私保护的聚类中心点和带有隐私保护的相似用户,达到保护隐私的目的。(3)针对模糊c均值聚类算法初始中心随机问题进行了研究,提出把密度思想和最大最小距离思想进行融合的方法,解决隶属度矩阵和聚类中心初始化随机的问题。达到有更高的准确率和更快的收敛速度的目的。(4)针对用户兴趣随时间迁移改变的问题进行了研究,提出改进的指数遗忘函数,用其对标签进行加权反应用户的短期兴趣变化;并引入时间窗口的概念,兼顾每个人的长期爱好进行评分预测;达到动态模拟用户的兴趣随着时间变化的目的。(5)使用上面的研究成果,从需求分析、架构设计、模块设计、数据库设计等多方面进行设计并实现电影推荐系统。从而将基于标签和隐私保护的聚类推荐方法应用到个性化电影推荐系统中。达到针对不同用户“私人定制,隐私安全”的推荐目标。
其他文献
钻孔灌注桩具有无振动、无挤土、噪音小、宜于在城市建筑密集地区使用等优点,在建筑工程领域得到较为广泛的应用。钻孔灌注桩由于桩径大入土深,成孔施工在地下、水下等环境完
压致荧光变色材料是一类新型的刺激响应“智能”材料,该材料在压力传感器、记忆器件、安全墨水和光学记录等高科技领域具有非常重要的应用价值。近来研究成果表明,刚性π-共轭交叉形荧光染料有着独特的分子结构和迷人的光学性能。因此,论文以合成D-A结构的具有AIE性能的交叉形压致荧光变色分子为出发点,制备了一系列咔唑、四苯乙烯和三苯胺修饰的以苯环为核心的交叉形固态荧光分子,并研究了它们的分子内电荷转移(ICT
深度强化学习算法研究是近年来机器学习领域的一个研究热点。经验重放机制是深度强化学习算法中的一项重要技术,如何提高样本利用率并解决经验重放的固有缺陷是深度强化学习
工程结构维护问题是今后经营南海必将面临的一个难题。科学统筹科研资源,从而保障南海岛礁工程结构更好服务于我国政治、经济、外交和军事大局具有重要现实意义。本文采用AHP
钢轨打磨是一种铁路钢轨广泛应用且经济的维护技术。在钢轨打磨过程中,砂轮与钢轨之间的相互作用非常复杂,影响打磨效果及打磨效率。因此,开展钢轨打磨过程中钢轨材料去除行为研究,对优化钢轨打磨参数、提升打磨效率具有重要的指导意义和工程价值。本文基于简化后的虚拟砂轮模型,建立了钢轨打磨三维有限元仿真模型,根据钢轨打磨模拟试验所得试验数据,利用DEFORM-3D有限元软件仿真模拟了钢轨打磨过程,分析了不同打磨
Callipeltin B是从海洋海绵动物体Callipelta sp中分离出的新型环肽类化合物,Callipeltin B是由天然氨基酸L-亮氨酸、D-精氨酸和非天然氨基酸(2R,3R)-β-甲氧基酪氨酸、(3S,4R)-3,4-二甲基-L-焦谷氨酸、D-别苏氨酸、N-甲基-L-丙氨酸和N-甲基-L-谷氨酰胺构成的环七肽,该环肽对肿瘤细胞有广谱的细胞毒性。由于Callipeltin B分子结构中
企业刑事合规,是一个最近开始盛行且极具张力的概念,既体现了积极、全面预防企业犯罪的社会惩罚理念,又体现了企业先进的治理方式和合规经营理念,更具有出罪机能。企业刑事合规的建立与完善不仅仅是企业内部治理的的需要,更与国家刑事政策的积极倡导、激励和反向归咎密不可分。“远芳侵古道”的情势之下,中国企业也开始意识到合规经营的重要性,但是目前我国在企业刑事合规构建方面总体上仍然停留在学界探讨阶段。本文拟通过对
山西省公益林政策性保险试点工作开始于2013年,如何根据公益林政策性保险现状制定适用于山西省公益林政策性保险绩效评价的具体指标体系是本文要解决的问题。通过研究试图对
为了适应现实世界中复杂多变的环境,智能机器人需要感知环境并做出反应,并通过多个动作来完成特定的任务。在工业生产场景下,现有的机械臂系统大多是基于人工设定的规则来执
视网膜是眼底一个菲薄但是具有精细层组织结构的重要构成部分,各层及层厚度变化是视网膜疾病的重要临床特征。无创的光学相干断层扫描(Optical Coherence Tomography,OCT)技