基于人口统计学的改进聚类模型协同过滤算法

来源 :中国民商 | 被引量 : 0次 | 上传用户:duidui1314
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘 要:探讨算法设计流程、分析计算结果。
  关键词:人口统计学;聚类模型;协同过滤算法
  推荐系统是根据用户的兴趣建立模型的程序,推荐系统能分为基于用户行为的推荐系统、基于项目内容的推荐系统、基于人口统计学的推荐系统。在大数据环境下,推荐系统将人口统计学数据及语境感知等数据进行处理,通过复合系统保证推荐的准确度。
  一、算法设计流程
  (一)人口统计学下计算数据相似度
  用户相似度计算作为推荐算法的应用核心,准确性对推荐结果产生直接影响。从前使用的协同过滤推荐算法对用户相似度进行计算时,通过Spearman系数相似度展开计算,属于绝对指数的计算方式。在计算过程中,统计用户的年龄、性别、职业、文化程度等信息,从而确定用户群体的喜好,并根据以上属性进行聚类。用户人口统计属性向量利用(d1,d2....dn)表示,对用户在每一维度属性上的相似度进行计算,根据需求属性计算最终的相似度。可通过以下算法表示:
  [sim(p,q)=knsim(pdk,qdk)×w(dk)](1)
  在此公式中,n表示用戶的群体个数,sim(pdk,qdk)表示第p及q用户在dk上的相似性,w(dk)作为dk属性权值。决定指数相似性计算过程中,通过以下公式表示:
  [sim(p.q)=e-m-1mrm,p-rm,q](2)
  相对权值w(dk)作为dk属性对不同用户的能力进行划分,用户在dk属性两个维度上分值最高的项目t在不同个体的平均数利用ave(dk)表示,权值w(dk)通过以下公式计算:
  [w(dk)=ave(dk)k=1nave(dk)](3)
  通过以上三类公式能对两个群体在人口统计学上相似度进行计算。
  (二)人口统计学下的数据用户聚类
  针对人口统计学下的数据用户聚类方法,需建立在相似值之上,利用分层近邻传播聚类算法对用户进行聚类,结果中观察到同类用户与用户异类的属性差异。将用户集群U及用户相似度矩阵D输入后,根据上述公式进行计算,获得相似度矩阵的最大相似度:
  [simmax=max(sim(u,v))](4)
  二、结果
  (一)数据聚合
  利用Epimions及MovieLen(1M)数据聚合展开实践。Epimions聚合中含有enpinions.com上的5万个用户资料及13万的产品、70万评分、50万朋友关系等数据。MovieLen是美国研究的项目网站,主要含有电影评分,评分分为5级,1表示不喜欢,5表示非常喜欢,用户通过评分值表达对电影的喜爱,本次研究利用MovieLen(1M)、Epimions不同的数据聚合作为计算条件。
  (二)计算框架
  实验利用大数据计算框架MapReduce,实现对数据矩阵的高效处理,实现个性化的推荐功能。在实验中搭建3台虚拟机,第一台是NameNode节点,第二台是SecndNameNode节点,第三台是JobTracker节点。三台虚拟机均是DataNode节点,对Hadoop集群进行模拟,并利用MapReduce及Java实现。
  (三)推荐结果
  利用NDCG及ERR作为评价标准,训练数据选择60%及80%比例,特征维度D选择8及16两个维度。为对比DCCF方法结果,利用WEMF及BORMF、QMF等方法进行对比,将MF及Biased MF作为基准线。在NDCG及ERR评价标准上观察到准确率均比较明显,推荐准确性显著,结果见表1、表2。
  三、结束语
  基于人口统计数据对用户喜好进行计算,在传统的协同过滤算法上,将人口统计数据及HAP用户聚类算法结合,建立效果良好的推荐算法。通过实践显示,相比传统的过滤算法,新建立的算法精准度更高,满足用户对推荐产品的需求,为协同推荐算法应用提供条件。
  参考文献:
  [1]李艳娟,牛梦婷,李林辉. 基于蜂群K-means聚类模型的协同过滤推荐算法[J]. 计算机工程与科学,2019,41(06):1101-1109.
  [2]李华平. 基于聚类和监督学习模型的协同过滤推荐算法研究[D].广东工业大学,2018.
  [3]熊乐. 基于云模型和用户聚类的协同过滤推荐算法研究[D].华中科技大学,2016.
其他文献
摘 要:人力资源管理被视作企业发展的血液,只有人力资源管理活跃起来,整个企业才能够有活力、有动力、有向心力。因此,战略人力资源管理策略对于企业绩效管理具有积极的影响,能够帮助企业凝心聚力促发展,改革创新谋成就。  关键词:战略人力资源管理策略;企业绩效管理;团队;目标;定位  传统的人力资源管理通常是着眼于人员招聘与任用,忽视人力资源与企业战略发展之间的必然联系。战略人力资源管理策略则是着眼于企业
摘 要:本文通过对我国人口构成,劳动力资源和受教育状况,企业人才来源渠道、结构状况及人才流动管理现状分析,揭示了我国在人才测评、考核及管理,人才培养和使用制度,人才流动管理等方面存在的问题。进而提出了目前我国在人才培养和输出模式,人才测评、考核、定价及流动管理体系的建设,以及人才有偿使用制度的建立等几个方面的改革思路。其大胆的探索可为我国企业人才流动管理和解决当前人才流动管理困境起到一定的参考作用
摘 要:大学生的就业问题是社会关注的焦点问题,随着城市化水平的提高和现代化进程的发展,对人才的渴求逐渐从数量过渡到质量。笔者针对大学生毕业后就业城市提出一些自己的看法。  关键词:大学生;就业城市;研究  从整体而言,国内的相关学者,大多将大学生的毕业城市选择与经济发展相联系,发现收入差距比高生活成本对大学生流动的效应更显著,而大学生在选择二、三线城市就业时,则就愿意在个性,自然环境,社会环境,兴
摘 要:在当今的改革浪潮中,事业单位早已市场化,拥有一个职业化、规范化的员工队伍是事业单位稳定发展的前提与基础,而员工培训管理是提高员工队伍建设的重要手段。本文结合自身的工作经验,阐述了员工培训的作用以及特点,分析了员工培训存在的不足,提出了相关的解决对策。  关键词:事业单位;员工培训;问题对策  事业单位是非盈利组织,经费大多由财政拨款,再加上由于培训效果不能立竿见影,所以领导与基层员工往往对
摘 要:本文首先依托现代职业教育体系改革的相关政策以及实践经验,指出在工匠精神背景下要走双证融通、双相交融的现代学徒制校企合作人才培养模式,并由此展开分析,探索了如何重构高职人才培养模式。  关键词:工匠精神;现代学徒制;校企合作;人才培养  高职院校的办学特点决定了其是工匠精神的主要培育阵地,高职院校是具有工匠精神的工匠的培育摇篮,因此工匠精神必须要贯穿到高职教育教学的全过程,打造适合培育工匠精
摘 要:在国企经营发展的过程中,政工工作有着十分重要的意义,高效合理的落实政工工作可以为国企的建设发展提供良好保障,而政工干部的专业素质和业务能力直接影响着政工工作的质量。本文首先对政工干部在国企中的作用进行了探讨,而后基于优秀政工干部的相关标准,对如何发挥政工干部在国企中的作用进行了研究和分析,以供相关人员进行参考。  关键词:政工干部;国企;发展策略  一、政工干部在国企中的作用  在国企经营
摘 要:如何将知识在实践过程中应用一直是教学过程中探讨的问题,本文针对此问题提出了以物流管理专业为对像通过训赛结合的方式进行教学,此模式主要是在对企业岗位的调研基础上了解企业能力需求,从而对课程教学体系进行设计,为了更好的实现教学方案,运用以赛促教进反辅教学,教赛结合。  关键词:训赛教学;应用型;课程体系  2017年湖南省普通高等学校教学改革研究项目“训赛结合下的物流管理专业实践教学体系建构与
摘 要:在我国,事业单位非常重要,其对我国卫生服务以及社会文化建设作用非常重要,能够保证社会的发展稳定。随着时代的发展,事业单位发展的过程中也面临一些新的问题,以往的工作理念以及体制已经很难适应社会时代发展要求,需要根据实际需要进行改革。当前事业单位中,人力资源管理改革是重要改革方向,我国事业单位也应该根据自身人力资源管理情况进行管理模式的创新,确保自身管理能够符合当前社会发展需要,切实提高自身的
摘 要:那近年来人们对于自己身体健康水平越来越重视,医疗行业的竞争压力也在不断上升,在这个过程当中,医院为了提高竞争力,要进一步改善自身的管理水平。作为管理工作重要手段,绩效考核管理医院内部管理不可或缺的一环,本文将针对于医院绩效考核管理的重要性及必要性,进行深入分析,并在其基础上提出相关的有效策略。  关键词:医院管理;績效考核;规章制度  一、前言  作为人民生活群众健康生活管理的第1线工作者
摘 要:社区是城市最基本的生活单元,也是展示城市形象的重要窗口。国际社区是指以一定地域为基础,包容各类文化和生活方式,不同国家、种族、民族背景的人能够和谐共处的社会生活共同体。认真学习、把握、落实市委市政府关于“建设具有全球影响力创新名城”的总体部署,以及关于“国际社区”试点建设工作的要求,充分依托江北新区的政策体系,结合水城社区基础条件,通过加强国际交流,着力打造集“居住休闲+文化交流+创新创业
期刊