基于用户兴趣变化动态聚类的协同过滤算法

被引量 : 0次 | 上传用户:glad8888
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于用户的协同过滤是一种重要的个性化推荐机制,这种机制认为目标用户最近邻的推荐最容易被接受。因此,如何准确找到目标用户的最近邻是实现基于用户协同过滤机制的关键性问题。目前,发现用户最近邻的主要方法是基于用户历史评分对用户进行聚类。因为用户历史评分可以反映用户的兴趣特点,根据用户的历史评分对用户进行聚类,可以将兴趣点相似的用户聚集在一起,在同一个簇中的用户互为最近邻。然而,如果在聚类前的某一时刻,有些用户的兴趣发生偏移,导致这类用户的历史评分会失真。如果根据用户全部的历史评价进行聚类,结果并不准确。针对这一问题,有学者提出最近时间窗口内聚类,用户评分只采用最近时间窗口内数据,尽管该方法可以定位用户最新的兴趣点,但这样可能会忽略用户的长期兴趣,而且,数据稀疏性问题将会更加严峻。针对用户兴趣偏移之后,导致用户聚类不准确问题,本文提出了一种基于用户兴趣变化动态聚类的协同过滤算法。论文所做的主要工作,主要分为以下几方面:(1)提出了项目特征网络图。多个相似的项目构成一个项目簇,以项目簇作为管理项目的基本单位,项目簇的建立是通过挖掘项目与项目之间固有和隐藏特征的相似性而获得。可以方便的通过用户访问项目的轨迹,识别出用户兴趣的偏移。满足簇内部高内聚,簇之间低耦合的特点。同时,以项目簇管理比用项目结点管理项目更高效。(2)识别兴趣偏移用户。通过用户的访问项目的轨迹,基于时间窗口建立马尔科夫链模型,可以在动态过程中找到用户兴趣的变化规律,从而识别出用户当前真正的兴趣,从而避免由于用户兴趣偏移对聚类所带来的影响。(3)缓解用户兴趣的被动偏移。针对兴趣偏移用户,利用用户对项目所在服务的满意度对用户评分进行修正,最终,利用修正的用户评分进行协同过滤。(4)缓解数据稀疏性。只对用户兴趣发生偏移的用户评分数据进行特殊处理,其他历史数据直接参与用户聚类,并不只是采用当前时间窗口数据。(5)把本文的基于用户兴趣变化动态聚类的协同过滤算法在聚类效率和推荐准确性方面分别和其他的算法进行对比实验,实验证明,在等同的条件下,本文的算法具有更高的聚类效率和更准确的推荐结果。
其他文献
地方政府竞争呈现阶段性特征,从廉价土地出让转化为依靠财政赤字膨胀和债务扩张。本文使用广东省及其相邻省区的沿边县域数据进行实证分析,结果表明:(1)地方政府间财政赤字存
管理是科学和艺术的结合,因此高校管理类专业教师的实践实战尤为重要。西藏高校管理类专业教师与企业对双方具有重要的意义,通过对双方开展交流活动的途径现状分析,提出应进
现行耕地保护政策是一种“委托-代理”式的体制,其核心是指标管理加上监督惩罚,忽视了调动地方政府保护保耕地的积极性,导致中央和地方在耕地保护上的激励不相容.从土地财政
与中国知识分子“学以致用”情怀一致,应用人类学在中国有着浓厚的应用情结。自人类学进入中国后,在实践和应用中都取得优秀成绩。20世纪80年代以来,中国人类学在参与发展或参与
关联规则是数据挖掘技术中一项重要的技术分支,该技术通过分析数据集中各项集之间的关联性,最终得到数据之间重要的关联关系。一般关联规则得到的规则表达形式都比较简洁,易
目的:此研究以运用电针作为治疗手段,从大鼠学习记忆能力改善的行为学变化,进一步到以生物钟基因对ERK的调控作用作为切入点,分析电针对VD大鼠的治疗作用,电针治疗VD的可能的
民主教育是以培养平等精神、权利意识、自主性等民主精神,理性、规则意识、批判的态度、沟通协商能力与意愿等民主素质为目的的教育。民主教育要求教师成为知识分子而不仅仅
页岩气储层具有孔隙度小、渗透率低、微裂缝发育的特点,需要进行压裂才能获得理想产能。彭页HF–1井是中国石化部署在重庆境内的一口重要的预探井,根据对该井的储层特征进行
目的通过分析加味大柴胡汤对早期重症急性胰腺炎患者血液中内毒素、TNFa、IL—6水平的影响,探索“加味大柴胡汤”治疗重症急性胰腺炎的作用机制。方法将50例已确诊的早期(急