基于混合推荐的网页推荐系统的研究与实现

被引量 : 17次 | 上传用户:freebird23
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术和互联网的发展,人们逐渐从信息困乏的时间走向了信息过载的时代。在海量信息中搜索自己感兴趣的信息变的越来越困难。个性化推荐服务作为解决信息过载的一种有效的手段应运而生,运用推荐算法自动在海量信息中快速发现符合用户个人兴趣的内容和服务。目前个性化推荐系统一般采取协同过滤或是基于内容推荐.但是协同过滤有冷启动问题和随着项目和用户数目的增多引起用户—项目矩阵变得稀疏性问题,这些会影响到推荐系统的推荐精确度。基于文本挖掘的推荐算法需要对内容本体进行分析,不能充分考虑用户的兴趣。针对协同过滤和基于内容过滤算法各自的缺陷,混合推荐算法能够取长补短,因而成为推荐算法研究领域的重要方向。本文就是通过对上述问题进行改进提高推荐精确度,主要工作如下:1、针对协同过滤中用户-项目的数据稀疏性问题引起的推荐准确度不高的问题,提出采用矩阵分解技术在同一模型中将项目内容信息,最大化使用已知信息提高推荐精确度。使用一阶正则化奇异值分解算法将用户针对网页的评分矩阵分解为用户针对隐主题的偏好矩阵和网页针对隐主题的特征矩阵,同时,在基于内容的挖掘中,一阶正则化奇异值分解进行隐语义分析,得到关键词针对隐语义和权重矩阵和网页针对隐主题的特征矩阵,在此基础上提出了结合两种网页针对隐主题特征矩阵的交替奇异值分解算法,将系统过滤中的用户评分信息和基于内容挖掘的内容信息相结合提高推荐的精确度。2、针对在普通协同过滤中计算用户相似度时,在用户评分数据稀疏的情况下引起的不准确,提出了采用用户的特征向量来计算相似度来缓解数据稀疏度,从而提高系统的推荐精确度。又因为在常用协同过滤中计算用户相似度需要在全域中进行计算计算量很大,该算法中通过K-means算法对用户按照用户的特征向量分簇,在计算最近邻集合时,在目标用户所属子簇中获取用户近邻,从而减少计算量。3、最后构建网页个性化推荐服务系统,结合以上算法进行混合推荐。
其他文献
色彩教学在现代高校美术专业中的地位非常重要,它是一切造型艺术的基础。色彩教学不能完全脱离基础造型而单独存在,同时色彩练习课也要适应新时代的要求不断改革与完善。进行
高速加工作为高新制造技术之一,可以大幅度提高加工效率、降低切削力和切削温度、提高刀具寿命和加工效果。高速加工中刀尖颤动一直被广泛的研究,而刀尖颤动主要是由刀柄与主轴
在电子战系统中,数字接收机由于具有参数测量精度高、灵活性高和体积小等诸多特点而得到广泛应用。随着雷达技术的不断发展,战场电磁环境渐趋复杂,同时到达信号增多,信号类型
春秋战国时期,百家争鸣,诸子并存。但西汉以来,惟有儒家学说成为独尊千年之显学,居于社会主流意识形态经久不衰。其原因来自多方,本文在辨析儒学独尊的概念、破除误解的基础
本文介绍了豫西桔梗高产栽培的关键栽培技术措施,主要包括科学选地、适期播种、分期追肥、摘除枝芽和花蕾等。
交通运输事业单位管理着数额庞大的国有资源,其财务管理水平的高低对于国有资源保值增值、进一步提升交通运输资产的经济和社会效益十分关键。文中结合现阶段交通运输事业单
使用现有生产线上工艺成熟且成本低廉的技术实现ITO粗化以提高GaN基LED蓝光芯片的出光效率是产业界重要的研究课题。本文通过普通光刻技术和湿法腐蚀技术,实现ITO表面粗化,有
目的检测hsa-miR-155在乳腺癌组织中的表达,并对其进行生物信息学特征分析。方法收取手术切除乳腺癌组织标本共计15例,并取其癌旁组织作为正常对照,通过实时定量荧光PCR方法(
根据半挂车生产企业的需求,利用有限元分析技术,并借助ANSYS有限元分析软件,对不同工况下HYCL040型半挂车车架的强度和刚度状况进行了分析,找出目前故障发生的原因,并提出几
[目的]探讨艾烟对小鼠肺组织病理、免疫器官及肺部炎症反应的影响,为针灸门诊灸法的安全性提供参考。[方法]根据调研得知针灸门诊最大的艾烟浓度,模拟建立艾烟环境。以健康昆