基于回归树模型的推荐技术研究和应用

来源 :南京大学 | 被引量 : 0次 | 上传用户:morningwind2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网信息技术的发展,网络服务商为用户提供了诸如新闻、商品、图片、视频、音频、文档等以下统一简称为物品的在线服务。为了更好的为用户提供服务,服务商会记录用户的历史行为。用户对物品的行为数据是分析用户偏好的重要信息,由于每一个用户对不同物品的行为数据具有特殊性和倾向性,如何根据有限的行为数据挖掘用户偏好,进而据此为用户提供推荐是推荐领域面临的重要问题。所谓推荐即是预测用户可能喜欢的商品、按照可能的喜欢程度排序,并把这个商品列表推荐给用户。在经典推荐算法中,基于内容的推荐算法无法充分的挖掘行为数据,推荐准确率不高,限制了其在工业中的推广应用。基于协同过滤算法的推荐在用户和物品数量级都十分庞大的情况下,构建评分矩阵需要消耗很高的计算代价,从而影响推荐系统的性能,并且对于冷启动问题没有很好的解决方案。回归树算法在推荐领域是一种实用且有效的方法,通过对用户的行为数据挖掘出用户倾向点,利用集体智慧服务于个人,与此同时,可以避免传统协同过滤算法的单机性能瓶颈、难以扩展的问题,也可以很方便的使用分布式计算的手段解决算法的实时性问题。本文基于对用户行为数据的研究,针对传统推荐算法的问题,提出了一种基于用户画像和梯度回归树的商品推荐模型(User Profile Based Gradient Boosting Regression Trees Recommendation Model),UP-GBRT。模型使用回归树算法进行特征训练,引入了结合时间衰减因子的用户画像方法,将时间对用户的偏好影响形式化的融合到用户画像中。为了增强模型在海量数据中的适应性,模型在预测阶段引入了基于相似用户的过滤方法,对海量数据进行筛减,提高了模型的适应性。模型在海量真实的房产用户行为数据上进行了相应实验,实验结果表明,模型相比较其他经典推荐算法能更有效的预测用户对房产的点击行为,从而提升推荐精度。最后,本文对房产个性化推荐系统进行了整体设计,包括数据导入模块、数据清洗标准化模块、算法引擎模块、中间数据存储模块和推荐结果输出模块。经过测试,本文所设计的房产个性化推荐系统,在推荐精度与计算效率上,达到了预期效果。
其他文献
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
某电厂采用MPS180-HP-n型中速磨煤机,针对磨煤机运行期间存在的石子 煤排放异常、分离器出口温度高、冷风调节门开度大、煤粉细度偏粗等异常问题进行了 分析,指出磨煤机入口
在医用化学教学中,探究多媒体技术的优势与不足,结合传统教学模式,最大限度地发挥两者的作用,体现出多媒体教学的真正价值。
为了帮助海量异构数据存储技术方向的初学者和研究人员,更好地理解海量异构数据存储技术的思想,把握海量异构数据存储技术的要点,了解海量异构数据存储技术的现状和发展方向
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
目的研究核酸定量检测在人类免疫缺陷病毒(HIV)抗体检测不确定样本的辅助诊断中的应用。方法收集2014年-2015年宁波市HIV抗体检测结果不确定样本43例,随访获得患者WB抗体条带
光伏产业在河北省经济和社会发展中具有举足轻重的地位。由于金融危机的影响,河北省的光伏产业受到严重的冲击,同时也暴露了光伏产业在发展中存在的一些不容忽视的问题。要想使
目的:运用临床调查研究方法,探讨昆明地区就诊的多囊卵巢综合征(polycystic ovary syndrome,PCOS)患者的中医证型、体质的分布规律、生活中与本病有关的危险因素,并查找危险因素与中医证型之间的相关性。希望通过本研究,为今后开展昆明地区PCOS疾病的中医药诊疗研究提供依据。方法:通过对昆明地区就诊的150例PCOS患者疾病信息采集和整理,运用医学统计方法对数据进行计算,用描述性
目的:探讨308准分子光与卤米松软膏联合治疗白癜风疗效。方法:收集本院2013年1月至2018年3月收治的白癜风患者40例,将患者统一编号后按照随机数字表法分为观察组和对照组,每组2