在线交友领域协同过滤的扩展KNN算法

来源 :北京大学 | 被引量 : 0次 | 上传用户:qwer890405
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
推荐系统是一个帮助用户寻找发现所需信息的服务系统,让丰富的信息或者产品高度个性化的展示在用户面前,满足用户的各种需求,改进了用户体验;对企业来说也提高了购买转化率进而增加了利润。近些年随着网络的迅速发展,推荐系统逐渐渗透到生活的各个领域,典型的如电子商务等。推荐系统利用用户的各种属性信息、历史行为数据以及产品的特征数据等,分析预测用户的喜好,为用户产生个性化推荐结果。  协同过滤推荐算法并不借助用户或者物品的属性信息,只通过分析用户的历史行为,从中找出用户和物品的相互关系,预测用户的喜好从而产生推荐。这个优点使其成为推荐系统中最流行的一类算法。邻居模型(kNN)、矩阵分解算法(MF)等在各个领域中有非常广泛的应用,其中邻居模型(kNN)是协同过滤算法中应用最为广泛的模型之一。  在线交友是近些年新兴的推荐系统应用领域,主要目标是为用户推荐喜欢并且可能建立正向联系的异性。不同于传统的用户-物品推荐系统,物品是静态的,推荐的成功与否只取决于用户单方面的偏好;人与人之间的推荐难度更高,用户可以对收到的信息作出反馈,双方的喜好都需要被考虑,推荐的结果需要高度符合双方的喜好。  在人与人推荐领域,迄今为止并没有成熟通用的协同过滤算法,相关研究者多数也是进行一些框架性的探讨。本文基于婚恋交友网站“世纪佳缘”收集到的用户行为数据,对人与人推荐系统进行了研究;在总结相关人员研究成果的基础上,扩展了邻居模型(kNN),主要的贡献如下:  提出了修正概率协同过滤算法(Modified Probabilistic Collaborative Filtering)。该方法放弃了传统的对称相似度的形式,采用了更加能反应人与人之间共性和特性的不对称相似度;同时充分考虑了用户间负向联系占绝大多数的统计规律,修正了传统的概率协同过滤算法中的相似度计算形式;最后以数学上求期望的形式预测用户评分,是一个更加符合现实应用情景的算法。计算结果表明与基本邻居模型(Basic kNN)和概率协同过滤(ProCF)相比,在多个指标上明显提高了Top-N推荐问题的预测精度。  提出了混合算法。该方法结合邻居模型(kNN)推荐精度高、易于解释的优点和隐式因子模型(MF)能高效的填充评分矩阵元素的优点,试图利用两个单向选择模拟双向选择,最终使用双方用户对彼此的预测评分去衡量建立正向联系的可能性,并通过在线测评验证了其有效性。
其他文献
随着Internet的日益普及,电子邮件、网上银行、电子商务、远程办公、视频会议等等这些应用也日渐兴起,人们也更加关注网络使用的安全问题。VPN的应用可以方便廉价的构建安全的
本文共两章.第一章给出了双射σ-PBW扩张代数的合成钻石引理的另一证明,并给出若干简化合成的条件.第二章给出了关于Lyndon-Shirshov字的一个简单的算法,证明了其结果与特殊的A
捕获再捕获通过捕获部分个体来获得整个群体总数的估计,其中包括点估计与区间估计。以往的群体总数的区间估计方法主要是渐近正态法,当捕获率较低时这种方法给出的置信区间并不
考虑如下问题:设R为实数域,Q为有理数域,f(Xn,k)∈Q[Xn,k]是以Xn=(x1,…,xn)和k为未知元的有理系数多项式,求所有使得f(Xn,k)在Rn上非负的k.很明显,多项式优化问题和多项式的非负性判定问题
随着信息时代的来临,我国的职业教育也开设了相应的信息技术教育课程.伴随着教学实践和教学研究的发展,信息技术课程也提出了一些教学改革的策略.教学改革的目标是为了提高教
本文研究了带较一般自相互作用的非线性Dirac方程,这种较一般的自相互作用是整数k+1次标量,赝标量,向量和赝向量自相互作用的线性组合.我们解析地给出了上述非线性Dirac方程的孤
偏微分方程控制系统在控制理论中有广泛的应用.而在实际问题中,其精确能控性显得尤为重要.近几年以来对偏微分方程控制系统的精确能控性的研宄有了飞速的发展,大量的优秀方法
在通信网络的研宄中,人们通常以图为数学模型表示多处理器系统的互连网拓扑结构,用图的性质和参数来度量网络拓扑的性能.在研宄网络的可靠性时,人们通常用边连通度进行度量.
6月18日,全球两大焊接展之一的国际专业焊接盛会、中国焊接行业年度盛会——第18届北京·埃森焊接与切割展览会在上海新国际博览中心盛大开幕。国内外严峻的经济形势似乎并未
在半群理论中,研究半群的同余是类非常重要的问题,研究正则半群上的同余的一个有效方法是核迹方法,核迹方法首先用于对逆半群上的同余的研究.本论文主要研究逆半群上泛关系w的(T