基于Nystr?m方法的偏好提取的研究

来源 :烟台大学 | 被引量 : 0次 | 上传用户:seraphim
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
推荐算法目前在很多应用中都广泛涉及,如淘宝网站可以根据用户的购买记录和浏览记录为用户推荐商品。好的推荐系统不仅可以节省用户的浏览时间,更能及时为商家进行宣传。简单的说,对用户进行推荐就是基于用户的以往记录进行分析,从众多记录中分析出用户的潜在偏好,根据用户的特征对用户进行针对性的推荐。在推荐系统中,最重要的就是对用户的特征进行提取,得到用户特征的过程实际上也是一种推荐过程。特征提取目前在很多领域中都有运用,随着大数据时代的到来,数据的规模也越来越大,特征提取中面临的最大问题就是矩阵的规模和性质,对于稀疏矩阵而言,既要保证其提取后的特征的准确性,又要兼顾在提取过程中的时间复杂度。针对上述问题设计了用户偏好处理算法。针对矩阵规模大的问题,可以对原始的数据矩阵进行采样,为了最大限度的保留采样前矩阵的特征,就需要选用合适的采样方法。对采样后的矩阵进行特征分解,可以得到特征值和特征向量。为了保证提取的偏好特征的准确性,本文设计了一种新的算法来提取矩阵的特征。即利用Nystr¨om方法的特性,结合凸的非负矩阵分解。具体方法如下:首先利用用户的评分矩阵,将评分矩阵根据距离公式转化为用户-用户的相似度矩阵,这样做的好处是充分利用用户之间的联系,然后从相似度矩阵中进行采样,得到一个采样后的矩阵,在采样过程中用到的自适应采样方法,该方法在采样过程中需要对被采样的矩阵进行遍历,充分挖掘原矩阵的特性,这样能够保证采样后的矩阵最大限度的保留原矩阵的特征。由于Nystr¨om方法的特殊性,只需要对矩阵进行列采样即可,这样能减少运算的时间。其次,通过对近似后的Nystr¨om方法进行特征分解,主要采用的是凸的非负矩阵分解,不同于非负矩阵分解的方法,凸的非负矩阵的分解不会受到数据符号的限制,经过分解后,得到特征值和特征向量,经过Nystr¨om近似后,矩阵的规模减少了,计算的时间复杂度也变小了,由原来的O(n~3)变为O(kcn),其中,n表示的是原矩阵的列,c表示的是采样后矩阵的列,k则是采样后矩阵的秩。对于规模较大的矩阵而言,特别是稀疏矩阵,这一点至关重要。最后,将特征提取应用到推荐系统中,Nystr¨om方法能够将高维的数据降低到低维子空间中,通过对矩阵的恢复来衡量推荐的有效性,将特征提取应用到现实生活中,这对于特征提取的研究非常重要。
其他文献
龙眼(Dimocarpus longan Lour.)属无患子科(Sapindaceae)龙眼属,是著名的热带亚热带特色果树。龙眼体细胞胚胎发生(somatic embryogenesis,SE)系统是研究龙眼胚胎发育的良好
随着优质医疗资源的供给与日益增长的就医需求之间的矛盾日渐突出,出现了患者挂号难、排队时间长的管理瓶颈,根据卫生部颁布的《关于在公立医院施行预约诊疗服务工作的意见》
随着科学技术的飞速发展,越发成本低廉的数码电子产品的广泛使用,主要包括具有高清摄像头的智能手机、HD摄像机等,图像、视频一类的视觉信息获取已经成为我们生活中不可分割
随着移动互联网的飞速发展,各类移动信息终端的数量及用户对速率的需求都呈现爆炸式增长,这对移动通信网络的能量效率(Energy Efficiency,EE)提出了更高的要求。当前,异构蜂窝网络(Heterogeneous Network,HetNet),多输入多输出系统(Multiple-Input and Multiple-Output,MIMO)及毫米波(Millimeter Wave,mm W
研究目的本实验采用高脂饲料喂养大鼠,建立非酒精性脂肪性肝炎模型,观察健脾疏肝方对非酒精性脂肪性肝炎大鼠一般情况、肝脏病理学形态、肝功、血脂、胰岛素抵抗及氧化应激的影响,探讨健脾疏肝方治疗非酒精性脂肪性肝炎的作用机制,为中医药临床治疗非酒精性脂肪性肝炎提供实验室依据。研究方法将40只SPF级大鼠按照随机数字表法,初步分成空白组、模型组、健脾疏肝方低剂量组、中剂量组、高剂量组、多烯磷脂酰胆碱组。除模型
传统的管理信息系统开发一般采用固化系统业务处理流程的方式,系统开发完成后业务处理流程不再允许变更。虽然这种开发方式有一定优点,但这样带来的缺点则非常突出:由于系统
互联网技术的飞速成熟和发展,带来的是多媒体数据量的爆炸式增长,这导致很多应用场景都无法通过最近邻检索来降低巨大的计算消耗。因此,近年来,近似最近邻检索越来越受到人们的关注,特别是很多基于哈希的近似最近邻检索。这些哈希方法在保持原始数据相似性的前提下,首先将原始数据映射到海明空间,然后在海明空间进行异或操作。这样可以极其有效地提高效率和降低存储空间的消耗。为充分利用类型丰富的多媒体数据,越来越多的跨
研究背景0-6岁的儿童正处于生长发育的关键时期和快速增长阶段,儿童时期的健康成长,为成年以后的健康和发展打下良好的基础;同时,儿童的生长发育水平还是一个国家经济社会发展与文明进步的重要标志,研究儿童生长发育可为提高我国民众的健康素质与水平奠定基础,提升未来的人力资源质量,降低因生长发育不良所致疾病的卫生资源消耗,提高社会资本产出的价值与效益和国民经济整体运行的质量。因此,促进儿童发展,对于全面提高
地震勘探是石油、天然气勘探重要手段,地震勘探随机噪声压制是地震勘探信号处理不可或缺的组成部分。如何从强噪声、低信噪比背景下提取微弱的有效信号一直以来都是噪声压制
近年来随着科学技术水平的不断提高,对核环境起重机的可靠性要求越来越高,但目前国内还没有深入研究潜在的故障模式、故障机制和设计过程中的可靠性指标要求对核环境起重机的