基于关系和内容的推荐算法研究

被引量 : 10次 | 上传用户:dixg03
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网的内容已经进入富信息时代,网络上的数据、知识、商品、好友关系、甚至是微博或者带有用户信息的移动智能手机都囊括了大量的可用信息,而对于用户个体来说,却很难在海量的信息中找到对自己有价值的。在这样的大背景下,推荐系统应运而生,其目的就是从海量的数据中利用已有的选择打分等过程或者相似性关系挖掘出个性化的对用户有价值的信息,其本质是信息过滤。在日常生产生活中,也常常有推荐系统伴随在身边,比如电商网站上面的产品推荐,或者微博上面的好友推荐等等。但这些推荐系统在工程上对时间以及复杂度进行了妥协,所以可以看到推荐的结果有时候并不尽如人意,对用户来说仅仅是一个参考。在推荐系统研究领域,原始的信息可以分为用户对产品的评价信息、产品本身的内容信息、用户本身的标签信息等等。用户本身的标签信息往往很难得到,所以一般的推荐系统算法会用到前面提到的两类原始信息。诸如经典的协同过滤算法,用到的就是用户对产品的评价信息,在深入研究中,发现协同过滤基于相同口味的用户会喜欢同一类商品这一假设,看上去似乎很有道理,但推荐系统有一个目的就是个性化,该假设只会推荐热门的商品,而冷门的优质商品将越来越得不到推荐,所以以上的假设大部分时间是适用的,但不能解决所有的问题。而在另一些推荐算法中,有使用产品本身内容信息的,其思想是用户对某一类产品感兴趣,那用户对这一类中其他商品也会感兴趣,同样,思想是正确的,但在解决所有的问题上并不能完全适用。针对这些问题,本文想到了联合已有的原始信息,组合起来并以一个数据模型来表示,再在模型上使用推荐系统算法,从而能够联合现有的经典假设,完成各种情况下的推荐。本文共实验了两个推荐算法,分别是重启随机游走算法和逻辑回归算法,通过算法自然选择用户的各种喜好情况,从而完成推荐。本文使用了CiteULike网站上的数据集,其网站是一个论文查询引用网站,并保存有用户的引用论文,从而很好的匹配了本文需要的实验数据。在推荐结果评估算法上,本文使用了Top N的Precision、Recall,以及整体的MAP,从实验结果中可以得到,本文实验的两种方法比起经典的协同过滤等算法都有所提高。在时间复杂度上,重启随机游走在合理的时间复杂度增加下提高了Precision、Recall等,是可以接受的,逻辑回归的结果可以看成是一个分类器,所以在时间复杂度方面更加适用于实际生产中。
其他文献
社会经济的迅速发展对能源的需求日益增加,而化石能源的逐渐耗竭和过度使用不仅造成全球性的能源危机,也导致了严重的环境污染和生态问题。因此,对清洁可再生能源的研究近年
通信技术与电子对抗技术总是相互促进,共同发展的。近年来,随着通信技术的高速进步,以及软件无线电技术的成熟,通信设备已经可以做到同时发射多种形式的通信信号,这给电子对
<正>在刚刚公布的C-NCAP第二批测试结果中,一汽-大众速腾以44.6分的成绩获得4星级评价,目前在同级别车型中成绩是最高的。为了更全面具体地了解速腾的安全性能,本刊记者带您
CAD三维制图技术经历了计算机技术发展的几个阶段,现在已经成为设计专业的一门必修课程。计算机辅助设计可以让设计人员明确自己的设计目标,创造出满足用户个性化需求的设计
我国既是人口大国又是少林国家,生态环境基础脆弱。我国共拥有林地面积3.06亿公顷,3倍于耕地面积,蕴藏着极大地发展空间和潜力。但受限于当前林业资源管理制度和森林资源利用
通过烧结杯实验,研究了不同粘附比对混合制粒及烧结过程和烧结矿产质量指标的影响规律。结果表明:制粒后混合料平均粒度随粘附比增大先增后减,粘附比为0.20时平均粒径最大,透
随着我国水电事业进入大电网、高电压、大机组、高参数的现代化发展时期,水轮机调速器的控制性能也愈加重要。"水轮机调节"课程作为三峡大学能源与动力工程专业水动方向的一
[目的]观察护心康对动脉粥样硬化兔动脉血管壁基质金属蛋白酶-9(MMP-9)及基质金属蛋白酶组织抑制剂-1(TIMP-1)表达的影响。[方法]将家兔随机分4组;正常对照组(饲养普通饲料)、
国外公共营养教育状况沈阳农业大学食品系孟宪军随着生产的发展,各国人民生活质量正在不断提高,各国普遍对全民的营养教育给予了高度重视。一、阿曼阿曼采取政府干涉的措施鼓励
期刊
海南在我的印象中是美丽的,犹如一幅画:椰林、沙滩和轻轻拍打礁石的海浪;海南在我的印象中是神秘的,因其岛上的黎族先祖早在五千年前就开疆僻壤,传承文明。读着苏东坡的诗,对