论文部分内容阅读
揣测别人的心思,然后投其所好,确实是一件“有利可图”的事情。眼下,一些电子商务网站就纷纷搞起了这个“营生”,而被摸准了心思的人们也是乐此不疲。
网站明白你的心
在淘宝网,如果你之前多瞄了几眼结婚用品,那么在“猜你喜欢”的栏条里,就会出现婚纱、喜糖、气球之类的相关用品。而在当当网,如果你买过几本作家六六的作品,那么《双面胶》、《仙蒂瑞拉的主妇生活》等书也会慷慨地出现在你的视野中。除此之外,豆瓣网推荐音乐的功夫,也确实令人折服。听过《小情歌》等旋律优美的舒缓情歌后,更多类似的婉约歌曲就会出现在你的播放列表中。
就像豆瓣音乐打出的广告说的那样“与喜欢的音乐不期而遇”。也许在听众的脑海中,这些正中下怀的推荐内容,确实有点不期而遇的味道。而事实上,这种浪漫的感觉,正是通过“推荐算法”才得以实现的。
而这项技术的出现,要从一个叫做杰弗·哈梅巴赫的数学天才说起,2006年,他从哈佛毕业后,进入了Facebook公司。在这里,他研究出了奠定Facebook业务的基石——“推荐算法”,运用这项技术,Facebook可以将广告精准地投放到目标人群中。自此之后,“推荐算法”迅速风靡,现在已经全面运用到诸多的网站中,从视频推荐、音乐推荐、购物推荐直到好友推荐等。
“推荐算法”很严谨
“推荐算法”就像一个会读心的魔法师,它的贴心使它的拥趸者与日俱增。“我听歌时常常只按下播放键,然后音乐台就会随机播放我喜欢的曲目。在网购时,我也习惯买几个随商品推荐的小玩意儿。”孙小姐是一位银行职员,她甚至在使用微博时,从“可能感兴趣的人”中,发现了自己小学的好友。在孙小姐的脑海中,她甚至不知道“推荐算法”这个名词,但是她却很享受这种便利的服务。
事实上,“推荐算法”并不像它的表象那么浪漫,它有着严谨的工作流程。中国电子商务研究中心高级分析师张周平告诉记者,推荐算法其实可以分成很多大类。最普通的推荐算法,是基于内容分析来进行的。用户在浏览网络时,会留下很多的“痕迹”,比如他们的浏览记录、购买记录等等,通过对这些信息的整理和汇总,系统会根据结果,为他们推荐相类似的产品,比如你浏览过很多次高压锅后,下次登录时,你的推荐栏中可能就会出现品牌不同、样式各异的高压锅。
智能是“推荐算法”的最大特点
“推荐算法”还有一种方式,让推测的范围更有想象力。张周平告诉记者,这种方法以属性或兴趣相近的用户经验,作为提供推荐基础的推算方式。它记录拥有相似喜好的用户经验,并将意见提供给同一群体内的其他用户。简单说来,就是在你购买帐篷、防潮垫等用品后,系统可能会向你推荐折叠餐桌、速干衣等其他的户外产品。
而在音乐领域,还有一种更为复杂的运算方法。人声分布区域、全曲平均每字时长、单句每字时长,这三个数据是用来推荐相似曲风歌曲的基础。
人声分布区域是一个时间段的概念,它结合整首歌的时长来获得人声演唱的相对时间段。因为通常来说,曲风、旋律都相近的歌曲,在人声分布区域上也是相近的。而全曲平均每字时长和单句每字时长,这与歌曲的节奏是一致的,不同的字长和时长把歌曲分为慢、偏慢、偏快、快四个类型或是更多类型。最后,通过综合这几个数据的结果,曲风、节奏、旋律相似的歌曲就会被推荐到你的歌曲列表中。
有趣的是,“推荐算法”还有一些新的功能。通过观察人们正在听什么音乐,搜索什么内容,甚至可以做出一些预测。谷歌根据“推荐算法”推出一种新的产品,用来尝试通过搜索的内容,预测奥斯卡金像奖的得主。据了解,过去几年的奥斯卡最佳影片,比如《拆弹部队》、《贫民窟的百万富翁》、《老无所依》等,都曾于获奖前在搜索引擎中表现出了至少四个星期的上升趋势。不过,这种预测的准确率也还值得商榷,最典型的例子就是搜索排行名列前茅的《社交网络》最终还是在颁奖礼上败给了《国王的演讲》。
“读心术”也有局限性
尽管“推荐算法”的“粉丝”无数,但它也不是总能令人满意。就像孙小姐说的,“系统提供的音乐尽管合我口味,但永远相似的风格,有时也让我厌烦”。而图书、服装等商品的推荐也面临这样的尴尬。比如当你在网购时买过一本书后,系统会将这位作者的其他图书也推荐给你,如果你听信了系统的推荐,那么几次之后,你的书柜就有可能变成这位作者的全集收藏库。而厌倦了推荐的人们,可能又重回到他们最原始的搜索方式了。
“推荐算法”能体察人心,但是它永远不会带给人们突破和惊喜。有网友在论坛上直言不讳地表示“推荐算法会局限我们感兴趣的领域,阻止我们发现新的精彩”。看来,“推荐算法”的读心术技巧,要想真正“摸清”人类复杂的内心,还需要很长的时间。
网站明白你的心
在淘宝网,如果你之前多瞄了几眼结婚用品,那么在“猜你喜欢”的栏条里,就会出现婚纱、喜糖、气球之类的相关用品。而在当当网,如果你买过几本作家六六的作品,那么《双面胶》、《仙蒂瑞拉的主妇生活》等书也会慷慨地出现在你的视野中。除此之外,豆瓣网推荐音乐的功夫,也确实令人折服。听过《小情歌》等旋律优美的舒缓情歌后,更多类似的婉约歌曲就会出现在你的播放列表中。
就像豆瓣音乐打出的广告说的那样“与喜欢的音乐不期而遇”。也许在听众的脑海中,这些正中下怀的推荐内容,确实有点不期而遇的味道。而事实上,这种浪漫的感觉,正是通过“推荐算法”才得以实现的。
而这项技术的出现,要从一个叫做杰弗·哈梅巴赫的数学天才说起,2006年,他从哈佛毕业后,进入了Facebook公司。在这里,他研究出了奠定Facebook业务的基石——“推荐算法”,运用这项技术,Facebook可以将广告精准地投放到目标人群中。自此之后,“推荐算法”迅速风靡,现在已经全面运用到诸多的网站中,从视频推荐、音乐推荐、购物推荐直到好友推荐等。
“推荐算法”很严谨
“推荐算法”就像一个会读心的魔法师,它的贴心使它的拥趸者与日俱增。“我听歌时常常只按下播放键,然后音乐台就会随机播放我喜欢的曲目。在网购时,我也习惯买几个随商品推荐的小玩意儿。”孙小姐是一位银行职员,她甚至在使用微博时,从“可能感兴趣的人”中,发现了自己小学的好友。在孙小姐的脑海中,她甚至不知道“推荐算法”这个名词,但是她却很享受这种便利的服务。
事实上,“推荐算法”并不像它的表象那么浪漫,它有着严谨的工作流程。中国电子商务研究中心高级分析师张周平告诉记者,推荐算法其实可以分成很多大类。最普通的推荐算法,是基于内容分析来进行的。用户在浏览网络时,会留下很多的“痕迹”,比如他们的浏览记录、购买记录等等,通过对这些信息的整理和汇总,系统会根据结果,为他们推荐相类似的产品,比如你浏览过很多次高压锅后,下次登录时,你的推荐栏中可能就会出现品牌不同、样式各异的高压锅。
智能是“推荐算法”的最大特点
“推荐算法”还有一种方式,让推测的范围更有想象力。张周平告诉记者,这种方法以属性或兴趣相近的用户经验,作为提供推荐基础的推算方式。它记录拥有相似喜好的用户经验,并将意见提供给同一群体内的其他用户。简单说来,就是在你购买帐篷、防潮垫等用品后,系统可能会向你推荐折叠餐桌、速干衣等其他的户外产品。
而在音乐领域,还有一种更为复杂的运算方法。人声分布区域、全曲平均每字时长、单句每字时长,这三个数据是用来推荐相似曲风歌曲的基础。
人声分布区域是一个时间段的概念,它结合整首歌的时长来获得人声演唱的相对时间段。因为通常来说,曲风、旋律都相近的歌曲,在人声分布区域上也是相近的。而全曲平均每字时长和单句每字时长,这与歌曲的节奏是一致的,不同的字长和时长把歌曲分为慢、偏慢、偏快、快四个类型或是更多类型。最后,通过综合这几个数据的结果,曲风、节奏、旋律相似的歌曲就会被推荐到你的歌曲列表中。
有趣的是,“推荐算法”还有一些新的功能。通过观察人们正在听什么音乐,搜索什么内容,甚至可以做出一些预测。谷歌根据“推荐算法”推出一种新的产品,用来尝试通过搜索的内容,预测奥斯卡金像奖的得主。据了解,过去几年的奥斯卡最佳影片,比如《拆弹部队》、《贫民窟的百万富翁》、《老无所依》等,都曾于获奖前在搜索引擎中表现出了至少四个星期的上升趋势。不过,这种预测的准确率也还值得商榷,最典型的例子就是搜索排行名列前茅的《社交网络》最终还是在颁奖礼上败给了《国王的演讲》。
“读心术”也有局限性
尽管“推荐算法”的“粉丝”无数,但它也不是总能令人满意。就像孙小姐说的,“系统提供的音乐尽管合我口味,但永远相似的风格,有时也让我厌烦”。而图书、服装等商品的推荐也面临这样的尴尬。比如当你在网购时买过一本书后,系统会将这位作者的其他图书也推荐给你,如果你听信了系统的推荐,那么几次之后,你的书柜就有可能变成这位作者的全集收藏库。而厌倦了推荐的人们,可能又重回到他们最原始的搜索方式了。
“推荐算法”能体察人心,但是它永远不会带给人们突破和惊喜。有网友在论坛上直言不讳地表示“推荐算法会局限我们感兴趣的领域,阻止我们发现新的精彩”。看来,“推荐算法”的读心术技巧,要想真正“摸清”人类复杂的内心,还需要很长的时间。