论文部分内容阅读
社交网络正改变我们搜索信息的方式。
你如何解析一条Twitter消息?5年前,这个问题简直问得莫名其妙。而现在,这完全合乎情理,而且它正在阿米特-辛格尔(Amit Singhal)的脑海中孕育。辛格尔领导谷歌的一个项目,通过对网上内容的更新进行跟踪与排名——特别是每秒更新数千条信息的社交网络,将新数据实时整合到搜索结果中。
实时搜索是为了适应人们使用互联网方式的彻底转交。过去,人们访问一个页面,点击链接,之后访问下一个页面。而如今,他们则花费大量时间查看数据流——来自Facebook的状态更新、来自Twitter的推文以及博客和新闻门户新闻头条。
转瞬即逝的信息金沙是互联网的新货币,而从中挖掘有用信息是搜索引擎的一项挑战。辛格尔表示,最困难的部分不是收集数据。Facebook和Twitter很乐意直接出售其信息源的访问权——他们称其为“消防水管”——给搜索服务供应者,这些信息直接灌入谷歌的计算机。
实时搜索真正困难的地方在于理解信息比特流的含义。这远远比过滤垃圾信息困难,尽管后者是这项任务的重要部分。人们进行实时搜索时,想要得到与传统搜索相同的搜索质量、相关性以及权威性。没有人愿意直接对着消防水管喝水。
谷歌通过仔细跟踪指向网页的链接以及其它随时间增加的价值特征占据了传统搜索市场。但对于实时搜索,这并不起作用。因为社交网络中的信息写后几分钟内就会失去其价值,而谷歌则不得不在数秒,甚至几微秒内评估其价值。
谷歌对其搜索算法守口如瓶是众所周知的,但辛格尔解释了谷歌用来分析他所谓的“闲谈”的方法,其中一些很直观。吸引众多关注者的Twitter用户,以及那些推文经常被别的用户分享的用户,通常来说更具权威性。类似的,Facebook用户通过他们的好友数量提升地位,特别是当他们的朋友也拥有诸多好友时。
其他特征则不那么明显。在信息流中一个单词出现次数的突然飙71——比如说,地震——可能标志着某一重大事件。如果一条有关常见话题的信息包含不寻常的短语,那么则有可能标志着新的信息或独特见解。辛格尔表示,谷歌会不断检测语言上的改变以及其它预测行为的偏差。
谷歌还尝试将通过智能手机、移动计算机发送的消息内容,或者通过Foursquare公司的广播服务传输的消息与地理数据联系起来。发送信息者的地理位置至关重要。如果你知道某个发布了关于地震的推文的人距震中很近,那么这些推文的价值将高于那些远在天边的人所发出的推文。
辛格尔对实时搜索的看法与谷歌的战略相一致:从混乱数据中提取出在特定时间与某个搜索者最相关的内容。其他搜索服务商,包括谷歌的主要竞争对手微软在内,则持有更加激进的看法。
负责运营加州山景城微软搜索技术中心的西恩·苏克特(Sean Suchter)并不怎么喜欢“实时搜索”这个词,他认为这太局限了。而微软Bing搜索引擎应当不只是过滤来自社交网络的数据,更要拓展它们。
苏克特认为,最终Bing会依靠人们输入的关键字触发一对一会话。他预计实时搜索所带来的全新体验会削弱谷歌长期以来的统治地位。“这无关过去。”苏克特如是说。短暂停顿后,他又补充到:“我们将把他们彻底打败。”
阿米特·辛格尔之前就听过类似的威胁,但迄今为止还没有怎么兑现。但即使他也承认实时搜索的到来几乎标志着与搜索历史中他见过的任何事物“彻底决裂”。让谷歌在“闲谈”时代保持领先可能是辛格尔最艰难的挑战。
你如何解析一条Twitter消息?5年前,这个问题简直问得莫名其妙。而现在,这完全合乎情理,而且它正在阿米特-辛格尔(Amit Singhal)的脑海中孕育。辛格尔领导谷歌的一个项目,通过对网上内容的更新进行跟踪与排名——特别是每秒更新数千条信息的社交网络,将新数据实时整合到搜索结果中。
实时搜索是为了适应人们使用互联网方式的彻底转交。过去,人们访问一个页面,点击链接,之后访问下一个页面。而如今,他们则花费大量时间查看数据流——来自Facebook的状态更新、来自Twitter的推文以及博客和新闻门户新闻头条。
转瞬即逝的信息金沙是互联网的新货币,而从中挖掘有用信息是搜索引擎的一项挑战。辛格尔表示,最困难的部分不是收集数据。Facebook和Twitter很乐意直接出售其信息源的访问权——他们称其为“消防水管”——给搜索服务供应者,这些信息直接灌入谷歌的计算机。
实时搜索真正困难的地方在于理解信息比特流的含义。这远远比过滤垃圾信息困难,尽管后者是这项任务的重要部分。人们进行实时搜索时,想要得到与传统搜索相同的搜索质量、相关性以及权威性。没有人愿意直接对着消防水管喝水。
谷歌通过仔细跟踪指向网页的链接以及其它随时间增加的价值特征占据了传统搜索市场。但对于实时搜索,这并不起作用。因为社交网络中的信息写后几分钟内就会失去其价值,而谷歌则不得不在数秒,甚至几微秒内评估其价值。
谷歌对其搜索算法守口如瓶是众所周知的,但辛格尔解释了谷歌用来分析他所谓的“闲谈”的方法,其中一些很直观。吸引众多关注者的Twitter用户,以及那些推文经常被别的用户分享的用户,通常来说更具权威性。类似的,Facebook用户通过他们的好友数量提升地位,特别是当他们的朋友也拥有诸多好友时。
其他特征则不那么明显。在信息流中一个单词出现次数的突然飙71——比如说,地震——可能标志着某一重大事件。如果一条有关常见话题的信息包含不寻常的短语,那么则有可能标志着新的信息或独特见解。辛格尔表示,谷歌会不断检测语言上的改变以及其它预测行为的偏差。
谷歌还尝试将通过智能手机、移动计算机发送的消息内容,或者通过Foursquare公司的广播服务传输的消息与地理数据联系起来。发送信息者的地理位置至关重要。如果你知道某个发布了关于地震的推文的人距震中很近,那么这些推文的价值将高于那些远在天边的人所发出的推文。
辛格尔对实时搜索的看法与谷歌的战略相一致:从混乱数据中提取出在特定时间与某个搜索者最相关的内容。其他搜索服务商,包括谷歌的主要竞争对手微软在内,则持有更加激进的看法。
负责运营加州山景城微软搜索技术中心的西恩·苏克特(Sean Suchter)并不怎么喜欢“实时搜索”这个词,他认为这太局限了。而微软Bing搜索引擎应当不只是过滤来自社交网络的数据,更要拓展它们。
苏克特认为,最终Bing会依靠人们输入的关键字触发一对一会话。他预计实时搜索所带来的全新体验会削弱谷歌长期以来的统治地位。“这无关过去。”苏克特如是说。短暂停顿后,他又补充到:“我们将把他们彻底打败。”
阿米特·辛格尔之前就听过类似的威胁,但迄今为止还没有怎么兑现。但即使他也承认实时搜索的到来几乎标志着与搜索历史中他见过的任何事物“彻底决裂”。让谷歌在“闲谈”时代保持领先可能是辛格尔最艰难的挑战。