论文部分内容阅读
摘要:搜索引擎市场目新月异,本文从发展历史、页面设计、检索性能、算法、市场策略等方面介绍了发展多年并呈上升趋势的Ask搜索引擎,希望其成功经验能给中文搜索引擎带来一些启示。
关键词:Ask;搜索引擎;检索性能;自然语言
当前,搜索已成为人们上网的主要目的之一,不少公司都想从庞大的搜索引擎市场中分得一杯羹。Google始终占据着搜索引擎巨头的位置,其他市场被不同的搜索引擎瓜分。本文介绍的Ask搜索在多年的发展中不断创新,以其亲切的界面、便捷的检索、人性化的搜索结果在激烈的竞争中脱颖而出,市场份额逐渐扩大,越来越为人们所关注。
Ask的发展历史
1996年6月,Garrett Gruener和David Wafter在美国加州桑尼维尔(Emeryville)成立了Ask Jeeves公司,并创办了Ask这个日后被业界称为“黑马”的搜索站点。起初,该公司使用英美大众家喻户晓的杰福斯(Jeeves)管家形象作为其搜索引擎的标志和名称,渐渐被人们所熟知。Ask最初为元搜索引擎,而后以目录搜索为主。1998~1999年间转向采用“自然语言搜索”而一举成名。随后,又相继收购并整合了著名搜索引擎DirectHit和Teo-ma,进一步加强了其搜索能力。2005年7月,电子商务航母Inter-ActiveCorp(IAC)公司耗资23亿美元收购了Ask Jeeves。在经历了一系列公司变动之后,Ask.com网站凭借雄厚的资金支持成为最有影响力的搜索引擎之一。著名门户网站LyCOS已经宣布采用Ask,corn作为默认搜索引擎,从而取代了之前的微软搜索引擎。与此同时,Google也成为Ask的赞助列表搜索提供商。分析家指出,目前Ask.com的发展势头很像当初的Cooge,就连运营方式和搜索功能也有模仿Google的痕迹,并且强烈推荐用户尝试一下Ask.com。
功能及特点
作为在搜索领域长期生存的搜索引擎,Ask不断尝试新技术,努力把搜索结果更有效地呈现出来,其市场份额不断增长。
2.1 主页设计
从最初彬彬有礼的“小管家”形象到刚刚推出的新版页面,Ask的主页始终保持清爽漂亮的风格。新版Ask.com首页采用了与其他几个主流搜索引擎截然不同的用户界面(UI),令人倍感亲切。以前“工具箱”中不同类型的垂直搜索现在通过五颜六色的方形圆角图标“按钮”访问,默认分别链接到网页、图像、城市、新闻及博客搜索,更多按钮通过下拉菜单获得。不仅如此,Ask,Com还提供了换肤功能,除了默认风格,附带的森林、日出、花朵等10种皮肤主题能够迎合不同网民的喜好。
2.2 检索功能
Ask支持逻辑检索等常用语法,高级检索界面可以对网址、语言、检索字段、日期等进行限制。除此之外,其最大的特色是采用自然语言搜索,因而不涉及复杂的检索式构造和检索逻辑,但遗憾的是对中文的检索令人失望。Ask同样提供拼写纠错功能。在Ask检索框中输入英文关键词、一句话,甚至可用特殊疑问句或一般疑问句提问,而用特殊问句提问效果较好。事实型、原理型的问题使用Ask搜索较方便,能够得到准确答案。
2.3 检索结果显示
新版Ask.com的搜索结果页面分左、中、右3栏,因而称为“Ask3D”。 Ask.com的产品管理副总裁说:“每个搜索分3个阶段:提出问题、返回结果、点击进入内容。其他搜索引擎将这个过程一步一步完成,Ask.3D将3个过程显示在同一页里,与用户的实际搜索结合更紧密。”Ask3D的搜索结果除网页外还包括图像、视频、新闻、天气及其他资料,并将这些结果分类,只显示与提问相关的结果。
2.3.1 提问优化
新版Ask在搜索结果的左边栏显示扩大或缩小检索,并显示相关检索。搜索Orlando可以缩小为“Orlando Hotels”或扩大为包含DisneyWorld;搜索U2可缩小至“U2lyrics”或“U2 tour”,扩大至包含其他乐队如Rolling Stones。每个问题都有相关问题列表,几乎涵盖了用户可能想搜索的全部问题。另外,用户在检索框输入一个问题时,Ask会显示检索建议。比如,输入“or”时,Ask建议的搜索有“organic chemistry”、“orchilds”、“Oracle”等。
问题优化由Ask的Edison算法产生,由Ask原先采用的两个独立算法组成,即2000年2月获得的DirectHit的用户路径分析和2001年9月获得的Teoma的链接分析。提问优化主要是测试指向关键字的站点,并决定哪些站点在其领域内可被定为专家站点。Edison再用这些网站建立主题集合,分析得出Disney与Orlando相关。当用户点击搜索结果时,更多结果被重新评估,根据用户对检索结果的相关性判断是否需要重新排列次序。
2.3.2 智能搜索
搜索结果页面的中间栏几乎是整个页面的一半宽,顶部是“智能回答”的结果,紧接着排列的是网页结果。右边栏显示垂直搜索结果。
智能搜索也是Ask的一大特色,结果包括有根据的事实、垂直搜索结果以及专家或合作伙伴提供的准确数据,Ask网站将这三者结合起来显示。有根据的事实指的是结果包含有可能来源于百科全书、字典或权威大众的信息资料。垂直搜索结果即针对一个问题返回不同类型的结果,由被称为Morph的算法决定,它被描述为“智能回答算法的大变身”。图片、新闻或视频检索的单独算法决定每种结果类型的排序,据此,Morph算法决定应对U2乐队搜索返回音乐和事件结果,或应为Orlando搜索返回地图和天气。显示在右边的许多结果来自IAC拥有的其他产品如Cityseareh、Ticketmaster或iIAke,其他来自合作伙伴如InfoUSA、blinkx等。Ask挑选合作伙伴的标准是其内容及资源具有权威性,无论从广度还是深度来说内容都要全面,有充足的数据可以进行加工。Ask要求合作伙伴尽可能创建最好的用户体验,包括清洁的用户接口、信息的稳定性和及时性,而且要和Ask公司一起进行创新搜索特点的研发,并提供与用户搜索有关的内容。
2.3.3 网页搜索
Ask基于这种社区理念设计其搜索排名系统,衡量网页的相关性和权威性。
Ask认为网络由社区组成,因此社区内的网页或网站是相互关联的,同时社区之间也可能存在某些关系。较之于一个虽然拥有大量链接,但不一定全部出自同一社区 的网页或网站,Ask搜索认为拥有大量来自同一社区的链接的网页或网站要比前者更有价值。举例而言,如果一家求职网站的链接大多来自其他与求职相关的网站,那么它在求职社区内将拥有更多权威。反之,如果该网站的链接主要来自非求职网站(如购物、宠物),那么它绝对不会成为该领域的权威,这种结构进一步推动了网络的蝴蝶结理论。按照蝴蝶结理论,大量权威站点有一个中心,大量导出和导入站点从这个中心向两翼延伸。Ask认为,互联网上存在很多蝴蝶结形式的网络社区,每个社区由众多内容相关的网站构成,同时社区之间由某些相关的或权威的网站联系起来。基于这种理论,一个网站有必要成为相关社区内的一员。为此,网站必须从该社区内部获得大量链接。因此,不论社区成员之间互相建立导入链接还是导出链接,都将帮助他们树立在Ask搜索引擎中的权威地位。
综上所述,假如搜索摇滚乐队U2,输入“U2”之后,Ask.com在结果页面的左边栏显示扩大、缩小检索及相关检索。中间栏顶端显示“智能回答”的结果,即一些有关U2乐队的介绍。下面接着是两个推荐链接,然后是经过组织的网页搜索结果,每个结果有标题、摘要、网址等标引项目,并提供缓存(cache)功能。鼠标在每条记录前的“双筒望远镜”标志上停留几秒钟,会出现网页的缩略图以方便用户预览。Ask已经为此功能申请了专利。另外,鼠标停留在一条网页记录上时,该记录的标题背景显示为粉色,同时出现“十”号小标识,提示用户可以将记录保存在“MyStuff”个人账户中。右边栏是视频或图像结果,鼠标停留在图片上会产生放大效果。还有连接到iLike的MP3文件及AskCity的事件列表等。又如,搜索“Orlando”(奥兰多)时会在中间栏顶端显示通过智能回答得到的城市地图及城市导航,右边栏是图像、新闻图片、维基页面、天气和事件等结果。
据说,Ask.com已经利用美国消费者满意度指数预测方法测试了其搜索结果的满意度等级。旧版Ask.com得分为71,而Microsoft和AOL为74分,Yahoo为76分,Google为81分。经过某些改进之后,Ask目前已将分数提高到82,而负责人声称这还是在右栏使用Morph算法之前。
2.4 其他特色功能及产品
Ask除提供MyStuff个性化服务外,还允许用户定义页面,比如确定所在地、过滤搜索结果等。Ask,COITI专门为儿童设计了可利用自然语言检索的界面“Ask for kids”,并采用分类目录的方式引导儿童使用各种工具书。此外,AskMobile GPS产品允许用户用手机登陆Ask.com的wap网站,利用手机全球数据定位系统实现基于精确逐圈(turn-by-turn)导航定位系统的搜索,这个服务可以免费使用2周。
结语
由于Ask采用独树一帜的自然语言搜索,因而对用户提问的限制很少,并能针对普通问题直接返回答案,在图像、地图检索的相关性方面甚至超过Google。笔者使用后完全被它与众不同的风格所吸引。有个玩笑说,在使用Google之后都不记得是怎么查找资料的了,而Ask的出现给了用户一个尝试其他搜索引擎的理由。图书馆员是信息的搜集、整理者,知识的提供者,理应不断尝试并掌握新的检索工具。国外图书馆员强烈推荐Ask.com,并总结了一些应使用Ask而非Google的理由,比如广告较少、直接提供白页搜索等。
Ask声称并不想取代Google,其市场策略分为三步:第一步是为用户而创新;第二步是以“另一个搜索引擎”而知名;第三步是给已用Ask.com的人们一个一见到这个品牌就兴奋的理由。第一步和第三步通过新特点和新设计正在实现,第二步已经启动,公司已经投入大量资金广泛宣传。此外。Ask期望不仅在业内树立口碑,而且通过在不懂技术的大众中间引发讨论来获得关注,挖掘潜在客户,Ask希望成为除Coogle之外的用户首选产品。按照这样的发展势头,谁敢说Ask不会成为下一个Google呢?
除Ask之外,Coogle、Yahoo和Live搜索都致力于所谓的多元搜索,可见多元搜索是搜索引擎今后发展的方向之一,而这需要更强大的技术来支撑。中文搜索引擎发展迅速,但仍需改进和完善,顺应潮流,加大研发力度,推陈出新,为中文网络信息的组织、检索、利用做出贡献。
关键词:Ask;搜索引擎;检索性能;自然语言
当前,搜索已成为人们上网的主要目的之一,不少公司都想从庞大的搜索引擎市场中分得一杯羹。Google始终占据着搜索引擎巨头的位置,其他市场被不同的搜索引擎瓜分。本文介绍的Ask搜索在多年的发展中不断创新,以其亲切的界面、便捷的检索、人性化的搜索结果在激烈的竞争中脱颖而出,市场份额逐渐扩大,越来越为人们所关注。
Ask的发展历史
1996年6月,Garrett Gruener和David Wafter在美国加州桑尼维尔(Emeryville)成立了Ask Jeeves公司,并创办了Ask这个日后被业界称为“黑马”的搜索站点。起初,该公司使用英美大众家喻户晓的杰福斯(Jeeves)管家形象作为其搜索引擎的标志和名称,渐渐被人们所熟知。Ask最初为元搜索引擎,而后以目录搜索为主。1998~1999年间转向采用“自然语言搜索”而一举成名。随后,又相继收购并整合了著名搜索引擎DirectHit和Teo-ma,进一步加强了其搜索能力。2005年7月,电子商务航母Inter-ActiveCorp(IAC)公司耗资23亿美元收购了Ask Jeeves。在经历了一系列公司变动之后,Ask.com网站凭借雄厚的资金支持成为最有影响力的搜索引擎之一。著名门户网站LyCOS已经宣布采用Ask,corn作为默认搜索引擎,从而取代了之前的微软搜索引擎。与此同时,Google也成为Ask的赞助列表搜索提供商。分析家指出,目前Ask.com的发展势头很像当初的Cooge,就连运营方式和搜索功能也有模仿Google的痕迹,并且强烈推荐用户尝试一下Ask.com。
功能及特点
作为在搜索领域长期生存的搜索引擎,Ask不断尝试新技术,努力把搜索结果更有效地呈现出来,其市场份额不断增长。
2.1 主页设计
从最初彬彬有礼的“小管家”形象到刚刚推出的新版页面,Ask的主页始终保持清爽漂亮的风格。新版Ask.com首页采用了与其他几个主流搜索引擎截然不同的用户界面(UI),令人倍感亲切。以前“工具箱”中不同类型的垂直搜索现在通过五颜六色的方形圆角图标“按钮”访问,默认分别链接到网页、图像、城市、新闻及博客搜索,更多按钮通过下拉菜单获得。不仅如此,Ask,Com还提供了换肤功能,除了默认风格,附带的森林、日出、花朵等10种皮肤主题能够迎合不同网民的喜好。
2.2 检索功能
Ask支持逻辑检索等常用语法,高级检索界面可以对网址、语言、检索字段、日期等进行限制。除此之外,其最大的特色是采用自然语言搜索,因而不涉及复杂的检索式构造和检索逻辑,但遗憾的是对中文的检索令人失望。Ask同样提供拼写纠错功能。在Ask检索框中输入英文关键词、一句话,甚至可用特殊疑问句或一般疑问句提问,而用特殊问句提问效果较好。事实型、原理型的问题使用Ask搜索较方便,能够得到准确答案。
2.3 检索结果显示
新版Ask.com的搜索结果页面分左、中、右3栏,因而称为“Ask3D”。 Ask.com的产品管理副总裁说:“每个搜索分3个阶段:提出问题、返回结果、点击进入内容。其他搜索引擎将这个过程一步一步完成,Ask.3D将3个过程显示在同一页里,与用户的实际搜索结合更紧密。”Ask3D的搜索结果除网页外还包括图像、视频、新闻、天气及其他资料,并将这些结果分类,只显示与提问相关的结果。
2.3.1 提问优化
新版Ask在搜索结果的左边栏显示扩大或缩小检索,并显示相关检索。搜索Orlando可以缩小为“Orlando Hotels”或扩大为包含DisneyWorld;搜索U2可缩小至“U2lyrics”或“U2 tour”,扩大至包含其他乐队如Rolling Stones。每个问题都有相关问题列表,几乎涵盖了用户可能想搜索的全部问题。另外,用户在检索框输入一个问题时,Ask会显示检索建议。比如,输入“or”时,Ask建议的搜索有“organic chemistry”、“orchilds”、“Oracle”等。
问题优化由Ask的Edison算法产生,由Ask原先采用的两个独立算法组成,即2000年2月获得的DirectHit的用户路径分析和2001年9月获得的Teoma的链接分析。提问优化主要是测试指向关键字的站点,并决定哪些站点在其领域内可被定为专家站点。Edison再用这些网站建立主题集合,分析得出Disney与Orlando相关。当用户点击搜索结果时,更多结果被重新评估,根据用户对检索结果的相关性判断是否需要重新排列次序。
2.3.2 智能搜索
搜索结果页面的中间栏几乎是整个页面的一半宽,顶部是“智能回答”的结果,紧接着排列的是网页结果。右边栏显示垂直搜索结果。
智能搜索也是Ask的一大特色,结果包括有根据的事实、垂直搜索结果以及专家或合作伙伴提供的准确数据,Ask网站将这三者结合起来显示。有根据的事实指的是结果包含有可能来源于百科全书、字典或权威大众的信息资料。垂直搜索结果即针对一个问题返回不同类型的结果,由被称为Morph的算法决定,它被描述为“智能回答算法的大变身”。图片、新闻或视频检索的单独算法决定每种结果类型的排序,据此,Morph算法决定应对U2乐队搜索返回音乐和事件结果,或应为Orlando搜索返回地图和天气。显示在右边的许多结果来自IAC拥有的其他产品如Cityseareh、Ticketmaster或iIAke,其他来自合作伙伴如InfoUSA、blinkx等。Ask挑选合作伙伴的标准是其内容及资源具有权威性,无论从广度还是深度来说内容都要全面,有充足的数据可以进行加工。Ask要求合作伙伴尽可能创建最好的用户体验,包括清洁的用户接口、信息的稳定性和及时性,而且要和Ask公司一起进行创新搜索特点的研发,并提供与用户搜索有关的内容。
2.3.3 网页搜索
Ask基于这种社区理念设计其搜索排名系统,衡量网页的相关性和权威性。
Ask认为网络由社区组成,因此社区内的网页或网站是相互关联的,同时社区之间也可能存在某些关系。较之于一个虽然拥有大量链接,但不一定全部出自同一社区 的网页或网站,Ask搜索认为拥有大量来自同一社区的链接的网页或网站要比前者更有价值。举例而言,如果一家求职网站的链接大多来自其他与求职相关的网站,那么它在求职社区内将拥有更多权威。反之,如果该网站的链接主要来自非求职网站(如购物、宠物),那么它绝对不会成为该领域的权威,这种结构进一步推动了网络的蝴蝶结理论。按照蝴蝶结理论,大量权威站点有一个中心,大量导出和导入站点从这个中心向两翼延伸。Ask认为,互联网上存在很多蝴蝶结形式的网络社区,每个社区由众多内容相关的网站构成,同时社区之间由某些相关的或权威的网站联系起来。基于这种理论,一个网站有必要成为相关社区内的一员。为此,网站必须从该社区内部获得大量链接。因此,不论社区成员之间互相建立导入链接还是导出链接,都将帮助他们树立在Ask搜索引擎中的权威地位。
综上所述,假如搜索摇滚乐队U2,输入“U2”之后,Ask.com在结果页面的左边栏显示扩大、缩小检索及相关检索。中间栏顶端显示“智能回答”的结果,即一些有关U2乐队的介绍。下面接着是两个推荐链接,然后是经过组织的网页搜索结果,每个结果有标题、摘要、网址等标引项目,并提供缓存(cache)功能。鼠标在每条记录前的“双筒望远镜”标志上停留几秒钟,会出现网页的缩略图以方便用户预览。Ask已经为此功能申请了专利。另外,鼠标停留在一条网页记录上时,该记录的标题背景显示为粉色,同时出现“十”号小标识,提示用户可以将记录保存在“MyStuff”个人账户中。右边栏是视频或图像结果,鼠标停留在图片上会产生放大效果。还有连接到iLike的MP3文件及AskCity的事件列表等。又如,搜索“Orlando”(奥兰多)时会在中间栏顶端显示通过智能回答得到的城市地图及城市导航,右边栏是图像、新闻图片、维基页面、天气和事件等结果。
据说,Ask.com已经利用美国消费者满意度指数预测方法测试了其搜索结果的满意度等级。旧版Ask.com得分为71,而Microsoft和AOL为74分,Yahoo为76分,Google为81分。经过某些改进之后,Ask目前已将分数提高到82,而负责人声称这还是在右栏使用Morph算法之前。
2.4 其他特色功能及产品
Ask除提供MyStuff个性化服务外,还允许用户定义页面,比如确定所在地、过滤搜索结果等。Ask,COITI专门为儿童设计了可利用自然语言检索的界面“Ask for kids”,并采用分类目录的方式引导儿童使用各种工具书。此外,AskMobile GPS产品允许用户用手机登陆Ask.com的wap网站,利用手机全球数据定位系统实现基于精确逐圈(turn-by-turn)导航定位系统的搜索,这个服务可以免费使用2周。
结语
由于Ask采用独树一帜的自然语言搜索,因而对用户提问的限制很少,并能针对普通问题直接返回答案,在图像、地图检索的相关性方面甚至超过Google。笔者使用后完全被它与众不同的风格所吸引。有个玩笑说,在使用Google之后都不记得是怎么查找资料的了,而Ask的出现给了用户一个尝试其他搜索引擎的理由。图书馆员是信息的搜集、整理者,知识的提供者,理应不断尝试并掌握新的检索工具。国外图书馆员强烈推荐Ask.com,并总结了一些应使用Ask而非Google的理由,比如广告较少、直接提供白页搜索等。
Ask声称并不想取代Google,其市场策略分为三步:第一步是为用户而创新;第二步是以“另一个搜索引擎”而知名;第三步是给已用Ask.com的人们一个一见到这个品牌就兴奋的理由。第一步和第三步通过新特点和新设计正在实现,第二步已经启动,公司已经投入大量资金广泛宣传。此外。Ask期望不仅在业内树立口碑,而且通过在不懂技术的大众中间引发讨论来获得关注,挖掘潜在客户,Ask希望成为除Coogle之外的用户首选产品。按照这样的发展势头,谁敢说Ask不会成为下一个Google呢?
除Ask之外,Coogle、Yahoo和Live搜索都致力于所谓的多元搜索,可见多元搜索是搜索引擎今后发展的方向之一,而这需要更强大的技术来支撑。中文搜索引擎发展迅速,但仍需改进和完善,顺应潮流,加大研发力度,推陈出新,为中文网络信息的组织、检索、利用做出贡献。