论文部分内容阅读
搜索引擎评价是推动搜索引擎发展的关键性技术。评价搜索引擎有多种方法。本文在搜索引擎评测法Cranfield范式评价法的框架上,根据搜索引擎相关性六级评分和DCG方法,对目前阿拉伯国家搜索引擎市场占有率较大的两个搜索引擎Google和Yahoo的阿拉伯语搜索效果进行评测。搜索引擎评价的相关研究多是以满足普通搜索用户的信息需求作为目的的,但由于搜索用户对搜索引擎的满意程度很难被定量地表示,所以目前全世界对搜索引擎的评价通常从搜索引擎的结果质量(Effectiveness)、搜索引擎的效率(Efficiency)和界面(Interface)这三个方面来进行,以此来尽可能将用户对搜索引擎的满意度来量化,从而发现搜索引擎系统中存在的主要问题和缺陷以便解决它们来优化搜索引擎的性能。鉴于每个方面的评测方法、评测过程都非一篇硕士论文所能驾驭,因此本文以搜索引擎的结果质量这一较为基础且核心的点为切入点,对Google和Yahoo的阿拉伯语搜索效果进行评测。对一个互联网产品的性能评测不能割裂地来写,因此本文以Google和Yahoo在阿拉伯国家搜索引擎市场所取得的成就起始并对阿拉伯国家目前本土主要搜索引擎概况做一简述。通过第一章,可以了解到Google和Yahoo搜索引擎在阿拉伯国家受众之广、产品之多。那么,两大搜索引擎在阿拉伯国家所占市场份额是否与其搜索引擎的搜索效果相匹配,为了了解这一点,更好地了解这两大搜索引擎的搜索结果质量究竟如何,第二章和第三章为具体评测部分。由于评测方法比较复杂,所以需要对搜索引擎工作的一些基本原理、本文使用的搜索引擎的评测方法和原理、以及文中所涉及到的其他相关理论知识进行阐述,本文第二章即为相关理论及方法的阐释。第三章为根据第二章所述评测方法对Google和Yahoo阿拉伯语搜索结果质量维度上进行的具体评测和数据分析。通过评测可以发现,Google的阿拉伯语搜索效果比Yahoo好。但是,两者在结果质量相关性上的差距并没有我们之前想象中的那么大。甚至在为数不少的结果中,Yahoo的表现要比Google好。Google和Yahoo在阿拉伯语搜索结果质量上都有可以改进之处。Yahoo主要在低质页面的识别、网站权威度、时效性、页面内容丰富度、无效资源识别上不如Google,而Google虽然在这几方面表现得比Yahoo好,但也不能杜绝这几种情况。Google的主要问题在于过度将部分网站的排名排在前三位结果中,一定程度上影响了用户满意度。通过对Google和Yahoo阿拉伯语搜索结果质量的评测,可以看到Google和Yahoo的阿拉伯语搜索引擎技术还有较大的优化和发展空间。因此,本文最后一章承接前一章这一结论,阐述了阿拉伯语搜索引擎市场的巨大潜力,并对评测过程中发现的阿拉伯网站的特点做一简单总结,希望能够对经常浏览阿拉伯语网页、获取阿拉伯语信息的人士有所助益。