基于人工标注的搜索引擎评估方法与实现

来源 :大连理工大学 | 被引量 : 0次 | 上传用户：ljnbba

【摘要】

：

近十年来,搜索引擎在人们的日常生活中扮演了越来越重要的角色。同时,对搜索引擎的能力也提出了严峻的考验。搜索引擎技术也一直是计算机产业的研究热点,作为一个相对较窄的

【作者】

：

吕舜

【出处】

：

大连理工大学

【发表日期】

：

2013年期

【关键词】

：

搜索引擎评估人工标注 DCG

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

近十年来,搜索引擎在人们的日常生活中扮演了越来越重要的角色。同时,对搜索引擎的能力也提出了严峻的考验。搜索引擎技术也一直是计算机产业的研究热点,作为一个相对较窄的领域,但却引来了无数人的持续研究,时间之长、影响之广泛,在计算机发展史上也是少有的。搜索引擎的好与坏,没有绝对客观的标准。排序算法的评估,出发点和终结点都是人的感知。所以评估是搜索引擎技术的基础性工作,也是核心工作之一。有评测才有鉴别,评判一个搜索引擎的优劣的途径不是开发人员的自评,更不能简单的依靠感觉,而应该是相互可比的评测。因此评价一个搜索引擎质量的优劣是目前的当务之急,也应该是各搜索公司应该予以重点关注的问题。准确的对搜索引擎质量予以评价,可以帮助搜索引擎技术飞速发展,也可以帮助搜索引擎改进算法,最重要的是可以令广大用户得到更好的搜索体验,更容易的找到所求,减少不必要的麻烦。论文采用基于人工标注的方法来实现对搜索引擎的评估工作。通过众包,解决了评估人员少、评估工作量小的难题；通过建立用户组来区分评估能力不同的用户,解决了评估任务与评估员的能力不符的难题；通过建立一套认证体系,让用户领取认证、获得认证,提高用户的评估能力,进而提高评估的准确率、数据的可利用性；通过拼装URL、解析页面、保存页面等,解决了无法保存现场、评估步骤复杂的难题；通过任务管理,令紧急的评估任务先评估,不紧急的任务随时暂停,解决了任务无法灵活调度的难题；通过任务池,展示优先级最高的任务,用户同一时间只可以领取一个任务,长时间则释放任务等,解决了评估任务分发、时间限制等难题；通过插入监控,事先建立好一套已知答案的case,并在评估人员评估时随机插入任务,解决了任务监控不足、监控成本较高、准确率难以计算等难题；通过自动加人,屏蔽已得到正确答案的题目,解决了评估人力浪费、成本无法控制的难题；通过评估数据报表下载,使用方可以得到相关性打分、对比打分等数据,解决了数据难以利用等难题。评估数据可以被用于计算DCG、NDCG、ERR等评估指标,通过数据直接的体现搜索引擎效果的优劣,评估数据还可以用于机器学习、持续评估、抽样调研等。为了证明本系统的有效性,论文展示了评估效果并进行分析,并与使用本系统之前的数据进行对比,证明了论文的方法是高效可行的。

其他文献

大气混合污染物对大鼠肺脏HO-1蛋白变化的影响

随着经济建设和工业化的进展,环境大气中颗粒污染物及多种气体污染物日渐增多。本研究通过制备大气混合污染物动物模型的方法,在病理学及分子水平上,对环境大气中所含颗粒污

学位

HO-1大气混合污染物大鼠肺损伤

甘肃建行信息系统集中监控平台的构建

随着甘肃建行信息化的迅速发展,越来越多的信息系统在全行各个经营领域投入使用,形成了众多应用系统并行的局面。如何保障信息系统的安全运行,直接关系到全行各项业务经营的

学位

信息系统集中监控运维管理

吉林省最低生活保障制度面临的挑战与对策研究

城乡居民最低生活保障制度的建立是完善社会保障体系的关键一环,为维护社会公平正义,化解社会矛盾,调节社会分配,确保困难群众体面地享受改革开放成果,发挥了不可替代的作用

学位

吉林省最低生活保障制度挑战对策

参加合唱团对老年人生理及心理的积极影响

随着中国社会老龄化现象的快速到来,老年人的生活、生理与心理健康等问题逐渐受到社会各界的广泛关注,成为专家、学者研究的热点。对于老年人群的晚年精神生活,国内外都开始

学位

老年人心理特点生理特点

煤电双方煤炭采制化工作规范思考

经过长期发展,我国已成为世界上最大的能源生产国和消费国,煤炭在我国能源体系中占据着重要位置,为推动能源生产和消费革命,能源管理部门应致力于规范煤电双方煤炭采制化工作

期刊

煤炭采制化工作人才队伍制度建设信息监控

兰州市某地铁车站深基坑变形规律数值模拟研究

随着城市经济和建设事业的发展,城市的地面交通的压力越来越大,单一的地面交通已经无法从根本上解决城市交通的拥挤状况,迫切需要大力发展地下快速轨道交通来从根本上解决交

学位

地铁车站深基坑支护湿陷性黄土变形数值模拟优化

长者为本的融入式体验社区护理环境系统设计研究

本研究在理论上将产品设计学与建筑学、护理学相结合，探讨长者为本与融入式体验的理念在社区护理环境系统中的应用。以智能化平台将医疗与护理过程中的环境结合起来，为老年人提

学位

老年人护理需求社区护理环境系统融入式体验

基于人工标注的搜索引擎评估方法与实现

其他学术论文