论文部分内容阅读
摘要:该文结合目前互联网搜索引擎的应用情况,首先确定了搜索引擎主要的评价指标。并对如何确定各指标权重进行了研究,建立了权重分配子模型,为评分标准制定依据。利用多目标决策理论建立搜索引擎性能的综合评价数学模型,然后使用建立的模型举例计算百度、搜狗、搜搜、爱问、谷歌五个常用搜索引擎的的得分。该文的模型主要是基于多目标决策理论以及多元回归和层次分析。
关键词:搜索引擎;权重;模型
中图分类号:TP393 文献标识码:A 文章编号:1009-3044(2013)14-0014-02
随着互联网的快速发展,人们已经离不开从互联网上获取信息。但是这些信息浩如烟海,同事又夹杂着大量的有害信息。搜索引擎技术就是完美利用这些资源的有效手段。搜索引擎可以说是一个网站,这些网站通过网络搜索软件( 也称网络搜索机器人) 或网站登录等方式,将互联网上大量网站收集到本地,经过一定的处理后放入自己的资料库。用户对其进行各种查询,搜索引擎给出响应,提供用户所需的信息。有调查显示,搜索是继电子邮件之后的第二大互联网应用。 因此,建立搜索引擎综合评价体系,完整、客观地对搜索引擎进行综合评价,具有较大的社会意义和研究前景。而针对这个问题目前已经有很多学者做出一些卓有成效的研究,统计了大量数据,运用了大量分析研究方法,信息技术的逐渐发展,客观有效地评价搜索引擎,得出有意义排名,并且设计个性化搜索引擎,对于提高工作效率,实现时间价值最大化,具有重要意义。
为了确定搜索引擎的性能,我们要根据搜索引擎和用户之间的相互关系,以第三方身份确定评价搜索引擎性能优劣的关键因素,通过建立权重子模型,确定每个环节的权重大小。再进一步实际试验,统计数据,采用多目标决策法,统计搜索引擎的最终得分,进行排名。
1 模型假设
1)假设所参与评价的搜索引擎性能稳定,服务器无故障,且短时间内不会升级,状态保持。
2)假设模型衡量的因素就是参与评价的关键因素, 其他变量设为无关变量,它们的变化不影响评价最后评价结果的准确度。
3)假设网络速度的状况的变化与不影响结果。
4)假设参与评价的因素之间相互独立。
2 符号说明
2 模型建立与求解
2.1 对现有的搜索引擎进行分析
在对互联网搜索引擎的优劣进行评价时,所建立的数学模型中涉及许多决策变量。这些变量有繁多、结构复杂、不确定性等特点。为了解决这一问题,我们有必要对描述目标的相对重要度做出正确的估价。而各因素的重要程度是不一样的,为了反映因素的重要程度,需要对各因素相对重要性进行估测(即权数),由各因素权数组成的集合就是权重集。权重是指标本身的物理属性的客观反映,是主客观综合量度的结果。
系统工程理论中的层次分析法(Analytic Hierarchy Process,简称AHP)是一种较好的权重确定方法。它是把复杂问题中的各因素划分成相关联的有序层次,使之条理化的多目标、多准则的决策方法,是一种定量分析与定性分析相结合的有效方法。而本模型将使用层次分析法对问题的决策变量确定其权重。给出问题的层次结构模型:
搜索引擎b;准确性b1、安全性b2、完整性b3;非歧义b11、去重复b12、优先度b13、无毒b21、社会影响b22、内容原创b31、更新频率b32。
下面阐述AHP确定权重的基本过程。
根据以上分数可求出前五名的搜索引擎排序为:谷歌、搜狗、搜搜、爱问、百度。
4 结束语
本文使用层次分析法比较全面的研究了关于搜索引擎的评价问题,利用多目标决策理论建立搜索引擎性能的综合评价数学模型,得出最终评分。但各大搜索引擎都在迅速发展,各自的搜索引擎的性能也在进一步提升,这些都会影响到本文所确定的评价指标的适用性。并且层次分析法存在其天然的缺点,比如其定量数据较少,定性成分多。所以,如何建立一个合理的评价模型仍需进一步研究。
参考文献:
[1] 刘正春. 搜索引擎综合评价模型研究[J]. 数学的实践与认识, 2004,34(9).
[2] 徐俊, 刘娜. 层次分析法的基本思想与实际应用[J]. 情报探索, 2008(12).
[3] 郭金玉, 张忠彬, 孙庆云. 层次分析法在安全科学研究中的应用[J]. 中国安全生产科学技术, 2008(2).
关键词:搜索引擎;权重;模型
中图分类号:TP393 文献标识码:A 文章编号:1009-3044(2013)14-0014-02
随着互联网的快速发展,人们已经离不开从互联网上获取信息。但是这些信息浩如烟海,同事又夹杂着大量的有害信息。搜索引擎技术就是完美利用这些资源的有效手段。搜索引擎可以说是一个网站,这些网站通过网络搜索软件( 也称网络搜索机器人) 或网站登录等方式,将互联网上大量网站收集到本地,经过一定的处理后放入自己的资料库。用户对其进行各种查询,搜索引擎给出响应,提供用户所需的信息。有调查显示,搜索是继电子邮件之后的第二大互联网应用。 因此,建立搜索引擎综合评价体系,完整、客观地对搜索引擎进行综合评价,具有较大的社会意义和研究前景。而针对这个问题目前已经有很多学者做出一些卓有成效的研究,统计了大量数据,运用了大量分析研究方法,信息技术的逐渐发展,客观有效地评价搜索引擎,得出有意义排名,并且设计个性化搜索引擎,对于提高工作效率,实现时间价值最大化,具有重要意义。
为了确定搜索引擎的性能,我们要根据搜索引擎和用户之间的相互关系,以第三方身份确定评价搜索引擎性能优劣的关键因素,通过建立权重子模型,确定每个环节的权重大小。再进一步实际试验,统计数据,采用多目标决策法,统计搜索引擎的最终得分,进行排名。
1 模型假设
1)假设所参与评价的搜索引擎性能稳定,服务器无故障,且短时间内不会升级,状态保持。
2)假设模型衡量的因素就是参与评价的关键因素, 其他变量设为无关变量,它们的变化不影响评价最后评价结果的准确度。
3)假设网络速度的状况的变化与不影响结果。
4)假设参与评价的因素之间相互独立。
2 符号说明
2 模型建立与求解
2.1 对现有的搜索引擎进行分析
在对互联网搜索引擎的优劣进行评价时,所建立的数学模型中涉及许多决策变量。这些变量有繁多、结构复杂、不确定性等特点。为了解决这一问题,我们有必要对描述目标的相对重要度做出正确的估价。而各因素的重要程度是不一样的,为了反映因素的重要程度,需要对各因素相对重要性进行估测(即权数),由各因素权数组成的集合就是权重集。权重是指标本身的物理属性的客观反映,是主客观综合量度的结果。
系统工程理论中的层次分析法(Analytic Hierarchy Process,简称AHP)是一种较好的权重确定方法。它是把复杂问题中的各因素划分成相关联的有序层次,使之条理化的多目标、多准则的决策方法,是一种定量分析与定性分析相结合的有效方法。而本模型将使用层次分析法对问题的决策变量确定其权重。给出问题的层次结构模型:
搜索引擎b;准确性b1、安全性b2、完整性b3;非歧义b11、去重复b12、优先度b13、无毒b21、社会影响b22、内容原创b31、更新频率b32。
下面阐述AHP确定权重的基本过程。
根据以上分数可求出前五名的搜索引擎排序为:谷歌、搜狗、搜搜、爱问、百度。
4 结束语
本文使用层次分析法比较全面的研究了关于搜索引擎的评价问题,利用多目标决策理论建立搜索引擎性能的综合评价数学模型,得出最终评分。但各大搜索引擎都在迅速发展,各自的搜索引擎的性能也在进一步提升,这些都会影响到本文所确定的评价指标的适用性。并且层次分析法存在其天然的缺点,比如其定量数据较少,定性成分多。所以,如何建立一个合理的评价模型仍需进一步研究。
参考文献:
[1] 刘正春. 搜索引擎综合评价模型研究[J]. 数学的实践与认识, 2004,34(9).
[2] 徐俊, 刘娜. 层次分析法的基本思想与实际应用[J]. 情报探索, 2008(12).
[3] 郭金玉, 张忠彬, 孙庆云. 层次分析法在安全科学研究中的应用[J]. 中国安全生产科学技术, 2008(2).