论文部分内容阅读
英国两个大学的教授模拟了2002年的世界杯,下面我们也学着他们的方法来预测一下本届世界杯的冠军归属。如果你感兴趣,也可以自己找台电脑,按照我们的方法来测算一下。
寻找相关因素
决定一支球队在一场比赛中表现好坏的因素有很多,我们这里暂且使用5项在国际足联网站上可以轻松找到的数据:国际排名、世界杯外围赛成绩、两队历史对阵成绩、每一队伍前往比赛地点的旅程远近、每个队两场比赛之间休息时间的长短。
由于各项因素的重要性并不相同,国际排名以及世界杯外围赛成绩、两队历史对阵成绩更具有决定性,而队伍前往比赛地点的距离远近、比赛之间的休息时间长短则是比较偶然的因素。所以不同因素在“综合实力指数”中所占比重不同。
我们设计各因素所占比重为:
国际排名 45%
世界杯外围赛成绩 20%
两队历史对阵成绩 20%
比赛地点的距离远近 10%
比赛之间的休息时间长短 5%
打分
我们对每一场比赛的两支队伍进行“打分”。
国际排名分:根据国际足联最新排名,目前巴西、西班牙分别以1611,1565分排在第一位、第二位,而朝鲜队则排名106位,在32支球队中垫底。于是,在这一单项中,巴西队得100分,西班牙队为96.51分,而朝鲜队则为0分。
世界杯外围赛成绩分:除南非队是东道主以外,其他备队都参与了各大洲的预选赛,他们在预选赛中的表现也是他们在6月表现的一个“晴雨表”。根据31支球队在预选赛中的胜率,西班牙队以欧洲区小组赛十战全胜的成绩得了100分,这一项里表现较差的有乌拉圭、洪都拉斯、朝鲜等,南非在这一项的得分暂且按照平均的50分计。
前往比赛地点的距离远近分:南非是东道主,显然优势最大,其他非洲国家对于南非的水土会更加适应,也占着半个主场的优势。我们这一项的评分以GoogleEarth上各个国家距离南非的距离为准,距离越远的分数越低。南非为100分,而北美的几个国家如美国、洪都拉斯、墨西哥的分数都很低。
各队比赛之间的休息时间长短分:一个队的两场比赛时间间隔过短,队员会疲惫不堪,影响比赛发挥。一般比赛间隔为3到7天不等,根据赛程表,如果两场比赛仅相隔3天,这一项得分为20分,如果是7天,则可以得100分。
两队历史对阵成绩分:经常有某队是另外一队克星,这一评分由两队在历史对阵中的胜率决定,例如揭幕战南非对阵墨西哥,在以往3次比赛中,墨西哥2胜1负,所以墨西哥得分为6617分,南非队得分为333分。
计算“综合实力指数”
将每队5个单项得分,按照设计的比重,综合起来,便得到一个总分——综合实力指数。这个总分便是计算每一场比赛中两队胜负平概率的关键。在后页的第4步、第5步中,我们以小组赛巴西对西班牙为例来说明。
当然,英国教授使用的模型系统比我们所写的要复杂得多,所考虑的因素不只是这几项,也不只是直接加起来这么简单。另外,对于以上各因素的计算方法和系数的选择,很多球迷一定有不同的意见,“仁者见仁,智者见智”,英国的两个大学就是因为一个系数选择的不同得到截然不同的结果。当然,你也可以挑选其他你认为对比赛有重要影响的因素。事实上,我们也可以先把这套模型拿到前几届世界杯中去“实验”一下,看看准确率是否和实际结果接近,来调整系数和计算方法。
寻找相关因素
决定一支球队在一场比赛中表现好坏的因素有很多,我们这里暂且使用5项在国际足联网站上可以轻松找到的数据:国际排名、世界杯外围赛成绩、两队历史对阵成绩、每一队伍前往比赛地点的旅程远近、每个队两场比赛之间休息时间的长短。
由于各项因素的重要性并不相同,国际排名以及世界杯外围赛成绩、两队历史对阵成绩更具有决定性,而队伍前往比赛地点的距离远近、比赛之间的休息时间长短则是比较偶然的因素。所以不同因素在“综合实力指数”中所占比重不同。
我们设计各因素所占比重为:
国际排名 45%
世界杯外围赛成绩 20%
两队历史对阵成绩 20%
比赛地点的距离远近 10%
比赛之间的休息时间长短 5%
打分
我们对每一场比赛的两支队伍进行“打分”。
国际排名分:根据国际足联最新排名,目前巴西、西班牙分别以1611,1565分排在第一位、第二位,而朝鲜队则排名106位,在32支球队中垫底。于是,在这一单项中,巴西队得100分,西班牙队为96.51分,而朝鲜队则为0分。
世界杯外围赛成绩分:除南非队是东道主以外,其他备队都参与了各大洲的预选赛,他们在预选赛中的表现也是他们在6月表现的一个“晴雨表”。根据31支球队在预选赛中的胜率,西班牙队以欧洲区小组赛十战全胜的成绩得了100分,这一项里表现较差的有乌拉圭、洪都拉斯、朝鲜等,南非在这一项的得分暂且按照平均的50分计。
前往比赛地点的距离远近分:南非是东道主,显然优势最大,其他非洲国家对于南非的水土会更加适应,也占着半个主场的优势。我们这一项的评分以GoogleEarth上各个国家距离南非的距离为准,距离越远的分数越低。南非为100分,而北美的几个国家如美国、洪都拉斯、墨西哥的分数都很低。
各队比赛之间的休息时间长短分:一个队的两场比赛时间间隔过短,队员会疲惫不堪,影响比赛发挥。一般比赛间隔为3到7天不等,根据赛程表,如果两场比赛仅相隔3天,这一项得分为20分,如果是7天,则可以得100分。
两队历史对阵成绩分:经常有某队是另外一队克星,这一评分由两队在历史对阵中的胜率决定,例如揭幕战南非对阵墨西哥,在以往3次比赛中,墨西哥2胜1负,所以墨西哥得分为6617分,南非队得分为333分。
计算“综合实力指数”
将每队5个单项得分,按照设计的比重,综合起来,便得到一个总分——综合实力指数。这个总分便是计算每一场比赛中两队胜负平概率的关键。在后页的第4步、第5步中,我们以小组赛巴西对西班牙为例来说明。
当然,英国教授使用的模型系统比我们所写的要复杂得多,所考虑的因素不只是这几项,也不只是直接加起来这么简单。另外,对于以上各因素的计算方法和系数的选择,很多球迷一定有不同的意见,“仁者见仁,智者见智”,英国的两个大学就是因为一个系数选择的不同得到截然不同的结果。当然,你也可以挑选其他你认为对比赛有重要影响的因素。事实上,我们也可以先把这套模型拿到前几届世界杯中去“实验”一下,看看准确率是否和实际结果接近,来调整系数和计算方法。