点球大战算不算进球数(2018世界杯小组赛谁将出线历届世界)
温馨提示:这篇文章已超过851天没有更新,请注意相关的内容是否还可用!
这是一篇老文章了,我对数据做了重新处理,文章结构上去掉了趋势性的分析结果,只留下32强进攻/防守能力和小组赛的进球概率部分。
本文数据为自1930年世界杯开办以来至2014年的所有球队进球数据,中间因为一战停办了几届,所以到2014年恰好20届。
以下是本文的主要结论:
20届世界杯总进球2500个,巴西贡献了近1/10,总进球前十名贡献了一半;
巴西进攻能力最强,英格兰防守最强
预测了本届世界杯小组赛出线阵容
有几个问题需要解释一下:
1、因为年代久远,好多国家已经改了名字,比如苏联、西德,考虑到俄罗斯和苏联国家实力的不对等,我并没有把他们合并成一个国家。过去的就让他过去吧。
2、世界杯决赛是没有平局的,最终比分我用了点球大战的分数,毕竟点球也是实力。
3、1938年后到1950年,因为二战,世界杯连续12年停办。愿世界不再有战争。
下面是正文
概念解释
进球数:
球队在该局比赛中的最终得分,包含点球和加时。
失球数:
球队对手在该局比赛中的最终得分,包含点球和加时赛。
进攻能力:
进球越多,说明进攻能力越强。把历届比赛所有球队每场的进球数平均值作为基准能力,某球队平均进球数/所有球队的平均进球数的比例越大,说明该球队相对于所有球队的平均进攻能力越强。
防守能力:
失球越多,说明防守能力越弱。把历届比赛所有球队每场的进球数平均值作为基准能力,某球队平均失球数/所有球队的平均失球数的比例越大,说明该球队相对于所有球队的平均防守能力越弱。
20届进球2500粒,巴西占了1/10
统计胜负双方总进球数,1930-2014年内,累计进球2500粒(包括点球大战),其中巴西进球232粒,接近总数的1/10,进球前十的国家总进球1222粒,占到总数的近一半。
巴西虽然进球最多,但是失球同样是最多的,毕竟几乎每届他都能踢到最后。
与进球相对的,球队对手的进球数即为该球队的失球数,统计一下失球数TOP10的球队,巴西依然之一,但是相对于其他球队,失球数的悬殊没有进球数那么大了。总体看来巴西的防守还是强一点的。
本届32强进攻和防守能力
既然有历届的进球数据,不考虑国家 *** 变动、球员身体素质等因素,我们可以通过数据计算,得到各球队的进攻能力和防守能力。
20届世界杯,共有86支球队踢了836场,累计进球2500个,平均每场每个球队进球1.5个(2500/836/2=1.495)。
再根据86个球队在每次比赛中的表现,可以计算每个球队的平均进球情况。根据前面的进攻/防守能力概念,我们可以得到各个球队的进攻/防守能力。
这么多年世界杯下来,一共有86支球队,全部分析太麻烦了,我们只分析2018年世界杯进入小组赛的32支球队好了。冰岛和巴拿马今年之一次进世界杯,往届没有数据,我给了他们平均数(1.5)。
进攻能力的前五名基本上没有争议,我一个不看球的人都认识他们。但是排在第六名的丹麦,为啥这么强呢?
回溯源数据我发现,丹麦在1986年小组赛中6-1战胜了乌拉圭,2002年2-0战胜了法国,这两个国家都是蛮强的,因为乌拉圭世界杯进小组赛比较多,1930年首届世界杯4-2虐阿根廷,1950年2-2平西班牙,2-1虐巴西,1954年4-2虐英格兰,直到2014年还分别以2-1、1-0的战绩干过英格兰和意大利。
毕竟只是数据,一战成名这种事情太容易左右排名。
防守能力的榜单似乎有点扯,我也不懂球,不知道对不对。回溯源数据,可发现。塞尔维亚就2010年进了一次世界杯,踢了三场球,输了两场(澳大利亚2-1,加纳1-0),然后赢了德国(1-0),本身平均失球数就低,还防住了德国,实力一下子就上去了。克罗地亚我不认识,但是看历届的比分还是很硬的,赢8场进了18个球,对手只进了5个;输了的8场中对手一共进了12个球,防的可是巴西、阿根廷、法国!
本届小组赛各球队胜率及比分预测
数学里有一个泊松分布,这个模型可以根据对战双方球队的平均能力,计算两个球队对战结果的概率。
我们先来看一下这个泊松分布的概念。
>泊松分布
先举个例子:
假设你在公交站等车,虽然站牌上写着公交车平均5分钟一班,但你如果在公交站等上5分钟,你有可能等来1辆、也有可能等来3辆,当然如果运气不好,1辆公交都没等来也是常事。
这里来1辆还是3辆还是0辆的概率是符合某种分布规律的,它就是泊松分布。根据这个分布,一旦我们知道了平均多久来一辆车,就可以算出来1辆、3辆和0辆的概率是怎么样的。
它有一个计算公式,你可以百度到,我就不展示出来了,怕你们读了头疼。
使用泊松分布,我们得知道一个平均值。对于比赛来说,如果我们想计算A、B两个球队对战的比分概率分布,我们需要知道这场比赛两个球队平均分别能进几个球,才能计算出他们比分的概率。
前面我们计算了球队的进攻能力和防守能力,我们用A的进攻能力×B的防守能力×平均进球数,就可以得到A球队在这场比赛的平均进球数。同样B的进攻能力×A的防守能力×平均进球数则为B的进球数。
有了这两个平均水平,我们就可以得到32强的49场比赛的各种比分出现的概率。
另外,这种世界级比赛进球数都在0-4之间,超过4个球的很少。
所里我只列出了小组赛中进0-4个球的概率,计算结果是这样的:
表中,我把各个球队得分更大的概率标出了颜色,由此预测了各场比赛的最终战局。
文章图片若不清晰,可后台回复 “世界杯” ,查看源数据及结果表格。
由于本文分析对象为历届世界杯的比分数据,时间跨度超过80年,所以肯定有很多不准确的地方。如果想要了解各球队近期的比分情况,可以点击,查看由城南寻梦采集并分析近10年各球队比赛数据的预测结果。
我是喜哥
一个热衷于分享黑科技和野路子的数据玩家
如果你也喜欢,可以来我的知识星球