图说天下社会百态

统计也能玩花样 01(詹大师)_飞机的准点率真的那么高吗?

统计也能玩花样 01(詹大师)

飞机的准点率真的那么高吗?

随着生活水平的提高,大家越来越多的接触到"飞机"这个交通工具。不过,随着乘坐飞机的人数增加,大家越来越吐槽两个问题:

飞机准点(起飞)率

飞机准点(到达)率

这两个问题一直是被吐槽的重灾区,在2017年的两会上,关于航班准点率提高,代表建议优化空域管理。可见航空延误问题已经被提到非常重要的层面。

统计也能玩花样 01(詹大师)_飞机的准点率真的那么高吗?

相对而言,飞机准点(到达)率更被关注,能够"准时到达"比能够"准时起飞"更重要。经过一系列的改善之后,2017年下半年以来,航班准点(到达)率似乎有了明显的提高。这个业绩的产生,和各地机场以及各大航空公司做出的努力是密不可分的。不过,统计学在里面也起到了非常重要的作用。所谓"统计也能玩花样",指的就是利用统计学的方法来实现自己的目的。

在介绍具体的方法之前,我们来介绍一些统计分析的基本概念。

统计也能玩花样 01(詹大师)_飞机的准点率真的那么高吗?

上面是长江三峡的图片。长江三峡能够抵抗万年一遇的洪水,这句话靠谱吗?"万年一遇"的洪水是不是收集了一万年的洪水数据,找出一个最大的数据,是这样来考察的吗?中华文明满打满算才五千年…

当然不是这样啦,通常的处理方法是,收集有水文记载以来的长江三峡段的洪水数据(这些数据不会太多,几百个数据而已),针对这些数据,通过软件寻找一个最合适统计分布来拟合。换句话说,这个最合适的分布应该和这些数据的"贴合度"最高。

找到这样一个最合适的统计分布之后,开始计算分位数,什么叫分位数?可以把统计分布的(概率密度)图形想象成一个"蛋糕",然后我们拿一把刀来分这个"蛋糕"。在某个位置切下去之后,"蛋糕"分为左右两部分。如果左面的部分占总面积的比例是95%,那么这个位置就是0.95的分位数。

统计也能玩花样 01(詹大师)_飞机的准点率真的那么高吗?

比如上图,是一个已知的正态分布(平均值为0,标准差为1)的概率密度分布图形。在1.645这个位置一刀切下去,左侧(红色)部分占整个分布面积的95%,因此。1.645就是这个分布的0.95分位数。

分位数的另一种含义是,如果数据是服从这个分布的,从这个分布中随机抽样,大约有95%的数据比1.645小。

啰啰嗦嗦说了那么多,那么,这个"分位数"有什么用呢?我们来看一个案例。

某公司要求班车到达公司时间为8:00,然而经常发生班车迟到的情况。经过一段时间的数据收集,采用软件拟合分布之后,发现班车从起始站点开车时间与到达公司时间服从正态分布,均值为60分钟,标准差为7.5分钟,如果要求能够保证99%的概率在8:00之前到达公司,那么,班车起始的发车时间应该设定为?

统计也能玩花样 01(詹大师)_飞机的准点率真的那么高吗?

这个问题需要用到分位数的概念。首先,统计学上没有真正意义上的100%,因此,如果要求100%的概率在8:00之前到达公司,那么回复应该是"在公司造个宿舍吧……"。

现在要求99%的概率,也就是寻找0.99的分位数。通过软件计算,可以得到这个正态分布(平均值60分钟,标准差7.5分钟)的0.99

分位数是77.45分钟。如下图所示:

统计也能玩花样 01(詹大师)_飞机的准点率真的那么高吗?

换句话说,从8:00向前反推77.45分钟,这个时间就是合适的发车时间。但是,77.45分钟这个数据很不"和谐",一般实际遇到这样的情况,都是近似的说,提前80分钟发车,也就是6:40发车(想一想,为什么)。

好了,我们看过这个案例之后,对分位数概念就非常清楚了。下一步,飞机准点率的问题也迎刃而解了。不过,需要注意的是,关于飞机延误的计算方法又多了个花样。下面是百度得到的航班延误的概念。

"航班延误是指航班降落时间(航班实际到港时间)比计划降落时间(航班时刻表上的时间)延迟15分钟以上或航班取消的情况。"

比如,"上海—武汉"的某个航班,查询得到的航班准点率是93%,好高啊!!!

但是,空姐播报的实际飞行时间是90分钟,但是在航班时间上写的是9:25-11:40(135分钟)……,11:40是计划降落时间。然而,只有在11:55之后降落或取消航班的情况才算延误……

大家回想之前的案例,然后回答以下问题:

135分钟是怎么算出来的呢……

多出来的45分钟是做什么的呢……

网站上显示的航班准点率93%能保证吗……

为什么现在提前到达的情况那么多……

综上所述,我们只能呵呵了,%&$%¥%~#

特别说明1:分位数的概念非常有用,也可以用于汽车的售后分析,详见我的"售后可靠性统计分析"的文章。

特别说明2:其实,飞机航班时间的数据量非常大,如果需要计算的分位数不是特别接近1,那么可以用非参数方法。比如,我们有1000个数据,要评估0.99的分位数。那么可以将1000个数据从小到大排列,0.99的分位数介于990个数据和991个数据之间即可。

统计的花样,是不是很有意思啊!

统计也能玩花样 01(詹大师)_飞机的准点率真的那么高吗?

统计也能玩花样 01(詹大师)_飞机的准点率真的那么高吗?

内容简介

统计也能玩花样 01(詹大师)

浏览:0次