中大奖的秘密!彩票的数学知识大数据应用

来源:互联网 / 作者:SKY / 2018-05-11 15:01 / 点击:
2005年2月,美国的一个彩票品种,就出现了漏洞,被麻省理工学院的学生发现了。随后的七年,这个学生反复购买这个品种,一共赚到了300万美元。本文介绍他怎么做的

理论上,只能靠运气。但是,如果规则设计得不好,就可以钻漏洞。

中大奖的秘密!彩票的数学知识

2005年2月,美国的一个彩票品种,就出现了漏洞,被麻省理工学院的学生发现了。随后的七年,这个学生反复购买这个品种,一共赚到了300万美元。

本文介绍他怎么做的,以及其中的数学原理。我依据的材料,主要来自数学教授 Jordan Ellenberg 在斯坦福大学的一次演讲(Youtube)。

一、期望值

彩票最重要的数学概念,叫做"期望值"(expected value),即同一种行为多次重复以后,所能得到的平均收益。

举例来说,如果每次抽奖需要2元,假设200次抽奖可以中奖一次,奖金为300元。那么,你花了2000元,一共抽奖1000次,中奖了5次,奖金为1500元。

也就是说,1000次抽奖的总收益是1500元,每次的平均收益是1.5元,这就是期望值。它的计算公式如下。

期望值 = 300 * (1 / 200) + 0 * (199 / 200) = 1.5 

期望值是1.5元,但是每次抽奖成本2元,于是净亏损0.5元。

一看就知道,这个事情是不划算的,做得越多,越不划算。偶尔买一次彩票,倒也算了;如果你一天到晚不断买彩票,就肯定会亏很多钱(上例是每200次亏100元)。

总之,期望值是衡量彩票收益的一个关键指标。

二、马萨诸塞州的 WinFall 彩票

美国马萨诸塞州有一个彩票品种,叫做 WinFall。它的规则很简单:1到48里面,你猜6个数字,猜中就有奖。

四等奖(6个猜中2个):奖金2元

三等奖(6个猜中3个):奖金5元

二等奖(6个猜中4个):奖金150元

一等奖(6个猜中5个):奖金4000元

特等奖(6个猜中6个):奖金池剩余的全部奖金

有一期,一共卖出了930万张彩票,其中特等奖一个,奖金100万美元,一等奖238个,二等奖11625个,三等奖19.8万个,四等奖136.8万个。

计算可知,这种彩票的期望值是0.798元。

期望值 =  

100万 * ( 1 / 930万) +  

4000 * ( 238 / 930万) +  

150 * (11625 / 930万) +  

5 * (19.8万 / 930万) +  

2 * (136.8万 / 930万 )  

= 0.798 

每张彩票的价格是2元,可是平均收益只有0.798元,连一半都不到,可见这种彩票是非常不划算的。因此没有吸引力,购买这种彩票的民众不断减少。

州政府很着急,因为政府从彩票抽成20%(每张0.4元)。如果销售量减少,政府的收益也会减少。于是,政府为了增加这种彩票的吸引力,决定修改彩票规则。

三、新规则

新的规则是,如果当期没有特等奖(没人猜中6个数字),那么奖金会分配给一等奖、二等奖、三等奖的得主,各奖项新的中奖金额如下。

一等奖(6中5):50000元

二等奖(6中4):2385元

三等奖(6中3):60元

还是使用前面的中奖率,计算期望值。

期望值 = 

50000 * ( 238 / 930万) + 

2385 * (11625 / 930万) + 

60 * (19.8万 / 930万) + 

= 5.53 

每张彩票的价格还是2元,但是期望值变成了5.53元。购买这种彩票就变得非常划算,大量购买的话, 可以得到2.5倍的收益。之所以期望值大于彩票的成本,是因为奖金池还包含前期剩余的奖金。

麻省理工学院的一个学生,发现了这一点。他凑了5000元购买彩票,结果中了将近15000元!

四、如何选择号码?

现在我们知道,新规则的彩票是有利可图的,可以大量购买。但是,还有一个问题,应该怎么选择号码,才能保证收益?也就是说,48个号码里面,你应该选择哪6个号码,才能收益最大化?

毕竟你不能购买所有彩票,因为彩票的收益来自没中奖的那些人。你只能购买一部分彩票,设法使得自己购买的号码有最大的中奖可能。

为了简化思考,让我们考虑一种简单的情况。1到7里面猜三个数字,奖金如下。

猜中3个:奖金6元

猜中2个:奖金2元

猜中1个:无奖金

你可以同时选择七种组合(即购买七张彩票),请问应该如何选择号码?

五、组合数公式

首先,让我们考虑一下,1到7这七个数字里面,三个数字的组合一共有多少种?这在数学里面,叫做组合数公式。

组合数公式是指从 m 个不同元素中,取出 n(n ≤ m)个元素的所有组合的个数,用符号 c(m, n) 表示。

它的计算公式如下。

c(m, n) = m! / n! * (m - n)! 

上面公式中,感叹号表示阶乘,比如4! 等于4 * 3 * 2 * 1 。

按照上面的定义,七个数字里面的三个号码的组合,共有c(7, 3)个。

c(7, 3) = 7! / 3! * (7 - 3)! = 35 

这就是说,三个数字的组合共有 35 种。我们可以把它们全部列出来。

123 124 125 126 127 

134 135 136 137 

145 146 147 

156 157 

167 

234 235 236 237 

245 246 247 

256 257 

267 

345 346 347 

356 357 

367 

456 457 

467 

567 

上面是所有35种可能的组合,你必须从中选出7种。请问应该选择哪七种?

六、最佳组合

答案是下面这七种组合。

123 145 167 247 256 346 357 

阅读延展

1
3