几个关于赌博的故事(草稿,第二部分)
游戏的关键在于,第一个策略中,押宝更偏向移动到黑色方块上,而第二个策略中,更偏向于移动到白色的方格。这样,相比单独策略,混合策略之下,处在白色方块的宝,下一步有一半的几率执行第二策略,右移动的几率提高,而处在黑色方格的宝,下一步有一半的几率执行第一策略,同样是右移的几率提高。这样,就完成了通过组合两个期望小于1/2的策略,最终得到了大于1/2的方案。
如果概括说,这算是“各取所长,略其所短”。
生活中真的碰得到这么复杂的事情么?答案是,没错。
我们是不是经常会看到这样的现象:平时吃零食,开始吃到的总是大块的薯片或者坚果?而袋子底部都是些细渣。这难道是商家在捣鬼么?大块的零食不是应该因为重力更大的原因,在无数次摇晃之后,掉落在袋底么?实际上是因为:正是小块的零食阻挡了大块零食的下落,在无数次随机碰撞之后,最细碎的统统落在袋子底部,稍大些的在中间,而最大块的零食,因为下落不顺畅,留在了袋子顶部。
这种,通过组合同一个方向的策略,最终却得到反方向结论的,数学上被称为Parrondo Paradox,结构比Simpson paradox更复杂,乍看上去也不一样,但实际的原理很类似。都是一种通过组合,彼此削弱内部的结构,得出了让人惊讶的结论。
(当然,我们也可以用kinetic barrier的语言解释:你可以把五个格子假想成连续的山势,而押的宝像是在山上滚的石头,两个单独的方案,barrier的走势比较凌乱,而输的一侧的势低于赢的一侧,所以更容易输,而组合之后的策略,可以看到整个山势明显的向右倾斜,落在上面的石头,也就更容易像右滚落了。)
Parrondo Paradox最经典的例子,莫过于flashing ratchet。网上有许多生动的说明,这里就不赘述了。
===============
看来“输久未必输”,可是“总赢真能赢”么?(囧,这个默,一点儿都不幽~)
我们举有名的two-envelope problem
如果我给你两个信封,其中一个装的钱数是另一个的两倍,而你只能选择其中的一个,拿走里面装的钱。开始的时候,你随便选择一个信封,还没等拆开,我问你,你想好了么?
你想,如果手里的钱期望为1,另一个信封装的钱有一半的可能只有手里这个的一半,有一半的可能性是手里的两倍,那么期望是0.5*0.5+0.5*2=1.25。额,期望比手里的这个高,所以,如果你没有拆开信封,你的最佳策略是,一定要换信封,对么?
额,不对啊,两个信封不是一样的么?为什么换一次,就能获得更多的钱呢?嗯,的确,我们假设你换了信封,我再问你,你想好了么?你再经过同样的思考步骤,又要换一次,而且永远换下去。
明明是总赢的策略,却并不能真的赢呢?这是因为,只要不拆开信封,两个信封情况完全相同。所以,对称条件下,你无法选出一个装钱更多的策略,所以,拿到钱多的几率,只有1/2,每个信封中钱的期望,其实是0.5*1+0.5*2=1.5。
(接下来是two-evelope problem的变式)
那好,要是你拿到信封,在我还没问那个问题之前,你手快,拆开了信封,看到里面装的钱数,然后你再来决定是否换,这样,你能否拿到更多的钱呢?
比较合理的办法是,你猜测我未必是个富翁,所以很可能手里的钱并不多,更多的情况是,可能出现的钱数是有(一个未知的)上限,一旦你拆开,看到是一个不小的数目,那么另外一个信封装着两倍的钱的可能性很低,你就决定不必换了。如果钱数很小,那么另外一个信封装着两倍的钱的几率仍旧很大,那么你要求换信封。这样做,你有可能拿到更多的钱数。
这样,一个好的策略是:你心里首先想好一个参考值,拿看到的钱数和这个阈值做比较,如果超过,就不必换,如果没有超过,就更换(几率是台阶函数)另外一种则是,换信封的几率,随着第一次看到钱数的增加而降低(几率是指数型单调递减函数,用估计的阈值作指数项中的参数)。
这两种策略,通过计算和模拟,得到更多钱的几率都超过了1/2。
(补充几点说明:
1、虽然初看上去,知道了钱数这个信息没什么用,但正是因为这一步,打破了“两个信封完全相同”的状态,我们才有可能赢更多的钱。
2、估计阈值,并不能(或者无法)借助到其他信息,但即使如此,我们仍然得到了很好的结果。所以,即使是胡猜,有这一步也很关键。
2、拆开信封的游戏中,如果假设我是富翁,即使使用这两个策略,拿到更多钱的几率也只有一半(同原始的问题),因为此时,有限情况下的期望会无限逼近1/2。可以说,富翁赢钱的资本,恰恰是他雄厚的实力。这类似于赌场赢钱的根本原因:如果你想赢,你必须要拿出跟庄家一样的钱数,这是先决条件。以小不能博大,大鱼永远会吃小鱼。)
=========
最后,让我们用一个简单的游戏,结束我们的整篇故事吧。
我们面前有一枚普通的硬币(50/50),如果你抛到正面,我给你两块钱,你可以继续,如果第二次你仍然抛出正面,我给你四块钱...如果第n轮你抛出的是正面,那么我给你2^n块钱,可是一旦你抛出反面,那么游戏结束,我也不会给你钱。
(比如,你连续抛出的是 正 正 反,那么我给你 2 + 4 = 6 块钱,游戏在第三轮结束)
简单的运算,我们知道,每一步,你获得的钱数期望都是1块钱(快想想看~),那么最终的期望,正比于游戏的轮数。由于我们并不硬性设置上限,所以你获得钱数的期望是正无穷。
如果,我收你10万块钱的门票(也就是,你首先给我10万块,然后我们再玩这个游戏)你还会玩么?不要忘了,游戏里,你可能获得的钱数是正无穷。
如果我没猜错,你会拒绝。
那如果这个钱数很少(比如是10块),我猜你会选择玩,是么?
理由一:我这个东家不可能很有钱,你不信在n轮之后,我仍然能掏出这么多钱给你,所以你拒绝。但是百八十块,我很容易有的。所以,你会选择玩。
类似之前的故事,找出一个心理的阈值,能够帮我们决定最后的策略,哪怕找这个阈值完全不依赖其他信息。
理由二:你觉得,你要想在10万块门票的游戏中盈利,需要经过很多步(周期太长,各态不能遍历),而各个结果的落差(方差)也极大,你判断了风险之后,拒绝参加。而10块钱门票,二者都很低,所以你会选择玩。
当然了,是否会玩,不同人有不同的观点,我在这里只是给出了两种可能的答案。而且,想成为富翁,还是要通过辛勤的工作和合理的理财。
所以,最后祝各位生财有道,成为人生的温拿~
如果概括说,这算是“各取所长,略其所短”。
生活中真的碰得到这么复杂的事情么?答案是,没错。
我们是不是经常会看到这样的现象:平时吃零食,开始吃到的总是大块的薯片或者坚果?而袋子底部都是些细渣。这难道是商家在捣鬼么?大块的零食不是应该因为重力更大的原因,在无数次摇晃之后,掉落在袋底么?实际上是因为:正是小块的零食阻挡了大块零食的下落,在无数次随机碰撞之后,最细碎的统统落在袋子底部,稍大些的在中间,而最大块的零食,因为下落不顺畅,留在了袋子顶部。
这种,通过组合同一个方向的策略,最终却得到反方向结论的,数学上被称为Parrondo Paradox,结构比Simpson paradox更复杂,乍看上去也不一样,但实际的原理很类似。都是一种通过组合,彼此削弱内部的结构,得出了让人惊讶的结论。
(当然,我们也可以用kinetic barrier的语言解释:你可以把五个格子假想成连续的山势,而押的宝像是在山上滚的石头,两个单独的方案,barrier的走势比较凌乱,而输的一侧的势低于赢的一侧,所以更容易输,而组合之后的策略,可以看到整个山势明显的向右倾斜,落在上面的石头,也就更容易像右滚落了。)
Parrondo Paradox最经典的例子,莫过于flashing ratchet。网上有许多生动的说明,这里就不赘述了。
===============
看来“输久未必输”,可是“总赢真能赢”么?(囧,这个默,一点儿都不幽~)
我们举有名的two-envelope problem
如果我给你两个信封,其中一个装的钱数是另一个的两倍,而你只能选择其中的一个,拿走里面装的钱。开始的时候,你随便选择一个信封,还没等拆开,我问你,你想好了么?
你想,如果手里的钱期望为1,另一个信封装的钱有一半的可能只有手里这个的一半,有一半的可能性是手里的两倍,那么期望是0.5*0.5+0.5*2=1.25。额,期望比手里的这个高,所以,如果你没有拆开信封,你的最佳策略是,一定要换信封,对么?
额,不对啊,两个信封不是一样的么?为什么换一次,就能获得更多的钱呢?嗯,的确,我们假设你换了信封,我再问你,你想好了么?你再经过同样的思考步骤,又要换一次,而且永远换下去。
明明是总赢的策略,却并不能真的赢呢?这是因为,只要不拆开信封,两个信封情况完全相同。所以,对称条件下,你无法选出一个装钱更多的策略,所以,拿到钱多的几率,只有1/2,每个信封中钱的期望,其实是0.5*1+0.5*2=1.5。
(接下来是two-evelope problem的变式)
那好,要是你拿到信封,在我还没问那个问题之前,你手快,拆开了信封,看到里面装的钱数,然后你再来决定是否换,这样,你能否拿到更多的钱呢?
比较合理的办法是,你猜测我未必是个富翁,所以很可能手里的钱并不多,更多的情况是,可能出现的钱数是有(一个未知的)上限,一旦你拆开,看到是一个不小的数目,那么另外一个信封装着两倍的钱的可能性很低,你就决定不必换了。如果钱数很小,那么另外一个信封装着两倍的钱的几率仍旧很大,那么你要求换信封。这样做,你有可能拿到更多的钱数。
这样,一个好的策略是:你心里首先想好一个参考值,拿看到的钱数和这个阈值做比较,如果超过,就不必换,如果没有超过,就更换(几率是台阶函数)另外一种则是,换信封的几率,随着第一次看到钱数的增加而降低(几率是指数型单调递减函数,用估计的阈值作指数项中的参数)。
这两种策略,通过计算和模拟,得到更多钱的几率都超过了1/2。
(补充几点说明:
1、虽然初看上去,知道了钱数这个信息没什么用,但正是因为这一步,打破了“两个信封完全相同”的状态,我们才有可能赢更多的钱。
2、估计阈值,并不能(或者无法)借助到其他信息,但即使如此,我们仍然得到了很好的结果。所以,即使是胡猜,有这一步也很关键。
2、拆开信封的游戏中,如果假设我是富翁,即使使用这两个策略,拿到更多钱的几率也只有一半(同原始的问题),因为此时,有限情况下的期望会无限逼近1/2。可以说,富翁赢钱的资本,恰恰是他雄厚的实力。这类似于赌场赢钱的根本原因:如果你想赢,你必须要拿出跟庄家一样的钱数,这是先决条件。以小不能博大,大鱼永远会吃小鱼。)
=========
最后,让我们用一个简单的游戏,结束我们的整篇故事吧。
我们面前有一枚普通的硬币(50/50),如果你抛到正面,我给你两块钱,你可以继续,如果第二次你仍然抛出正面,我给你四块钱...如果第n轮你抛出的是正面,那么我给你2^n块钱,可是一旦你抛出反面,那么游戏结束,我也不会给你钱。
(比如,你连续抛出的是 正 正 反,那么我给你 2 + 4 = 6 块钱,游戏在第三轮结束)
简单的运算,我们知道,每一步,你获得的钱数期望都是1块钱(快想想看~),那么最终的期望,正比于游戏的轮数。由于我们并不硬性设置上限,所以你获得钱数的期望是正无穷。
如果,我收你10万块钱的门票(也就是,你首先给我10万块,然后我们再玩这个游戏)你还会玩么?不要忘了,游戏里,你可能获得的钱数是正无穷。
如果我没猜错,你会拒绝。
那如果这个钱数很少(比如是10块),我猜你会选择玩,是么?
理由一:我这个东家不可能很有钱,你不信在n轮之后,我仍然能掏出这么多钱给你,所以你拒绝。但是百八十块,我很容易有的。所以,你会选择玩。
类似之前的故事,找出一个心理的阈值,能够帮我们决定最后的策略,哪怕找这个阈值完全不依赖其他信息。
理由二:你觉得,你要想在10万块门票的游戏中盈利,需要经过很多步(周期太长,各态不能遍历),而各个结果的落差(方差)也极大,你判断了风险之后,拒绝参加。而10块钱门票,二者都很低,所以你会选择玩。
当然了,是否会玩,不同人有不同的观点,我在这里只是给出了两种可能的答案。而且,想成为富翁,还是要通过辛勤的工作和合理的理财。
所以,最后祝各位生财有道,成为人生的温拿~