论文部分内容阅读
1.嘎啦星的嘎啦猪圈里,住着两只猪。一只大猪,一只小猪。
2.大猪吃得多,跑得快;小猪吃得少,跑得慢。
3.猪圈很长,一头是一块踏板,另一头是饲料出口和食槽。猪每踩一下踏板,饲料出口便会落下定量食物。
4.如果有一只猪去踩动踏板,另一只猪就有机会抢先吃到另一边落下的食物。
5.具体情况有四种:一、小猪踩踏板——当小猪赶到食槽口前,大猪会把食物全部吃完;
6.二、大猪踩踏板——大猪赶到食槽前,可以抢吃到十分之六的食物;
7.三、两只猪同时踩踏板,同时跑向食槽——大猪抢吃到十分之七的食物,小猪抢吃到十分之三的食物;
8.四、两只猪都懒得动,都守在食槽旁——所得食物均为O。
9.对于小猪来说,踩或者不踩,怎样做才是最优策略呢?
“一个和尚挑水喝,两个和尚抬水喝,三个和尚没水喝。”天下没有免费的午餐,不付出劳动怎么会有食物吃呢?所以小猪最好勤快一点,选择“踩动踏板”——和大猪合作,一起踩踏板一起吃食物。这样才公平合理。
你竟然能把大猪和小猪同两个和尚扯上关系,贝卡你看问题的角度真是很特别啊。似乎你说得也挺有道理,不过让我来分析分析看看!小猪的第一种选择是:踩动踏板。这有两种情况:
1.单独踩动踏板——获得食物0!
2.和大猪合作踩动踏板——获得十分之三的食物!
小猪的第二种选择是:在食槽旁等待,坚决不去踩动踏板。这也有两种情况:
1.大猪很饿,不得不踩动踏板——小猪获得十分之四的食物!
2.两猪实行“看谁撑得久政策”,谁也不去踩动踏板——小猪获得食物0!
综合起来看,小猪踩动踏板能够吃到十分之三的食物,不踩动踏板能够吃到十分之四的食物。所以,对于小猪来说,无论大猪是否踩动踏板,小猪的最优策略都是“搭便车”,就是舒舒服服地等待在食槽旁,这就是最好的选择!
现在再来看看大猪。因为小猪有“等待”这个优势策略,大猪只剩下了两个选择:一、等待,吃到食物0;二、踩动踏板,吃到十分之六的食物。所以,“等待”成了大猪的劣势策略。当大猪知道小猪不会去踩动踏板时,自己亲自去踩踏板总比不踩强吧!
这就是博弈论中的著名案例——智猪博弈。
博弈论又被称为对策论,通常指双方在平等的对局中各自利用对方的策略变换自己的对抗策略,达到取胜的目的。就好像两个人在下棋,每人都在找一个最利于自己获胜的方法。
然而,事情不像乔乔分析的那样简单……因为,大猪是一只非常非常懒惰的猪,也是一只绝对不许别人占它一丝便宜的猪!当小猪选择了它的“最优策略”的时候,大猪坚决地实施了“看谁撑得久政策”。可想而知,两只猪在猪圈里饿得奄奄一息,但谁也不愿动动腿踩一下踏板,就怕便宜了另一只猪。一天,猪的主人看着它们,痛心疾首地说:“唉,本来指望把它们养肥了再宰的,结果不知得了什么病,不吃也不喝,还是赶紧拖出去宰了吧!要是翘辫子了就一文不值了!”大猪小猪一听这话,大吃一惊,趁着主人去拿杀猪刀的空档,两猪合作,奋力把猪圈拱破,逃了出去。于是开始了另一段故事……
政策若一人招供但另一人未招,则招供者立即被释放,未招者被判入狱10年;若两人都招供,各判刑8年;若两人都不招供,各判刑1年。
我看这段故事可以命名为:因祸得福,大猪小猪过上了幸福的牢狱生活!
哈哈,这个结局非常叫人意外呀!不过,假设大猪小猪不知道牢里的生活很幸福,就像普通人一样,都想把自己的刑期缩到最短,那么大家都不招供,只坐1年的牢,就是最佳策略!
可是事实又是怎样的呢?我们分析一下。
大猪小猪是分开审讯的,都不知道对方的选择,但根据警方的政策,它们会进行如下考虑:
如果对方不招供,我招供会让我获释,所以我会选择招供;
如果对方招供,我也要招供,这样才能得到较低的刑期,所以我仍然选择招供。
因为大猪小猪面对的情况一样,所以它们会思考出相同的结论——招供才是最佳策略!
这就是博弈论中最著名的案例——囚徒困境,指两个被捕的囚徒之间的一种特殊博弈。
2.大猪吃得多,跑得快;小猪吃得少,跑得慢。
3.猪圈很长,一头是一块踏板,另一头是饲料出口和食槽。猪每踩一下踏板,饲料出口便会落下定量食物。
4.如果有一只猪去踩动踏板,另一只猪就有机会抢先吃到另一边落下的食物。
5.具体情况有四种:一、小猪踩踏板——当小猪赶到食槽口前,大猪会把食物全部吃完;
6.二、大猪踩踏板——大猪赶到食槽前,可以抢吃到十分之六的食物;
7.三、两只猪同时踩踏板,同时跑向食槽——大猪抢吃到十分之七的食物,小猪抢吃到十分之三的食物;
8.四、两只猪都懒得动,都守在食槽旁——所得食物均为O。
9.对于小猪来说,踩或者不踩,怎样做才是最优策略呢?
“一个和尚挑水喝,两个和尚抬水喝,三个和尚没水喝。”天下没有免费的午餐,不付出劳动怎么会有食物吃呢?所以小猪最好勤快一点,选择“踩动踏板”——和大猪合作,一起踩踏板一起吃食物。这样才公平合理。
你竟然能把大猪和小猪同两个和尚扯上关系,贝卡你看问题的角度真是很特别啊。似乎你说得也挺有道理,不过让我来分析分析看看!小猪的第一种选择是:踩动踏板。这有两种情况:
1.单独踩动踏板——获得食物0!
2.和大猪合作踩动踏板——获得十分之三的食物!
小猪的第二种选择是:在食槽旁等待,坚决不去踩动踏板。这也有两种情况:
1.大猪很饿,不得不踩动踏板——小猪获得十分之四的食物!
2.两猪实行“看谁撑得久政策”,谁也不去踩动踏板——小猪获得食物0!
综合起来看,小猪踩动踏板能够吃到十分之三的食物,不踩动踏板能够吃到十分之四的食物。所以,对于小猪来说,无论大猪是否踩动踏板,小猪的最优策略都是“搭便车”,就是舒舒服服地等待在食槽旁,这就是最好的选择!
现在再来看看大猪。因为小猪有“等待”这个优势策略,大猪只剩下了两个选择:一、等待,吃到食物0;二、踩动踏板,吃到十分之六的食物。所以,“等待”成了大猪的劣势策略。当大猪知道小猪不会去踩动踏板时,自己亲自去踩踏板总比不踩强吧!
这就是博弈论中的著名案例——智猪博弈。
博弈论又被称为对策论,通常指双方在平等的对局中各自利用对方的策略变换自己的对抗策略,达到取胜的目的。就好像两个人在下棋,每人都在找一个最利于自己获胜的方法。
然而,事情不像乔乔分析的那样简单……因为,大猪是一只非常非常懒惰的猪,也是一只绝对不许别人占它一丝便宜的猪!当小猪选择了它的“最优策略”的时候,大猪坚决地实施了“看谁撑得久政策”。可想而知,两只猪在猪圈里饿得奄奄一息,但谁也不愿动动腿踩一下踏板,就怕便宜了另一只猪。一天,猪的主人看着它们,痛心疾首地说:“唉,本来指望把它们养肥了再宰的,结果不知得了什么病,不吃也不喝,还是赶紧拖出去宰了吧!要是翘辫子了就一文不值了!”大猪小猪一听这话,大吃一惊,趁着主人去拿杀猪刀的空档,两猪合作,奋力把猪圈拱破,逃了出去。于是开始了另一段故事……
政策若一人招供但另一人未招,则招供者立即被释放,未招者被判入狱10年;若两人都招供,各判刑8年;若两人都不招供,各判刑1年。
我看这段故事可以命名为:因祸得福,大猪小猪过上了幸福的牢狱生活!
哈哈,这个结局非常叫人意外呀!不过,假设大猪小猪不知道牢里的生活很幸福,就像普通人一样,都想把自己的刑期缩到最短,那么大家都不招供,只坐1年的牢,就是最佳策略!
可是事实又是怎样的呢?我们分析一下。
大猪小猪是分开审讯的,都不知道对方的选择,但根据警方的政策,它们会进行如下考虑:
如果对方不招供,我招供会让我获释,所以我会选择招供;
如果对方招供,我也要招供,这样才能得到较低的刑期,所以我仍然选择招供。
因为大猪小猪面对的情况一样,所以它们会思考出相同的结论——招供才是最佳策略!
这就是博弈论中最著名的案例——囚徒困境,指两个被捕的囚徒之间的一种特殊博弈。