首页 > 技术文章 > 博弈论基础读书笔记二 纳什定理

halaya 2020-02-03 10:28 原文

1.2一个例子和纳什定理

1.2.a古诺的双头垄断模型

令分别表述企业1、2生产同质产品的产量,市场中该产品的总供给 ,令表示 市场出清是的价格。设企业 生产 的总成本 ,即企业不存在固定成本,且生产没单位产品的边际成本为常数c,这里我们假定c<a。根据古诺的假定,两个企业同时进行产量决策。

在这个问题中,我们可以看到参与者 可选择的策略为自己的产量 则我们可以求得收益函数:

                                          

根据上一节,对于一个标准式两人博弈标准式。一对战略 如果是纳什均衡,则对于每个参与者 应满足:

                                            

我们将问题转化位如下优化问题的解:

                                              

也就是将本问题转化为下面式子的解:

                                   

这就是一个简单的二次函数,而且对于 和 (即两个参与者所选择的策略)来说,他们这个式子中的地位是相同的,也就是说存在纳什均衡的时候,两者的解相同,这里先假设其解 。

则对于这个纳什均衡,我们可以列出如下方程组:

                                                       

解之得:

                                                        

 

 

满足

至此,我们已经求出纳什均衡,但是我们会发现一个和囚徒困境类似的问题,即纳什均衡不能让参与者双方同时得到最大收益。如果我们假设这个市场有只有一个企业进行垄断,那这个时候对于这个企业要获得最大的利润,则需要其垄断产量为 ,

再将这个情况放在两个企业的情况下,也就是说,当两个企业的生产量均为 的时候,两者同时会获得最大利润,但这个时候却无法得到纳什均衡(因为双方都有动机偏离它)。这也揭示了一个朴素的道理:互相信任的合作比竞争的效率高。

1.2. b混合战略

根据我们之前的定义,在纳什均衡中,满足如下关系:

根据定义,下图所示的猜硬币博弈是不存在纳什均衡的

                            参与人2

                参与人1

正面

背面

正面

-1,1

1,-1

背面

1,-1

-1,1

在这个博弈中,参与者1、2分别同时将硬币选择正面或者反面放于桌上,若两个硬币的正反相同,则参与人1胜利,否则则参与人2胜利。

在这个博弈中是不存在纳什均衡的,因为没有一个符合纳什均衡的战略组合。故而在此博弈当中,两个人都在互相猜测对方的想法,并且对于单次博弈是不存在最优策略的。

所以在这里我们引入混合战略的概念,来解释一个参与者对于其他参与者行为的不确定性。

进行规范的表述,混合策略是在其战略空间Si中(一些或者全部)战略的概率分布,简单来说就是这个参与者所有行为的可能性的集合。

此后我们称Si中的战略为参与者i的纯战略。

例如在猜硬币博弈中,参与者 的混合战略为概率分布(q,1-q)他出正面的概率为q,出背面的概率为1-q。

下面给出定义:

混合策略:

一个参与人的混合策略是在参与人的(纯)策略上的概率分布.

1.2.c纳什均衡的存在性

我们先对纳什均衡的定义进行扩展,加入混合策略的情况,我们只需求每一参与者的混合战略是其他参与者混合战略的最优反应。由于所有纯战略都可以写为混合战略,所以这个定义包含了之前的定义。

而对于扩展后的纳什均衡,我们有如下结论,(证明过程略过,有兴趣自己查)一对混合战略(P1*,P2*)要成为纳什均衡 必须满足

                                    u1 (P1*,P2* )≥u1 (P1,P2*)

对 中战略所有可能的概率分布 都成立,并且 满足:

                                    u2 (P1*,P2* )≥u2 (P2,P1*)

对 中战略所有可能的概率分布 都成立

我们来举个例子:

以猜硬币博弈为例,下面证明在加入了混合战略后的纳什均衡在这个博弈中是存在的。

假设参与者1的策略为(q1,1-q1)参与者2的策略为(q2,1-q2)

若q2>1/2则参与者1全为正面时为最优策略

若q2<1/2则参与者1全为背面时为最优策略

当q2=1/2时,参与者1不管以任何策略,得到的期望都相同

之后我们将情况翻转,要是存在参与者1的策略q1,对于参与者2,q2=1/2时任何策略所得到的期望小于等于当时的期望,这里易证q1=1/2,则(1/2, 1/2)为纳什均衡

这个很容易证明,这里不再阐述。

到这里我们相当于证明了一个小孩子都懂的现象:“猜拳的时候剪刀、石头、布出的概率均为1/3是最优策略。”

最后,我们讨论在更一般的情况,纳什均衡存在于任意有限战略空间的博弈。

一个混合策略组合 (p1*, p2*), 其中
                  p1*=(p11*, p12*, ..., p1J* )
                  p2*=(p21*, p22*, ..., p2K*
)
是一个混合策略纳什均衡,当且仅当
v1(p1*, p2*) ³ EU1(s1j, p2*), for j = 1, 2, ..., J
v2(p1*, p2*)
³ EU2(s2k, p1*), for k= 1, 2, ..., K

推荐阅读