本帖最后由 lzqggg 于 2016-1-3 20:31 编辑 4 D6 Q4 H- K1 h* j# ]2 U& W7 P" [
3 T0 t6 z; S8 y8 a4 y0 q& W+ }
严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);/ U! ^( {5 T# J3 Y- U2 S
以下三个定义:2 ]( Q* d5 S3 S) `1 ^; U
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
$ |2 j6 d8 J9 |9 L- j& t# j 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
! g7 P6 S! X* p) D6 {* e 所谓的双方优势策略则是指双方利益总和最大的策略。
5 B# b3 z, y) s) |1 F4 E" M[编辑本段]严格优势策略举例分析
s* R- T% T+ V8 o+ Z 一、经典的囚徒困境 ! [% o( s/ Q! p: n6 m
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: 4 t! D% J2 i+ |- M8 X
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: " m9 W& b! z: m. K$ N0 X# ~
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 / ?4 \8 ~2 S2 x
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
# P5 Z. m5 h1 Z 若二人都互相检举(互相“背叛”),则二人同样判监2年。8 J4 O# l1 X# l$ F. C
. {) m4 U6 T) T6 E! o) { n用表格概述如下:+ Y( }1 |( y b1 ]. [* V
) s0 a9 B& w. T2 ]3 {$ e( ?8 o 甲沉默(合作) 甲认罪(背叛) % ?4 f- @3 u: }! l
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
; P: X9 b" |. i% f# r乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
" u% P/ l, y0 A, b- Z4 C% t6 `; |8 Y
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 % [8 _/ M& I+ M1 G5 b7 c! `
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
/ a/ l6 |. A, c1 K6 A% v 若对方沉默、背叛会让我获释,所以会选择背叛。
% C+ v& t% }" G6 e( [ 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
* C) z1 q+ y/ A3 W0 \- } 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 & i0 Z* n4 y3 D( B q" g1 b
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
6 b4 Z2 F" e3 v! o# B 在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。9 o. c6 e: K' @( i
[编辑本段]二、智猪博弈理论- u& r/ `0 j; ^ {7 h( m. ?& {5 k8 T
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
) L( Y3 ?4 X5 [3 z3 {7 i5 M$ R 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
" h; v2 d, I7 S. ?1 W 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
7 N% }+ w+ j$ R' _& J( i1 I 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
( ~2 g4 ]+ Q% v “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 6 {/ i! g6 ?+ C
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 6 D/ ~4 a/ A0 Q9 l" i/ P
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
8 l$ {( y/ {# E; ~ , x/ g4 k+ @0 V4 f9 v ~& x* Q
三、关于企业价格策略6 x, @& g1 J0 Z1 y9 D
8 |* U9 M# ^1 V# L
# E# F% \$ `) a3 W$ X( p, V
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
( m& s6 m( S3 j- B1 b Z6 M. ^ 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);$ n( y+ M& n+ s( s
以下三个定义:; ~# A e0 t' X
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 ; K& T, [, m! j9 w
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
: e, R) X Q, q2 h! N9 `' D7 ^ 所谓的双方优势策略则是指双方利益总和最大的策略。
1 N% l F; S! [/ o[编辑本段]严格优势策略举例分析+ T& x; p# R, `4 Q
一、经典的囚徒困境 ! T) p! T M a+ d4 E9 L- M" {
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
3 J! L$ S% M( V0 d. ] 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: 7 K, u. M0 \6 k( `7 `* E- I
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 / J; g% k% G+ }
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
, ]4 ~( `6 T! n" @ k: I6 q 若二人都互相检举(互相“背叛”),则二人同样判监2年。
* T' p2 x7 m k* Z4 F; K
( f" o, r. B- N5 b) b( r用表格概述如下:/ F- x9 k% |/ G7 I- D! }
r4 b; L' f4 \, ?
甲沉默(合作) 甲认罪(背叛)
" ]5 s" m6 P9 J乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
) f% E+ |8 @/ @7 R7 h! h) m7 O乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
: J. }" x8 s/ I0 |( C4 y Q
" m" M5 ^ g: }$ o9 @ 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 / { r& |, q! ]' i2 ~
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
3 D. X8 a) X2 O: g7 y/ K _ 若对方沉默、背叛会让我获释,所以会选择背叛。 4 U& \$ @5 [ n v0 m
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
* _6 Z7 X% ^$ w( U5 ^ 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
" Y" \) i' y$ Y7 E0 r0 f$ v# ~4 O 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 9 ^* c* U5 i7 \+ m
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
$ ^: x5 a$ I8 I6 D( w$ V1 f9 r/ T- E[编辑本段]二、智猪博弈理论
( E% j( U# w/ @- x" p! R/ u, { 智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 8 T: H+ @( M% w, I$ J8 D7 S' }
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
! X" ]/ d& c1 R9 z 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 % w# S: V; k) [: A6 y
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 3 G3 Y2 ]$ z' B3 a
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
/ d! X! U& _# Y' P3 j+ Y2 ` 利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 ( }/ N% G/ P, Y" x
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。6 r$ k! w# }% }2 i% h
1 s6 T/ w/ B, l/ b R6 m5 U三、关于企业价格策略
' l( s3 A" G( t- g# q, H; v# S$ }2 { V# Q1 g9 }0 N. A
8 X8 g8 v; w' ?5 [ 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
: E6 u( a2 M/ D- n; {9 ] 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
1 h; T, s4 o6 i: X, d 以下三个定义:, t4 G" M1 G# q; w8 B
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
% b# K* X7 z5 A( C8 M1 P- G5 @ 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 + K5 m5 c( D" f
所谓的双方优势策略则是指双方利益总和最大的策略。
9 O) G8 O; u9 ^9 d" S' \/ o[编辑本段]严格优势策略举例分析
" H' V8 l: H! x- [ 一、经典的囚徒困境
( P V; @9 y: i& e% Z- C) p 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: ! T0 |1 V4 P; [/ e) B
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: ! y7 c2 U: W3 d' q. C1 n
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 0 X3 G6 |9 d6 T2 u
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
/ V6 H* p) }9 S 若二人都互相检举(互相“背叛”),则二人同样判监2年。
5 E/ C* e4 \5 S. |- Q / Z5 W! J' D! v. l6 n8 K5 A0 b
用表格概述如下:4 x0 l. i$ R4 ^3 G$ a
9 s3 {8 _/ R( X2 @. h) t
甲沉默(合作) 甲认罪(背叛) 5 i. X: R/ |; x% i- F$ t
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年 0 x' d# h# E3 T/ F+ P& h
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
0 `6 S8 s; f/ d. R6 o9 L* J0 @
, B% `' U, [2 C; n; x$ D 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
) d) [1 @3 C" I 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: / \9 U3 k$ p; _0 E) y
若对方沉默、背叛会让我获释,所以会选择背叛。 9 J' V: Y; b! S$ j( q
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
# h2 M& `- T8 @7 i7 E. D& q+ p 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
9 {0 r8 I; |3 _" g4 S 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
4 z" Q: W6 J' s/ n 在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。+ v' z9 q1 [& q q4 \( j
[编辑本段]二、智猪博弈理论' @+ C( q" b. o/ s4 S# G) @; R
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
4 ]! n' G* k7 Z! n9 g 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 ! v' n3 `8 M& o+ ~2 e# _
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 2 D& P) C+ G# o2 V, z/ p
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 9 G% N" V6 Z. ]4 _4 ]" [1 |5 d: w
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
1 U& P1 L" _, J% H0 }8 P 利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 ) U7 m1 |3 B. X
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。3 G* q7 x7 |4 ]: i* t
. d) U3 K$ P$ ^* d三、关于企业价格策略
# G! U* J8 T5 F! _2 l4 v
2 X7 [: }- N- M- H+ j7 s% z! e @- i% E5 c. d k
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? 4 y1 \% K$ }& c$ J& J3 Q' R4 m
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);" s: c$ N( r8 }- [9 q/ o7 _8 [$ p
以下三个定义:9 Z+ n ]+ w+ ^) z
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 # W) H; Y! {: ^& W5 U9 x( v
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
; x1 r/ E: T* x 所谓的双方优势策略则是指双方利益总和最大的策略。 8 e9 [, f* a" v3 c* n% E1 T, |6 S, c) X
[编辑本段]严格优势策略举例分析* f+ j* e/ y" n3 Y1 |
一、经典的囚徒困境
4 c0 c, j4 c( ?4 }( s 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: 6 x5 M) k1 V0 d& V: p' R% `
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: 1 J: O4 ^" Y1 k7 W5 M
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
; g7 l* W$ `/ ]" ], U1 ^ 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 8 c* H) L2 ^/ c# _! V7 d
若二人都互相检举(互相“背叛”),则二人同样判监2年。
( z. g- f Y5 n* y$ D% b % C0 P; a$ W: R$ j5 n* W% z: t* @
用表格概述如下:
. p( {1 { T( l7 h, O+ V) A, w+ q$ a8 |8 f1 Q Q5 q: s
甲沉默(合作) 甲认罪(背叛) ' N, ^! R" Q1 \7 k r" O0 e+ ]
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
" o: {5 C# I3 Y1 e- F乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
, L1 T O& x( D% P3 u/ Y4 y8 N5 s) I
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
7 L2 z+ S7 b2 C4 g+ k 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: ( u! P+ Q7 T# r9 Z9 q
若对方沉默、背叛会让我获释,所以会选择背叛。 4 w: J+ G" h# h7 z/ g
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 6 d# \1 c6 g& t( J" J' K
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 ; _) t2 a& e* B) c) p
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 - W. y' x( o; U8 n
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
0 q; C3 U& ~- w" K1 f0 N6 H( q[编辑本段]二、智猪博弈理论 ~* F& m9 {7 O/ J' u5 u
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
" p9 y" U/ f: `7 q1 W$ n8 W# c 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 ( r5 B& H% n7 ?; `8 N
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
: A( ?9 u3 v% B C. T( i5 N; w2 x4 S 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 5 b4 y, s* d* s" r/ b% }% q2 Y+ h# I7 F% w
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 2 g+ r5 w7 I; x2 J7 n* x6 b
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
! i, _3 A* _3 P% ~ 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
# W# u# C$ g; J( x* N" }
9 A6 E# b9 N# K2 i1 m三、关于企业价格策略- X9 f- n2 x5 x0 U$ ?2 Z% v- L5 K
5 E% w% Q3 }9 r3 K& `9 m 5 y6 F6 F0 i2 ~1 T) \# `# b
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? ; v7 }7 Y$ q7 b6 e0 ]7 T% T
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局 |