关灯
《文稿,还能这样写》作者雄文《笔杆子碎语》作者王一端《机关文稿写作入门》作者杨新宇《机关文字工作五十讲》作者何新国
最新《公文写作培训课程》直播间《公文写作百法例讲》作者房立洲老秘网站长、《老秘笔记》作者老猫《公文高手的自我修养》作者胡森林
开启左侧

人生有许多无耐

[复制链接]
lzqggg 发表于 2015-12-31 11:31:17 | 显示全部楼层 |阅读模式 打印 上一主题 下一主题
 
公文写作培训班
本帖最后由 lzqggg 于 2016-1-3 20:31 编辑 4 D6 Q4 H- K1 h* j# ]2 U& W7 P" [
3 T0 t6 z; S8 y8 a4 y0 q& W+ }
严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);/ U! ^( {5 T# J3 Y- U2 S
  以下三个定义:2 ]( Q* d5 S3 S) `1 ^; U
  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
$ |2 j6 d8 J9 |9 L- j& t# j  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
! g7 P6 S! X* p) D6 {* e  所谓的双方优势策略则是指双方利益总和最大的策略。  
5 B# b3 z, y) s) |1 F4 E" M[编辑本段]严格优势策略举例分析
  s* R- T% T+ V8 o+ Z  一、经典的囚徒困境 ! [% o( s/ Q! p: n6 m
  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: 4 t! D% J2 i+ |- M8 X
  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: " m9 W& b! z: m. K$ N0 X# ~
  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 / ?4 \8 ~2 S2 x
  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
# P5 Z. m5 h1 Z  若二人都互相检举(互相“背叛”),则二人同样判监2年。8 J4 O# l1 X# l$ F. C
  
. {) m4 U6 T) T6 E! o) {  n用表格概述如下:+ Y( }1 |( y  b1 ]. [* V

) s0 a9 B& w. T2 ]3 {$ e( ?8 o    甲沉默(合作)  甲认罪(背叛)  % ?4 f- @3 u: }! l
乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  
; P: X9 b" |. i% f# r乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  
" u% P/ l, y0 A, b- Z4 C% t6 `; |8 Y
  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 % [8 _/ M& I+ M1 G5 b7 c! `
  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
/ a/ l6 |. A, c1 K6 A% v  若对方沉默、背叛会让我获释,所以会选择背叛。
% C+ v& t% }" G6 e( [  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
* C) z1 q+ y/ A3 W0 \- }  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 & i0 Z* n4 y3 D( B  q" g1 b
  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
6 b4 Z2 F" e3 v! o# B  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。9 o. c6 e: K' @( i
[编辑本段]二、智猪博弈理论- u& r/ `0 j; ^  {7 h( m. ?& {5 k8 T
  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
) L( Y3 ?4 X5 [3 z3 {7 i5 M$ R  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
" h; v2 d, I7 S. ?1 W  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
7 N% }+ w+ j$ R' _& J( i1 I  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
( ~2 g4 ]+ Q% v  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 6 {/ i! g6 ?+ C
  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 6 D/ ~4 a/ A0 Q9 l" i/ P
  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
8 l$ {( y/ {# E; ~  , x/ g4 k+ @0 V4 f9 v  ~& x* Q
三、关于企业价格策略6 x, @& g1 J0 Z1 y9 D
8 |* U9 M# ^1 V# L
  # E# F% \$ `) a3 W$ X( p, V
  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
( m& s6 m( S3 j- B1 b  Z6 M. ^  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);$ n( y+ M& n+ s( s
  以下三个定义:; ~# A  e0 t' X
  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 ; K& T, [, m! j9 w
  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
: e, R) X  Q, q2 h! N9 `' D7 ^  所谓的双方优势策略则是指双方利益总和最大的策略。  
1 N% l  F; S! [/ o[编辑本段]严格优势策略举例分析+ T& x; p# R, `4 Q
  一、经典的囚徒困境 ! T) p! T  M  a+ d4 E9 L- M" {
  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
3 J! L$ S% M( V0 d. ]  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: 7 K, u. M0 \6 k( `7 `* E- I
  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 / J; g% k% G+ }
  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
, ]4 ~( `6 T! n" @  k: I6 q  若二人都互相检举(互相“背叛”),则二人同样判监2年。
* T' p2 x7 m  k* Z4 F; K  
( f" o, r. B- N5 b) b( r用表格概述如下:/ F- x9 k% |/ G7 I- D! }
  r4 b; L' f4 \, ?
    甲沉默(合作)  甲认罪(背叛)  
" ]5 s" m6 P9 J乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  
) f% E+ |8 @/ @7 R7 h! h) m7 O乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  
: J. }" x8 s/ I0 |( C4 y  Q
" m" M5 ^  g: }$ o9 @  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 / {  r& |, q! ]' i2 ~
  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
3 D. X8 a) X2 O: g7 y/ K  _  若对方沉默、背叛会让我获释,所以会选择背叛。 4 U& \$ @5 [  n  v0 m
  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
* _6 Z7 X% ^$ w( U5 ^  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
" Y" \) i' y$ Y7 E0 r0 f$ v# ~4 O  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 9 ^* c* U5 i7 \+ m
  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
$ ^: x5 a$ I8 I6 D( w$ V1 f9 r/ T- E[编辑本段]二、智猪博弈理论
( E% j( U# w/ @- x" p! R/ u, {  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 8 T: H+ @( M% w, I$ J8 D7 S' }
  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
! X" ]/ d& c1 R9 z  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 % w# S: V; k) [: A6 y
  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 3 G3 Y2 ]$ z' B3 a
  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
/ d! X! U& _# Y' P3 j+ Y2 `  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 ( }/ N% G/ P, Y" x
  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。6 r$ k! w# }% }2 i% h
  
1 s6 T/ w/ B, l/ b  R6 m5 U三、关于企业价格策略
' l( s3 A" G( t- g# q, H; v# S$ }2 {  V# Q1 g9 }0 N. A
  
8 X8 g8 v; w' ?5 [  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
: E6 u( a2 M/ D- n; {9 ]  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
1 h; T, s4 o6 i: X, d  以下三个定义:, t4 G" M1 G# q; w8 B
  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
% b# K* X7 z5 A( C8 M1 P- G5 @  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 + K5 m5 c( D" f
  所谓的双方优势策略则是指双方利益总和最大的策略。  
9 O) G8 O; u9 ^9 d" S' \/ o[编辑本段]严格优势策略举例分析
" H' V8 l: H! x- [  一、经典的囚徒困境
( P  V; @9 y: i& e% Z- C) p  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: ! T0 |1 V4 P; [/ e) B
  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: ! y7 c2 U: W3 d' q. C1 n
  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 0 X3 G6 |9 d6 T2 u
  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
/ V6 H* p) }9 S  若二人都互相检举(互相“背叛”),则二人同样判监2年。
5 E/ C* e4 \5 S. |- Q  / Z5 W! J' D! v. l6 n8 K5 A0 b
用表格概述如下:4 x0 l. i$ R4 ^3 G$ a
9 s3 {8 _/ R( X2 @. h) t
    甲沉默(合作)  甲认罪(背叛)  5 i. X: R/ |; x% i- F$ t
乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  0 x' d# h# E3 T/ F+ P& h
乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  
0 `6 S8 s; f/ d. R6 o9 L* J0 @
, B% `' U, [2 C; n; x$ D  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
) d) [1 @3 C" I  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: / \9 U3 k$ p; _0 E) y
  若对方沉默、背叛会让我获释,所以会选择背叛。 9 J' V: Y; b! S$ j( q
  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
# h2 M& `- T8 @7 i7 E. D& q+ p  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
9 {0 r8 I; |3 _" g4 S  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
4 z" Q: W6 J' s/ n  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。+ v' z9 q1 [& q  q4 \( j
[编辑本段]二、智猪博弈理论' @+ C( q" b. o/ s4 S# G) @; R
  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
4 ]! n' G* k7 Z! n9 g  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 ! v' n3 `8 M& o+ ~2 e# _
  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 2 D& P) C+ G# o2 V, z/ p
  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 9 G% N" V6 Z. ]4 _4 ]" [1 |5 d: w
  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
1 U& P1 L" _, J% H0 }8 P  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 ) U7 m1 |3 B. X
  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。3 G* q7 x7 |4 ]: i* t
  
. d) U3 K$ P$ ^* d三、关于企业价格策略
# G! U* J8 T5 F! _2 l4 v
2 X7 [: }- N- M- H+ j7 s% z! e    @- i% E5 c. d  k
  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? 4 y1 \% K$ }& c$ J& J3 Q' R4 m
  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);" s: c$ N( r8 }- [9 q/ o7 _8 [$ p
  以下三个定义:9 Z+ n  ]+ w+ ^) z
  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 # W) H; Y! {: ^& W5 U9 x( v
  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
; x1 r/ E: T* x  所谓的双方优势策略则是指双方利益总和最大的策略。  8 e9 [, f* a" v3 c* n% E1 T, |6 S, c) X
[编辑本段]严格优势策略举例分析* f+ j* e/ y" n3 Y1 |
  一、经典的囚徒困境
4 c0 c, j4 c( ?4 }( s  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: 6 x5 M) k1 V0 d& V: p' R% `
  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: 1 J: O4 ^" Y1 k7 W5 M
  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
; g7 l* W$ `/ ]" ], U1 ^  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 8 c* H) L2 ^/ c# _! V7 d
  若二人都互相检举(互相“背叛”),则二人同样判监2年。
( z. g- f  Y5 n* y$ D% b  % C0 P; a$ W: R$ j5 n* W% z: t* @
用表格概述如下:
. p( {1 {  T( l7 h, O+ V) A, w+ q$ a8 |8 f1 Q  Q5 q: s
    甲沉默(合作)  甲认罪(背叛)  ' N, ^! R" Q1 \7 k  r" O0 e+ ]
乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  
" o: {5 C# I3 Y1 e- F乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  
, L1 T  O& x( D% P3 u/ Y4 y8 N5 s) I
  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
7 L2 z+ S7 b2 C4 g+ k  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: ( u! P+ Q7 T# r9 Z9 q
  若对方沉默、背叛会让我获释,所以会选择背叛。 4 w: J+ G" h# h7 z/ g
  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 6 d# \1 c6 g& t( J" J' K
  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 ; _) t2 a& e* B) c) p
  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 - W. y' x( o; U8 n
  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
0 q; C3 U& ~- w" K1 f0 N6 H( q[编辑本段]二、智猪博弈理论  ~* F& m9 {7 O/ J' u5 u
  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
" p9 y" U/ f: `7 q1 W$ n8 W# c  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 ( r5 B& H% n7 ?; `8 N
  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
: A( ?9 u3 v% B  C. T( i5 N; w2 x4 S  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 5 b4 y, s* d* s" r/ b% }% q2 Y+ h# I7 F% w
  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 2 g+ r5 w7 I; x2 J7 n* x6 b
  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
! i, _3 A* _3 P% ~  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
# W# u# C$ g; J( x* N" }  
9 A6 E# b9 N# K2 i1 m三、关于企业价格策略- X9 f- n2 x5 x0 U$ ?2 Z% v- L5 K

5 E% w% Q3 }9 r3 K& `9 m  5 y6 F6 F0 i2 ~1 T) \# `# b
  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? ; v7 }7 Y$ q7 b6 e0 ]7 T% T
  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局
 
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则


0关注

14粉丝

9帖子

排行榜
作者专栏

关注我们:微信订阅号

官方微信公众号

客服个人微信号

全国服务热线:

0595-22880819

公司地址:泉州秘途文化传媒有限公司

运营中心:福建省泉州市

Email:506070961#qq.com

Copyright   ©2015-2025  老秘网 责任编辑:释然Powered by©Discuz!技术支持:秘途文化  备案号   ( 闽ICP备19022590号-1 闽公网安备35050302000919号 )