Skip to content

管理经济学(第四版)

第九章 博弈论与企业竞争策略 (Chapter 9: Game Theory and Business Competitive Strategy)


9-1 📖 理解博弈论的基本概念与分类 (Understand Basic Concepts and Classifications of Game Theory)

社会人的假定 (Assumption of Social Man)

  • 超越经济人:博弈论涉及人与人之间的互动,不能简单假设人为追求物质利益最大化的“经济人”或“理性机械人”。
  • 社会人特征:人是“社会人”和“组织人”,除物质利益外,还追求安全、情感、尊重等高层次需求。人的行为受社会文化环境影响,需考虑他人和社会公共利益。
  • 核心:社会人追求共赢前提下的自利合作基础上的竞争。“利己”与“利他”需要协调统一。
  • 博弈假定:参与者都是社会人,并且同样聪明,能进行理性、客观的逻辑推理和换位思考。

合作博弈与非合作博弈 (Cooperative vs. Non-cooperative Games)

  • 合作博弈:参与方能通过谈判达成具有约束力且可执行的合同。
  • 非合作博弈:无法形成有约束力的协议,或协议无法有效执行。本书重点讨论非合作博弈

非合作博弈的分类 (Classification of Non-cooperative Games)

  • 博弈四要素
    1. 博弈方 (Player):决策者。
    2. 策略 (Strategy):行动方案。
    3. 决策 (Action):采取的行动。
    4. 得益 (Payoff):最终收益。
  • 主要分类
    1. 同时博弈 (Simultaneous Game / Static Game):各方同时决策,或在不知晓对方决策的情况下做决策。
    2. 序列博弈 (Sequential Game / Dynamic Game):各方依先后次序行动,后行动者可以观察到先行动者的决策。
    3. 一次性博弈 (One-Shot Game):博弈只进行一次。
    4. 重复博弈 (Repeated Game):博弈反复进行多次。有限次重复(知道终点)和无限次重复(不知终点)策略不同。
    5. 完全信息博弈 (Complete Information Game):所有参与方都了解彼此的特征、策略空间和得益(理论概念)。
    6. 不完全信息博弈 (Incomplete Information Game):参与方对其他博弈方的信息了解不完全或不准确(现实中常见)。
    7. 两人博弈 vs. 多人博弈

9-2 📖 掌握三种基本博弈策略 (Master Three Basic Game Strategies)

纳什均衡 (Nash Equilibrium)

  • 核心概念:一种稳定状态,其中每个参与者在给定其他参与者策略的情况下,都选择了对自己最有利的策略,因此没有任何一方愿意单方面改变其策略。

上策策略 (Dominant Strategy)

  • 定义:无论对手选择何种策略,某参与者的某个特定策略始终是其最优选择
  • 上策均衡:当所有参与者都拥有上策,并且都选择上策时达到的均衡状态。
  • 特点:上策均衡一定是纳什均衡,但纳什均衡不一定是上策均衡。决策简单,无需过多考虑对手。
  • 局限:并非所有博弈都有上策,可能只有一方有,也可能双方都没有。

最小得益最大化策略 (Maximin Strategy)

  • 定义:一种保守的策略。决策者首先考虑每种策略下可能出现的最坏结果(最小得益),然后选择那个最坏结果相对最好(最大化最小得益)的策略。
  • 应用场景:当决策者非常规避风险,或不确定对手是否理性时采用。
  • 特点:旨在避免最坏的结果,而非追求最好的结果,通常不是纳什均衡。

混合策略 (Mixed Strategy)

  • 定义:参与者不选择单一的确定性行动(纯策略),而是以一定的概率随机地选择不同的行动策略。
  • 目的:使自己的行为不可预测,让对手无规律可循,无法针对性地利用。
  • 均衡:当随机概率的选择使得对手采取任何策略的期望得益都相同时,达到混合策略纳什均衡。
  • 应用:适用于没有纯策略纳什均衡的博弈(如保安与小偷的博弈、石头剪刀布)。

囚徒困境 (Prisoner's Dilemma)

  • 经典模型:两个嫌疑人分开审讯,面临坦白或抗拒的选择。
  • 困境:对个体而言,无论对方如何选择,“坦白”都是上策。但双方都选择坦白(上策均衡/纳什均衡)的结果,却比双方都选择“抗拒”(合作)的结果要
  • 启示:个体理性(追求自身利益最大化)可能导致集体非理性(损害共同利益)。强调了信任、沟通与合作的重要性。若能从对方利益考虑,可能实现双赢。

9-3 📖 分析一次性同时博弈 (Analyze One-Shot Simultaneous Games)

上策决策

  • 如果博弈中存在上策,理性的参与者会优先选择上策。
  • 例如:在寡头产量博弈中,如果按古诺模型决策(产量 10)无论对手如何选择都优于按卡特尔模型决策(产量 7.5),则选择古诺产量是上策。

剔除下策 (Elimination of Dominated Strategies)

  • 下策 (Dominated Strategy):无论对手选择何种策略,某参与者的某个特定策略总是劣于(或最多等于)其另一个策略。
  • 剔除原则:理性的参与者不会选择下策(或弱下策)。
  • 连续剔除下策:通过反复识别并剔除各方的下策,逐步简化博弈矩阵,最终可能找到唯一的纳什均衡解。

寻找纳什均衡的简捷法(画箭头法)

  • 在得益矩阵中:
    • 比较上下相邻单元格逗号前的数字(行参与者的得益),画箭头指向较大值。
    • 比较左右相邻单元格逗号后的数字(列参与者的得益),画箭头指向较大值。
  • 纳什均衡点:所有箭头都指向内部的那个单元格。

无上策博弈

  • 当博弈双方都没有上策时,可能存在多个纯策略纳什均衡。
  • 解决方法:可能需要考虑历史路径、行业惯例、信号传递或谈判(若允许合作)。

9-4 📖 理解重复博弈 (Understand Repeated Games)

重复博弈的特点

  • 博弈反复进行,参与者可以根据过去的博弈结果调整未来的策略。
  • 合作提供了可能性,因为存在报复不合作行为的机制。

有限次重复博弈

  • 特征:博弈次数有限且终点已知
  • 逆向归纳法:从最后一次博弈开始倒推。由于最后一次没有未来报复的威胁,双方会选择不合作(如囚徒困境中的坦白)。由此倒推,倒数第二次、倒数第三次……直至第一次,合作的基础都非常脆弱
  • 结果:理论上倾向于不合作

无限次重复博弈(或终点未知)

  • 特征:博弈次数无限,或次数有限但终点未知
  • 合作的可能性:由于存在未来报复的可能,欺诈行为的短期收益可能低于长期合作的收益,使得合作成为可能且理性。
  • 启示:强调了诚信声誉长远利益的重要性。

惩罚欺诈的引发策略 (Trigger Strategies)

在重复博弈中,用以应对对手欺诈行为的策略:

  1. 以德报怨 (Forgiving Strategy):即使对方欺诈,仍坚持合作,希望感化对方。需要实力支撑,且可能被利用。
  2. 以牙还牙 (Tit-for-Tat):第一轮合作,之后每一轮都复制对手上一轮的行为(合作对合作,欺诈对欺诈)。简单、明确、有效。
  3. 严厉惩处 (Grim Trigger):一旦对方欺诈,永远不再合作,进行持续惩罚。
  • 选择:没有绝对最优策略。孔子主张“以直报怨”。
  • 基本原则:善良(诚信)、宽容(允许失误)、可激怒(对恶意反击)、明确(反击适度)、不嫉妒(接受竞争结果)。

9-5 📖 分析次序博弈 (Analyze Sequential Games)

次序博弈 (Sequential Game)

  • 特征:参与者按先后次序行动,后行动者可以观察到先行动者的决策。

先发优势 (First-Mover Advantage)

  • 含义:在某些博弈中,率先行动的一方可以通过承诺改变博弈格局来获得有利地位。
  • 例子:斯塔克博格产量竞争模型中,先决定产量的企业通常获利更高。

后发优势 (Second-Mover Advantage)

  • 含义:在另一些博弈中,后行动的一方因能观察到对手行动再做反应而获得优势。
  • 例子:伯特兰价格竞争模型中,后定价的企业可能更有利;新产品模仿者可以借鉴先行者经验,减少试错成本。

博弈的决策树分析(扩展形)

  • 表示:用树状图表示博弈的进程,包括决策结点、行动分支和最终得益
  • 逆向归纳法 (Backward Induction):从博弈的最后一个决策结点开始,确定该结点的最优选择,然后逐步向前推导,直到最初的决策结点,从而找到子博弈完美纳什均衡 (Subgame Perfect Nash Equilibrium)

9-6 📖 理解威胁、承诺与进入威慑 (Understand Threats, Commitments, and Entry Deterrence)

策略性行动 (Strategic Move)

  • 定义:一方通过限制自身未来的选择,来影响对手的预期和行为,从而使结果对自己有利。
  • 手段:威胁(大棒)和承诺(胡萝卜)。

威胁博弈 (Threats)

  • 目的:通过声称若对手采取某种行动,自己将采取对其不利的报复行动,来阻止对手。
  • 可信性 (Credibility):威胁必须是可信的才有效。如果实施威胁对自身也极其不利(非理性),则威胁不可信。
  • 建立可信性
    • 树立非理性形象:“疯狂”策略,让对手相信你会不惜代价实施威胁。
    • 破釜沉舟:主动消除自己的退路,使实施威胁成为唯一选择(如拆除旧生产线)。

承诺博弈 (Commitments)

  • 目的:通过做出某种保证或承担某种义务,来影响对手或消费者的行为。
  • 可信性:承诺同样需要可信。
  • 建立可信性
    • 声誉:长期信守承诺建立的声誉。
    • 承担惩罚:主动设置若不兑现承诺将受到的惩罚(如“假一罚十”)。
    • 发出信号:通过成本高昂的行为(如巨额广告投入、提供超长保修)来传递产品质量等信息,因为低质量者难以模仿。

进入威慑博弈 (Entry Deterrence)

  • 目的:现有企业(在位者)采取策略阻止潜在竞争者进入市场。
  • 常用策略
    • 限制性定价:在位者故意设定低于短期利润最大化水平、但足以使新进入者亏损的价格。
    • 过度投资:建立超出当前需要的过剩产能,向潜在进入者显示其扩大生产、发动价格战的能力和决心。
  • 有效性:取决于进入壁垒(如沉没成本)的高低。若进入壁垒低,威慑成本可能过高,容忍进入可能更有利。

9-7 📖 了解拍卖中的博弈策略 (Understand Bidding Strategies in Auctions)

拍卖 (Auction)

  • 定义:通过公开竞价将物品或权利出售给出价最高者的交易方式。
  • 招标 (Tendering):买方邀请卖方竞标,选择最优供给方的交易方式。

拍卖的主要形式

  • 公开喊价拍卖
    • 英国式 (增价):价格递增,最后出价者得。常见于艺术品。
    • 荷兰式 (降价):价格递减,第一个应价者得。常见于鲜活商品。
  • 密封投标拍卖
    • 第一价格:最高出价者中标,支付其自己的出价
    • 第二价格 (维克瑞拍卖):最高出价者中标,支付第二高的出价

拍卖物品价值评估类型

  • 私人价值 (Private Value):每个竞拍者对物品的估价不同,且只知道自己的估价(如艺术品)。
  • 共同价值 (Common Value):物品对所有竞拍者有相同的真实价值,但无人确知,只能估计(如油田开采权)。

拍卖策略

  • 私人价值拍卖
    • 竞买人策略:在所有拍卖形式中,最优策略都是按自己的真实保留价出价或停止加价。
    • 委托人 (卖方) 策略:期望成交价接近第二高的保留价。应吸引更多竞拍者参与,以抬高第二高保留价。可设保留底价。
  • 共同价值拍卖
    • 赢者陷阱 (Winner's Curse):中标者往往是对物品价值估计最高(最乐观)的人,其出价可能高于物品的真实共同价值,导致“赢了拍卖却亏了钱”。
    • 竞买人策略:为避免赢者陷阱,出价应低于自己的估价,具体幅度取决于对估价准确性的信心和风险规避程度。公开拍卖(如英国式)因能看到他人出价信息,有助于修正估价,陷阱风险小于密封拍卖。
    • 委托人策略:应尽量公开拍卖物信息,减少不确定性,鼓励竞买人提高出价。采用公开拍卖形式通常更有利。