管理经济学(第四版)
第九章 博弈论与企业竞争策略 (Chapter 9: Game Theory and Business Competitive Strategy)
9-1 📖 理解博弈论的基本概念与分类 (Understand Basic Concepts and Classifications of Game Theory)
社会人的假定 (Assumption of Social Man)
- 超越经济人:博弈论涉及人与人之间的互动,不能简单假设人为追求物质利益最大化的“经济人”或“理性机械人”。
- 社会人特征:人是“社会人”和“组织人”,除物质利益外,还追求安全、情感、尊重等高层次需求。人的行为受社会文化环境影响,需考虑他人和社会公共利益。
- 核心:社会人追求共赢前提下的自利,合作基础上的竞争。“利己”与“利他”需要协调统一。
- 博弈假定:参与者都是社会人,并且同样聪明,能进行理性、客观的逻辑推理和换位思考。
合作博弈与非合作博弈 (Cooperative vs. Non-cooperative Games)
- 合作博弈:参与方能通过谈判达成具有约束力且可执行的合同。
- 非合作博弈:无法形成有约束力的协议,或协议无法有效执行。本书重点讨论非合作博弈。
非合作博弈的分类 (Classification of Non-cooperative Games)
- 博弈四要素:
- 博弈方 (Player):决策者。
- 策略 (Strategy):行动方案。
- 决策 (Action):采取的行动。
- 得益 (Payoff):最终收益。
- 主要分类:
- 同时博弈 (Simultaneous Game / Static Game):各方同时决策,或在不知晓对方决策的情况下做决策。
- 序列博弈 (Sequential Game / Dynamic Game):各方依先后次序行动,后行动者可以观察到先行动者的决策。
- 一次性博弈 (One-Shot Game):博弈只进行一次。
- 重复博弈 (Repeated Game):博弈反复进行多次。有限次重复(知道终点)和无限次重复(不知终点)策略不同。
- 完全信息博弈 (Complete Information Game):所有参与方都了解彼此的特征、策略空间和得益(理论概念)。
- 不完全信息博弈 (Incomplete Information Game):参与方对其他博弈方的信息了解不完全或不准确(现实中常见)。
- 两人博弈 vs. 多人博弈。
9-2 📖 掌握三种基本博弈策略 (Master Three Basic Game Strategies)
纳什均衡 (Nash Equilibrium)
- 核心概念:一种稳定状态,其中每个参与者在给定其他参与者策略的情况下,都选择了对自己最有利的策略,因此没有任何一方愿意单方面改变其策略。
上策策略 (Dominant Strategy)
- 定义:无论对手选择何种策略,某参与者的某个特定策略始终是其最优选择。
- 上策均衡:当所有参与者都拥有上策,并且都选择上策时达到的均衡状态。
- 特点:上策均衡一定是纳什均衡,但纳什均衡不一定是上策均衡。决策简单,无需过多考虑对手。
- 局限:并非所有博弈都有上策,可能只有一方有,也可能双方都没有。
最小得益最大化策略 (Maximin Strategy)
- 定义:一种保守的策略。决策者首先考虑每种策略下可能出现的最坏结果(最小得益),然后选择那个最坏结果相对最好(最大化最小得益)的策略。
- 应用场景:当决策者非常规避风险,或不确定对手是否理性时采用。
- 特点:旨在避免最坏的结果,而非追求最好的结果,通常不是纳什均衡。
混合策略 (Mixed Strategy)
- 定义:参与者不选择单一的确定性行动(纯策略),而是以一定的概率随机地选择不同的行动策略。
- 目的:使自己的行为不可预测,让对手无规律可循,无法针对性地利用。
- 均衡:当随机概率的选择使得对手采取任何策略的期望得益都相同时,达到混合策略纳什均衡。
- 应用:适用于没有纯策略纳什均衡的博弈(如保安与小偷的博弈、石头剪刀布)。
囚徒困境 (Prisoner's Dilemma)
- 经典模型:两个嫌疑人分开审讯,面临坦白或抗拒的选择。
- 困境:对个体而言,无论对方如何选择,“坦白”都是上策。但双方都选择坦白(上策均衡/纳什均衡)的结果,却比双方都选择“抗拒”(合作)的结果要差。
- 启示:个体理性(追求自身利益最大化)可能导致集体非理性(损害共同利益)。强调了信任、沟通与合作的重要性。若能从对方利益考虑,可能实现双赢。
9-3 📖 分析一次性同时博弈 (Analyze One-Shot Simultaneous Games)
上策决策
- 如果博弈中存在上策,理性的参与者会优先选择上策。
- 例如:在寡头产量博弈中,如果按古诺模型决策(产量 10)无论对手如何选择都优于按卡特尔模型决策(产量 7.5),则选择古诺产量是上策。
剔除下策 (Elimination of Dominated Strategies)
- 下策 (Dominated Strategy):无论对手选择何种策略,某参与者的某个特定策略总是劣于(或最多等于)其另一个策略。
- 剔除原则:理性的参与者不会选择下策(或弱下策)。
- 连续剔除下策:通过反复识别并剔除各方的下策,逐步简化博弈矩阵,最终可能找到唯一的纳什均衡解。
寻找纳什均衡的简捷法(画箭头法)
- 在得益矩阵中:
- 比较上下相邻单元格逗号前的数字(行参与者的得益),画箭头指向较大值。
- 比较左右相邻单元格逗号后的数字(列参与者的得益),画箭头指向较大值。
- 纳什均衡点:所有箭头都指向内部的那个单元格。
无上策博弈
- 当博弈双方都没有上策时,可能存在多个纯策略纳什均衡。
- 解决方法:可能需要考虑历史路径、行业惯例、信号传递或谈判(若允许合作)。
9-4 📖 理解重复博弈 (Understand Repeated Games)
重复博弈的特点
- 博弈反复进行,参与者可以根据过去的博弈结果调整未来的策略。
- 为合作提供了可能性,因为存在报复不合作行为的机制。
有限次重复博弈
- 特征:博弈次数有限且终点已知。
- 逆向归纳法:从最后一次博弈开始倒推。由于最后一次没有未来报复的威胁,双方会选择不合作(如囚徒困境中的坦白)。由此倒推,倒数第二次、倒数第三次……直至第一次,合作的基础都非常脆弱。
- 结果:理论上倾向于不合作。
无限次重复博弈(或终点未知)
- 特征:博弈次数无限,或次数有限但终点未知。
- 合作的可能性:由于存在未来报复的可能,欺诈行为的短期收益可能低于长期合作的收益,使得合作成为可能且理性。
- 启示:强调了诚信、声誉和长远利益的重要性。
惩罚欺诈的引发策略 (Trigger Strategies)
在重复博弈中,用以应对对手欺诈行为的策略:
- 以德报怨 (Forgiving Strategy):即使对方欺诈,仍坚持合作,希望感化对方。需要实力支撑,且可能被利用。
- 以牙还牙 (Tit-for-Tat):第一轮合作,之后每一轮都复制对手上一轮的行为(合作对合作,欺诈对欺诈)。简单、明确、有效。
- 严厉惩处 (Grim Trigger):一旦对方欺诈,永远不再合作,进行持续惩罚。
- 选择:没有绝对最优策略。孔子主张“以直报怨”。
- 基本原则:善良(诚信)、宽容(允许失误)、可激怒(对恶意反击)、明确(反击适度)、不嫉妒(接受竞争结果)。
9-5 📖 分析次序博弈 (Analyze Sequential Games)
次序博弈 (Sequential Game)
- 特征:参与者按先后次序行动,后行动者可以观察到先行动者的决策。
先发优势 (First-Mover Advantage)
- 含义:在某些博弈中,率先行动的一方可以通过承诺或改变博弈格局来获得有利地位。
- 例子:斯塔克博格产量竞争模型中,先决定产量的企业通常获利更高。
后发优势 (Second-Mover Advantage)
- 含义:在另一些博弈中,后行动的一方因能观察到对手行动再做反应而获得优势。
- 例子:伯特兰价格竞争模型中,后定价的企业可能更有利;新产品模仿者可以借鉴先行者经验,减少试错成本。
博弈的决策树分析(扩展形)
- 表示:用树状图表示博弈的进程,包括决策结点、行动分支和最终得益。
- 逆向归纳法 (Backward Induction):从博弈的最后一个决策结点开始,确定该结点的最优选择,然后逐步向前推导,直到最初的决策结点,从而找到子博弈完美纳什均衡 (Subgame Perfect Nash Equilibrium)。
9-6 📖 理解威胁、承诺与进入威慑 (Understand Threats, Commitments, and Entry Deterrence)
策略性行动 (Strategic Move)
- 定义:一方通过限制自身未来的选择,来影响对手的预期和行为,从而使结果对自己有利。
- 手段:威胁(大棒)和承诺(胡萝卜)。
威胁博弈 (Threats)
- 目的:通过声称若对手采取某种行动,自己将采取对其不利的报复行动,来阻止对手。
- 可信性 (Credibility):威胁必须是可信的才有效。如果实施威胁对自身也极其不利(非理性),则威胁不可信。
- 建立可信性:
- 树立非理性形象:“疯狂”策略,让对手相信你会不惜代价实施威胁。
- 破釜沉舟:主动消除自己的退路,使实施威胁成为唯一选择(如拆除旧生产线)。
承诺博弈 (Commitments)
- 目的:通过做出某种保证或承担某种义务,来影响对手或消费者的行为。
- 可信性:承诺同样需要可信。
- 建立可信性:
- 声誉:长期信守承诺建立的声誉。
- 承担惩罚:主动设置若不兑现承诺将受到的惩罚(如“假一罚十”)。
- 发出信号:通过成本高昂的行为(如巨额广告投入、提供超长保修)来传递产品质量等信息,因为低质量者难以模仿。
进入威慑博弈 (Entry Deterrence)
- 目的:现有企业(在位者)采取策略阻止潜在竞争者进入市场。
- 常用策略:
- 限制性定价:在位者故意设定低于短期利润最大化水平、但足以使新进入者亏损的价格。
- 过度投资:建立超出当前需要的过剩产能,向潜在进入者显示其扩大生产、发动价格战的能力和决心。
- 有效性:取决于进入壁垒(如沉没成本)的高低。若进入壁垒低,威慑成本可能过高,容忍进入可能更有利。
9-7 📖 了解拍卖中的博弈策略 (Understand Bidding Strategies in Auctions)
拍卖 (Auction)
- 定义:通过公开竞价将物品或权利出售给出价最高者的交易方式。
- 招标 (Tendering):买方邀请卖方竞标,选择最优供给方的交易方式。
拍卖的主要形式
- 公开喊价拍卖:
- 英国式 (增价):价格递增,最后出价者得。常见于艺术品。
- 荷兰式 (降价):价格递减,第一个应价者得。常见于鲜活商品。
- 密封投标拍卖:
- 第一价格:最高出价者中标,支付其自己的出价。
- 第二价格 (维克瑞拍卖):最高出价者中标,支付第二高的出价。
拍卖物品价值评估类型
- 私人价值 (Private Value):每个竞拍者对物品的估价不同,且只知道自己的估价(如艺术品)。
- 共同价值 (Common Value):物品对所有竞拍者有相同的真实价值,但无人确知,只能估计(如油田开采权)。
拍卖策略
- 私人价值拍卖:
- 竞买人策略:在所有拍卖形式中,最优策略都是按自己的真实保留价出价或停止加价。
- 委托人 (卖方) 策略:期望成交价接近第二高的保留价。应吸引更多竞拍者参与,以抬高第二高保留价。可设保留底价。
- 共同价值拍卖:
- 赢者陷阱 (Winner's Curse):中标者往往是对物品价值估计最高(最乐观)的人,其出价可能高于物品的真实共同价值,导致“赢了拍卖却亏了钱”。
- 竞买人策略:为避免赢者陷阱,出价应低于自己的估价,具体幅度取决于对估价准确性的信心和风险规避程度。公开拍卖(如英国式)因能看到他人出价信息,有助于修正估价,陷阱风险小于密封拍卖。
- 委托人策略:应尽量公开拍卖物信息,减少不确定性,鼓励竞买人提高出价。采用公开拍卖形式通常更有利。