别卷了!用数学拆解零和博弈:从奶茶价格战到纳什均衡的深度攻略:典型例题精讲
适用年级
奥数
难度等级
⭐⭐⭐
资料格式
PDF 可打印
最近更新
2025-12-20
零和博弈与内卷:一场数学视角下的竞争寓言
💡 阿星精讲:零和博弈 的本质
想象一下自习室里的“内卷”:当一个人开始熬夜,其他人被迫跟进,最终所有人睡眠不足、效率下降,但排名却几乎没变——这就是零和博弈的残酷浪漫。从数学上看,零和博弈指参与者收益之和恒为零(\( \sum_{i} u_i = 0 \)),一方的收益必然意味着另一方的损失。然而在现实中,过度竞争(如价格战、广告轰炸)会导致支付矩阵扭曲,使所有参与者的实际收益 \( u_i^* \) 低于理论上可能通过合作达到的纳什均衡点 \( u_i^{NE} \),即出现 \( u_i^* < u_i^{NE} \) 的“双输”局面。这揭示了内卷的本质:在有限资源下,非理性竞争会将博弈推向对整体更劣的稳定状态。
🔥 经典例题精析
题目:两家相邻的奶茶店(A店与B店)面临假日促销决策。若双方都维持原价,各获利 \( 100 \) 单位;若一方降价而另一方维持,降价方因销量大增获利 \( 150 \),维持方仅获利 \( 40 \);若双方都降价,则陷入价格战,各获利 \( 60 \)。请分析此博弈的纳什均衡,并计算相比合作(维持原价)的收益损失。
阿星拆解:
步骤1:构建支付矩阵
设策略集 \( S = \{\text{维持}, \text{降价}\} \),支付矩阵如下(A店收益, B店收益):
\[ \begin{array}{c|cc} & \text{B维持} & \text{B降价} \\ \hline \text{A维持} & (100, 100) & (40, 150) \\ \text{A降价} & (150, 40) & (60, 60) \\ \end{array} \]
步骤2:寻找纳什均衡
• 若B选择维持,A的最优反应是降价(\( 150 > 100 \))。
• 若B选择降价,A的最优反应也是降价(\( 60 > 40 \))。
• 对称地,B的最优反应始终是降价。因此(降价,降价)是唯一的纯策略纳什均衡,收益为 \( (60, 60) \)。
步骤3:计算内卷损失
合作状态(维持,维持)收益:\( (100, 100) \),总收益 \( 200 \)。
纳什均衡(降价,降价)收益:\( (60, 60) \),总收益 \( 120 \)。
每店损失:\( 100 - 60 = 40 \) 单位;社会总福利损失:\( 200 - 120 = 80 \) 单位。
口诀:
零和博弈像内卷,你追我赶收益减。
合作本是帕累托,陷进均衡难挣脱。
🚀 举一反三:变式挑战
将奶茶店替换为两家竞争的在线教育平台,决策为“投放常规广告”或“发起疯狂补贴”。支付矩阵调整为:双方常规广告各获利 \( 120 \);一方补贴一方常规,补贴方获利 \( 180 \),常规方获利 \( 30 \);双方补贴各获利 \( 50 \)。请求解纳什均衡并计算补贴大战造成的总收益损失率。
已知某双人零和博弈的纳什均衡为双方均采取激进策略,收益为 \( (70, 70) \)。若合作状态下收益为 \( (a, a) \),且已知内卷导致每方损失收益 \( 30 \) 单位。请求出合作收益 \( a \) 的值,并反推设计一个满足此条件的 \( 2 \times 2 \) 支付矩阵(需包含至少一个占优策略)。
考虑三家公司(甲、乙、丙)的市场竞争。每家公司可选择“保守研发”或“激进挖角”。若全部保守,各获利 \( 90 \);若一家激进其余保守,激进者获利 \( 140 \),保守者各获利 \( 50 \);若两家激进一家保守,激进方各获利 \( 80 \),保守方获利 \( 20 \);若全部激进,各获利 \( 40 \)。分析此博弈中“激进”策略是否为风险占优策略,并计算多重纳什均衡下的最大可能内卷损失。
答案与解析
经典例题答案:
纳什均衡为(降价,降价),收益 \( (60, 60) \)。相比合作状态 \( (100, 100) \),每店损失 \( 40 \) 单位收益,总福利损失 \( 80 \) 单位。
变式一解析:
支付矩阵为:
\[ \begin{array}{c|cc} & \text{B常规} & \text{B补贴} \\ \hline \text{A常规} & (120, 120) & (30, 180) \\ \text{A补贴} & (180, 30) & (50, 50) \\ \end{array} \]
分析可知(补贴,补贴)为唯一纳什均衡,收益 \( (50, 50) \)。合作总收益 \( 240 \),均衡总收益 \( 100 \),损失率 \( \frac{240-100}{240} \times 100\% \approx 58.3\% \)。
变式二解析:
由题意 \( a - 30 = 70 \),得 \( a = 100 \)。一种可能的支付矩阵设计:
\[ \begin{array}{c|cc} & \text{合作} & \text{激进} \\ \hline \text{合作} & (100, 100) & (20, 130) \\ \text{激进} & (130, 20) & (70, 70) \\ \end{array} \]
其中“激进”为双方的占优策略。
变式三解析:
此博弈存在两个纯策略纳什均衡:全部保守 \( (90,90,90) \) 与全部激进 \( (40,40,40) \)。全部激进时,任一公司单方面改变策略(变为保守)会遭受更大损失(从 \( 40 \) 降至 \( 20 \) ),因此“激进”是风险占优策略。最大内卷损失发生在全部激进相比全部保守:每家公司损失 \( 50 \) 单位,总损失 \( 150 \) 单位。
PDF 典型例题打印版
为了节省资源,点击后将为您即时生成 PDF