别掉进“理性”的陷阱!阿星用囚徒困境教你博弈论秒懂攻略:典型例题精讲
适用年级
奥数
难度等级
⭐⭐⭐
资料格式
PDF 可打印
最近更新
2025-12-20
囚徒困境:破解“个人理性”的陷阱
💡 阿星精讲:囚徒困境 的本质
想象一下,你被关在一个看不见的牢笼里。这个牢笼不是铁窗,而是由“个人理性”的砖块砌成。囚徒困境的精髓,就在于揭示了个人最优选择如何导致集体最坏结果。在缺乏沟通与信任的单次博弈中,每个局中人都会进行如下盘算:“无论对方选什么,我‘背叛’的结果都不会比‘合作’更差,而且可能更好。” 这种思维导致背叛成为每个人的占优策略,最终两人双双坠入陷阱,获得比都选择合作更糟糕的结局 \((-8, -8)\)。这就像一场没有赢家的“理性狂欢”,个人精明算计的终点,竟是集体的悲哀。
🔥 经典例题精析
题目:两名共犯甲和乙被隔离审讯。检察官给出条件:如果一人认罪并指证对方(背叛),而对方沉默(合作),则认罪者立即释放(收益为 \(0\)),沉默者重判 \(10\) 年。如果两人都沉默(互相合作),则因证据不足各判 \(1\) 年。如果两人互相指认(互相背叛),则证据确凿,各判 \(8\) 年。请用支付矩阵表示此博弈,并分析双方的占优策略与纳什均衡。
阿星拆解:
第一步:构建支付矩阵。 我们将刑期转化为负收益(年数取负),矩阵如下(甲的策略在行,乙的策略在列,支付为(甲收益,乙收益)):
\[ \begin{array}{c|cc} & \text{乙合作(沉默)} & \text{乙背叛(认罪)} \\ \hline \text{甲合作(沉默)} & (-1, -1) & (-10, 0) \\ \text{甲背叛(认罪)} & (0, -10) & (-8, -8) \\ \end{array} \]
第二步:寻找甲的占优策略。 比较甲的两行:
- 若乙合作:甲合作得 \(-1\),甲背叛得 \(0\)。背叛更好。
- 若乙背叛:甲合作得 \(-10\),甲背叛得 \(-8\)。背叛更好。
∴ 无论乙如何选择,甲选择“背叛”的收益都 ≥ 选择“合作”。“背叛”是甲的占优策略。
第三步:同理分析乙。 比较乙的两列,同样可得出:无论甲如何选择,“背叛”也是乙的占优策略。
第四步:确定均衡。 当双方都选择各自的占优策略“背叛”时,对应的支付组合是 \((-8, -8)\)。在这个策略组合下,任何单方面改变策略都不会变得更好(甲若单方面改为合作,收益从 \(-8\) 降为 \(-10\);乙同理)。因此,(背叛,背叛) 是这个博弈唯一的纳什均衡,尽管它比(合作,合作)的 \((-1, -1)\) 要糟糕得多。
口诀:各自算盘打得精,双双落得最差情。信任沟通若不在,理性筑成铁牢笼。
🚀 举一反三:变式挑战
两家相邻的奶茶店面临“降价促销”博弈。若都维持原价(合作),各获利 \(100\) 单位;若一家降价而另一家维持,降价者抢走市场获利 \(150\),维持者仅获利 \(30\);若两家都降价(互相背叛),则陷入价格战,各获利 \(40\)。请构建支付矩阵(收益为正),并找出占优策略与纳什均衡。
在一个抽象的 \(2 \times 2\) 博弈中,已知(合作,合作)是 Pareto 最优的结局,收益为 \((a, a)\),且 \(a > 0\)。又已知“背叛”对双方都是占优策略,最终纳什均衡收益为 \((c, c)\),且 \(c < a\)。若给定当一方合作一方背叛时,背叛者收益 \(b\) 满足 \(b > a\),合作者收益 \(d\) 满足 \(d < c\)。请用不等式关系表达 \(a, b, c, d\) 四者之间如何构成一个标准的囚徒困境。
(公共品博弈)三个村民决定是否为修建村路出资。每人可选出资 \(1\) 单位(合作)或不出资(背叛)。只要有人出资,路就能修成,所有村民(无论是否出资)均获得 \(2\) 单位的好处。若无人出资,则收益均为 \(0\)。分析在单次、匿名博弈下,一个村民的占优策略是什么?最终的纳什均衡及总社会收益是多少?这与囚徒困境的“陷阱”有何共通之处?
答案与解析
经典例题答案:如上分析,占优策略为双方均“背叛”,纳什均衡为(背叛,背叛),对应支付 \((-8, -8)\)。
变式一解析:
支付矩阵((甲收益,乙收益))为:
\[ \begin{array}{c|cc} & \text{乙合作(维持)} & \text{乙背叛(降价)} \\ \hline \text{甲合作(维持)} & (100, 100) & (30, 150) \\ \text{甲背叛(降价)} & (150, 30) & (40, 40) \\ \end{array} \]
对甲:若乙合作,甲背叛 (\(150 > 100\));若乙背叛,甲背叛 (\(40 > 30\))。“降价”(背叛)是占优策略。同理对乙亦然。纳什均衡为(降价,降价),收益为 \((40, 40)\),劣于都维持原价的 \((100, 100)\)。
变式二解析:
构成囚徒困境需满足两个条件:1) 背叛是占优策略;2) 均衡结果非最优。用不等式表示为:
1) 对任一方,背叛优于合作:即无论对方合作(\(b > a\))还是背叛(\(c > d\)),背叛的收益都更高。
2) 集体合作优于均衡:\(a > c\)。
综上,四者关系为:\(b > a > c > d\)。
变式三解析:
对一个村民而言:若其他两人至少一人出资,则他不出资(背叛)可得 \(2\),出资(合作)则得 \(2-1=1\),背叛更好;若其他两人均不出资,他不出资得 \(0\),出资得 \(2-1=1\),出资更好。因此,“不出资”并非绝对占优策略。但通过分析:每个村民都预期“别人可能会出资,我不出也能享受好处”,且无法信任他人,最终所有人都会选择“不出资”作为风险最低的选择。纳什均衡是(不出资,不出资,不出资),每人收益 \(0\),总社会收益 \(0\)。若都出资,每人收益 \(1\),总收益 \(3\)。共通点:个人基于自利和缺乏信任的决策,导致了集体福利的显著损失,这正是“个人理性陷阱”在多人场景中的体现。
PDF 典型例题打印版
为了节省资源,点击后将为您即时生成 PDF