囚徒困境 (Prisoner's Dilemma) 是博弈論中的一個基本概念,說明了即使看似符合雙方的最佳利益,他們也可能不會互相合作。這種困境說明了為何理性的個人可能會選擇互不合作,即使合作會為雙方帶來更好的結果。
在囚徒困境的經典場景中,兩名嫌疑犯被分別逮捕和審訊。檢察官向雙方提出了協議:
- 如果囚犯 A 認罪,而囚犯 B 保持沉默,則囚犯 A 獲釋,囚犯 B 接受完整刑罰。
- 如果兩名囚犯都認罪,他們將各自受到中等程度的刑罰。
- 如果兩名囚犯保持沉默,他們將各自受到輕度刑罰。
之所以會出現這種困境,是因為每個囚犯都必須在保持沉默與對方合作、還是坦白背叛對方之間做出選擇,而每個囚犯的最佳策略取決於對方的預期決定。理性而言,兩名囚犯都會選擇坦白,這會導致比雙方合作更糟糕的結果。
主導策略 (Dominant Strategy):
如果一種策略是玩家可以遵循的最佳策略,則無論其他玩家做什麼,該策略都帶著主導性。在囚徒困境中,兩名囚犯的主導策略都是坦白。
納許均衡 (Nash Equilibrium):
在這種情況下,任何玩家都無法透過改變策略而受益,而其他玩家則保持策略不變。在囚徒困境中,相互坦白即為納許均衡,儘管相互合作會產生更好的結果。
收益矩陣 (Payoff Matrix):
此表格根據每個玩家的選擇顯示了他們的收益,並有助於直觀地表示玩家的結果和策略。
經濟層面:
公司在決定是積極競爭,還是透過定價合作時,可能會面臨類似的困境。相互合作可能會帶來更高的利潤,但削弱競爭的誘惑可能會導致雙方利潤下降。
環境政策:
各國在決定是否投資減少碳排放時,可能面臨囚徒困境。相互合作將有利於全球環境,但個人激勵可能會導致不合作和對所有人來說更糟糕的結果。
加密貨幣:
在區塊鏈和加密貨幣網路中,參與者經常遇到類似囚徒困境的情況,例如決定是按照網路的最佳利益、或是自私行事。
溝通與信任:
建立信任和溝通管道可以幫助各方了解合作相對於背叛的好處。
重複互動:
當遊戲重複進行時,玩家可以採取「以牙還牙」等策略,從合作開始,然後模仿其他玩家先前的舉動,隨著時間的推移促進合作。
執法機制:
合約和法規等外部執行機制,可以透過懲罰背叛來確保合作。
囚徒困境是理解各領域策略互動的強大工具,突顯了在「個人理性導致集體次優結果」情況下,實現合作的挑戰。