博弈論之“囚徒困境”

嗨，大家好，我是虞上人。

之前分享過關於博弈論的壹些東西，都是聽完書之後的壹些感悟，再聽時，我發現其中比較著名的囚徒困境值得仔細思索。

囚徒困境屬於非零和博弈，非零和博弈是壹種合作博弈，博弈中各個參與方的收益或者損失的總和不是零值。代表可能會收益為正，反之收益為負。

個人的最佳選擇並非團體的最佳選擇。它區別於零和博弈。

囚徒困境指:兩個囚犯的故事，這兩個囚犯壹起做壞事，結果被警察抓了起來，分別關在獨立的不能互通信息的牢房進行審訊。

在這種情形下，兩個囚犯都可以做出自己的選擇，1）供出自己的同夥（既與警察合作，背叛同夥）；2）保持沈默，與同夥合作，不與警察合作。

其中坦白從寬，坐牢年數會變少到8年；如果抗拒從嚴則是判十年，基於其中至少壹方坦白。

如果兩方都抵賴，就是判刑壹年，這也是最好的結果。

但是囚徒困境反映的深刻問題是:人類的個體理性有時能導致集體的非理性—聰明的人類會因自己的聰明而作繭自縛，或損害集體的利益。

其實，囚徒困境也是做過很多的假設，來如何破解這個局面，將損失降到最低:

1.建立絕對的信任，大家通力合作（只限於假設，畢竟太理性，很難實現）

2.無限次的重復博弈，這樣可以逐漸的踢除劣勢，跳出局限

3.壹定的外力威脅，比如只有抵賴才能讓妳活下去等

當然這種假設之類的有時候太理性，大概率是不可能成功的。因為陷入囚徒困境的人肯定優先是想讓自己處於最優地位，而不是大家都是最優，畢竟並不信任對方。

囚徒困境表示的是個人理性與集體理性之間沖突。

囚徒困境看來感覺挺簡單的，就是坦白與不坦白的選擇，但實際它作為壹種模型，反映的博弈問題是我們經常會遇到或見到的，經濟中的價格戰，環境問題等，這都存在著不同程度的“囚徒模型”。