當前位置:編程學習大全網 - 編程語言 - 博弈論之“囚徒困境”

博弈論之“囚徒困境”

嗨,大家好,我是虞上人。

之前分享過關於博弈論的壹些東西,都是聽完書之後的壹些感悟,再聽時,我發現其中比較著名的囚徒困境值得仔細思索。

囚徒困境 屬於非零和博弈 ,非零和博弈是壹種合作博弈,博弈中各個參與方的收益或者損失的總和不是零值。代表可能會收益為正,反之收益為負。

個人的最佳選擇並非團體的最佳選擇。它區別於零和博弈。

囚徒困境指:兩個囚犯的故事,這兩個囚犯壹起做壞事,結果被警察抓了起來,分別關在獨立的不能互通信息的牢房進行審訊 。

在這種情形下,兩個囚犯都可以做出自己的選擇,1)供出自己的同夥(既與警察合作,背叛同夥);2)保持沈默,與同夥合作,不與警察合作。

其中坦白從寬,坐牢年數會變少到8年;如果抗拒從嚴則是判十年,基於其中至少壹方坦白。

如果兩方都抵賴,就是判刑壹年,這也是最好的結果。

但是囚徒困境反映的深刻問題是:人類的個體理性有時能導致集體的非理性—聰明的人類會因自己的聰明而作繭自縛,或損害集體的利益。

其實,囚徒困境也是做過很多的假設,來如何破解這個局面,將損失降到最低:

1.建立絕對的信任,大家通力合作(只限於假設,畢竟太理性,很難實現)

2.無限次的重復博弈,這樣可以逐漸的踢除劣勢,跳出局限

3.壹定的外力威脅,比如只有抵賴才能讓妳活下去等

當然這種假設之類的有時候太理性,大概率是不可能成功的。因為陷入囚徒困境的人肯定優先是想讓自己處於最優地位,而不是大家都是最優,畢竟並不信任對方。

囚徒困境表示的是個人理性與集體理性之間沖突。

囚徒困境看來感覺挺簡單的,就是坦白與不坦白的選擇,但實際它作為壹種模型,反映的博弈問題是我們經常會遇到或見到的,經濟中的價格戰,環境問題等,這都存在著不同程度的“囚徒模型”。

  • 上一篇:牡丹江市城市職業學校專業有哪些?專業介紹
  • 下一篇:楚雄java培訓學校告訴妳怎麽學安卓手機開發?
  • copyright 2024編程學習大全網