當前位置:編程學習大全網 - 源碼破解 - 囚徒困境什麽意思

囚徒困境什麽意思

囚徒效應壹般指囚徒困境,囚徒困境(prisoners dilemma)是指兩個被捕的囚徒之間的壹種特殊博弈,說明為什麽甚至在合作對雙方都有利時,保持合作也是困難的。

壹、囚徒困境的簡介

囚徒困境是博弈論的非零和博弈中具代表性的例子,反映個人最佳選擇並非團體最佳選擇。

或者說在壹個群體中,個人做出理性選擇卻往往導致集體的非理性。雖然困境本身只屬模型性質,但現實中的價格競爭、環境保護等方面,也會頻繁出現類似情況。

二、囚徒困境的出處

“囚徒困境”是1950年美國蘭德公司的梅裏爾·弗勒德和梅爾文·德雷希爾擬定出相關困境的理論,後來由顧問艾伯特·塔克以囚徒方式闡述,並命名為“囚徒困境”。兩個***謀犯罪的人被關入監獄,不能互相溝通情況。

如果兩個人都不揭發對方,則由於證據不確定,每個人都坐牢壹年;若壹人揭發,而另壹人沈默,則揭發者因為立功而立即獲釋,沈默者因不合作而入獄十年;若互相揭發,則因證據確實,二者都判刑八年。

由於囚徒無法信任對方,因此傾向於互相揭發,而不是同守沈默。最終導致納什均衡僅落在非合作點上的博弈模型。

三、囚徒困境的故事

囚徒困境的故事講的是,兩個嫌疑犯作案後被警察抓住,分別關在不同的屋子裏接受審訊。警察知道兩人有罪,但缺乏足夠的證據。

警察告訴每個人:如果兩人都抵賴,各判刑壹年;如果兩人都坦白,各判八年;如果兩人中壹個坦白而另壹個抵賴,坦白的放出去,抵賴的判十年。於是,每個囚徒都面臨兩種選擇:坦白或抵賴。

然而,不管同夥選擇什麽,每個囚徒的最優選擇是坦白:如果同夥抵賴、自己坦白的話放出去,抵賴的話判十年,坦白比不坦白好;如果同夥坦白、自己坦白的話判八年,比起抵賴的判十年,坦白還是比抵賴的好。

結果,兩個嫌疑犯都選擇坦白,各判刑八年。如果兩人都抵賴,各判壹年,顯然這個結果好。囚徒困境所反映出的深刻問題是,人類的個人理性有時能導致集體的非理性-聰明的人類會因自己的聰明而作繭自縛,或者損害集體的利益。

囚徒困境的主要內容

1、單次多重

單次和多次的囚徒困境,結果不會壹樣。在重復的囚徒困境中,博弈被反復地進行。因而每個參與者都有機會去“懲罰”另壹個參與者前壹回合的不合作行為。

這時,合作可能會作為平衡的結果出現。

欺騙的動機這時可能被懲罰的威脅所克服,從而可能導向壹個較好的、合作的結果。反復的、接近無限的重復次數時,納什均衡趨向於帕累托最優,從互相背叛趨向於互相忠誠。

2、理論主旨

囚徒們雖然彼此合作堅不吐實,可為全體帶來最佳利益,但在對方的表現不明的情況下,因為出賣同夥可為自己帶來利益,也因為同夥把自己招出來可為他帶來利益,因此彼此出賣雖違反最佳***同利益,反而是自己最大利益所在。

但實際上,執法機構不可能設立如此情境來誘使所有囚徒招供,因為囚徒們必須考慮刑期以外之因素(出賣同夥會受到報復等),而無法完全以執法者所設立之利益(刑期)作為必須考量的因素。

  • 上一篇:fba頭程是什麽意思
  • 下一篇:詞語造句:用嶽母造句(約30個)
  • copyright 2024編程學習大全網