關於約翰納什的博弈論

納什均衡定義：假設有n個局中人參與博弈，給定其他人策略的條件下，每個局中人選擇自己的最優策略（個人最優策略可能依賴於也可能不依賴於他人的戰略），從而使自己效用最大化。所有局中人策略構成壹個策略組合（Strategy Profile）。納什均衡指的是這樣壹種戰略組合，這種策略組合由所有參與人最優策略組成。即在給定別人策略的情況下，沒有人有足夠理由打破這種均衡。納什均衡經典案例：囚徒困境（1950年，數學家塔克任斯坦福大學客座教授，在給壹些心理學家作講演時，講到兩個囚犯的故事。）假設有兩個小偷A和B聯合犯事、私入民宅被警察抓住。警方將兩人分別置於不同的兩個房間內進行審訊，對每壹個犯罪嫌疑人，警方給出的政策是：如果壹個犯罪嫌疑人坦白了罪行，交出了贓物，於是證據確鑿，兩人都被判有罪。如果另壹個犯罪嫌疑人也作了坦白，則兩人各被判刑8年；如果另壹個犯罪嫌人沒有坦白而是抵賴，則以妨礙公務罪（因已有證據表明其有罪）再加刑2年，而坦白者有功被減刑8年，立即釋放。如果兩人都抵賴，則警方因證據不足不能判兩人的偷竊罪，但可以私入民宅的罪名將兩人各判入獄1年。表2.2給出了這個博弈的支付矩陣。表2.2 囚徒困境博弈 —————————————————————————— ┃ B ┃ B ┃ ————————┃————————┃————————┃ ┃ 坦白 ┃ 抵賴 ┃ ————————┃————————┃————————┃ A 坦白 ┃ –8, –8 ┃ 0, –10 ┃ ————————┃————————┃————————┃ A 抵賴 ┃ –10, 0 ┃ –1, –1 ┃ ————————┃————————┃————————┃ 關於案例，顯然最好的策略是雙方都抵賴，結果是大家都只被判1年。但是由於兩人處於隔離的情況，首先應該是從心理學的角度來看，當事雙方都會懷疑對方會出賣自己以求自保、其次才是亞當·斯密的理論，假設每個人都是“理性的經濟人”，都會從利己的目的出發進行選擇。這兩個人都會有這樣壹個盤算過程：假如他坦白，我抵賴，得坐10年監獄，坦白最多才8年；他要是抵賴，我就可以被釋放，而他會坐10年牢。綜合以上幾種情況考慮，不管他坦白與否，對我而言都是坦白了劃算。兩個人都會動這樣的腦筋，最終，兩個人都選擇了坦白，結果都被判8年刑期。基於經濟學中Rational agent的前提假設，兩個囚犯符合自己利益的選擇是坦白招供，原本對雙方都有利的策略不招供從而均被釋放就不會出現。這樣兩人都選擇坦白的策略以及因此被判8年的結局，納什均衡”首先對亞當·斯密的“看不見的手”的原理提出挑戰：按照斯密的理論，在市場經濟中，每壹個人都從利己的目的出發，而最終全社會達到利他的效果。但是我們可以從“納什均衡”中引出“看不見的手”原理的壹個悖論:從利己目的出發,結果損人不利己,既不利己也不利他。記載納什生平的書有：《普林斯頓的幽靈》（又譯為《美麗心靈》）西爾維婭.娜薩再來看壹段納什均衡理論的介紹： 1994年諾貝爾經濟學獎的獲得者是美國普林斯頓大學的約翰·納什。納什獲得諾貝爾經濟學獎的原因是他在博奕淪領域的貢獻，他提出了“納什均衡”理論、關於博奕論，流傳最廣的是壹個叫做“囚徒困境”的故事：話說有壹天，壹個富翁在家中被殺，財物被盜；警方在此案的偵破過程中，抓到兩個犯罪嫌疑人張三和李四，並從他們的住處搜出被害人家中丟失的財物。但是，他們矢口否認曾殺過人，辯稱他們只是順手牽羊偷了點兒東西。於是警方將兩人隔離，分別關在不同的房間進行審訊。警察分別對張三和李四說，“由於妳們的偷盜罪已有確鑿的證據，所以可以判妳們1年刑期。但是，我可以和妳做個交易。如果妳單獨坦白殺人的罪行，我只判妳3個月的監禁，但妳的同夥要被判10年刑。如果妳拒不坦白，而被同夥檢舉，那麽妳就將被判10年刑，他只判3個月的監禁。但是，如果妳們兩人都坦白交代，那麽，妳們都要被判5年刑。” 張三和李四怎麽辦呢?他們面臨著兩難的選擇——坦白或抵賴。顯然最好的策略是雙方都抵賴，結果是大家都只被判壹年。但是由於兩人處於隔離的情況下無法串供，按照亞當·斯密的理論，每壹個人都是壹個“理性的經濟人”，都會從利己的目的出發進行選擇。這兩個人都會有這樣壹個盤算過程：假如他招了，我不招，得坐10年監獄，招了才5年，所以招了劃算；假如我招了，他也招，得坐5年，他要是不招，我就只坐3個月，而他會坐10年牢，也是招了劃算。綜合以上幾種情況考慮，不管他招不招，對我而言都是招了劃算。兩個人都會動這樣的腦筋，最終，兩個人都選擇了招?結果都被判5年刑期。原本對雙方都有利的策略(抵賴)和結局 (被判1年刑)就不會出現。這就是著名的“囚徒困境”。它實際上反映了壹個很深刻的問題，這就是個人理性與集體理性的矛盾。實際上，如果兩個都抵賴，各判刑1年，顯然比都判5年好，但實際上做不到，因為它不滿足個人理性要求。作為壹個理性的人，張三和李四都會想，如果我抵賴而對方坦白的話，自己就可能判刑10年，理性的人是不會冒這種險的。但張三和李四都理性選擇的結果，兩人都被判了5年，最優的被判1年的結果並沒有出現。也就是說，對每個人而言都是理性的選擇，但對於整個集體來說卻是不理性的。這與傳統經濟學所言的結論相悖。傳統經濟學認為市場經濟存在“看不見的手”，它調節的結果是每個人的理性選擇最終會造成對整個集體的最大利益。實際上，就像囚徒困境壹樣，這只看不見的手在參與選擇的人數只有少數幾個的時候會失去作用，因為這個時候，人們決策的過程會考慮其他參與者的想法，就像賭博和下棋的時候壹樣，這就和買家和賣家數量都巨大時的完全競爭不完全壹樣，需要新的壹套思路進行研究。在上面的例子中，我們註意到了壹個並非最優的結果，就是兩人都選擇坦白的策略以及因此被判5年的結果，這個結果被稱為“納什均衡”，也叫非合作均衡。博奕論中最基本的概念就是“納什均衡”，壹談到博奕論，人們說的最多的最著名的也是“納什均衡”。納什均衡指的是這樣壹種戰略組合，這種戰略組合由所有參與人的最優戰略組成，也就是說，給定別人戰略的情況下，沒有任何單個參與人有積極性選擇其他戰略使自己獲得更大利益，從而沒有任何人有積極性打破這種均衡。當然，“納什均衡”雖然是由單個人的最優戰略組成，但並不意味著是壹個總體最優的結果。如上述，在個人理性與集體理性的沖突的情況下，各人追求利己行為而導致的最終結局是壹個“納什均衡”，也是對所有人都不利的結局。從這個意義上說，“納什均衡”提出的悖論實際上動搖了西方經濟學的基石。同時，它也提示我們：合作是有利的“利己策略”。實際上，如果上述兩個囚徒能夠串供進行合作，那麽他們壹定會選擇都抵賴從而只因偷盜罪被判1年，當然，正是考慮到了這壹點，所以警察才對他們隔離審查從而獲知了事實真相，對囚徒而言最有利的合作結果才沒有出現。“納什均衡”描述的就是壹種非合作博奕均衡，在現實中非合作的情況要比合作情況普遍。所以“納什均衡”是對馮·諾依曼和摩根斯特恩的合作博奕理論的重大發展，甚至可以說是壹場革命。今天，納什均衡被廣泛應用於各個領域的研究，尤其在進行制度分析寸，我們可應用它得出壹個很重要結論：壹種制度(體制)安排要發生效力，必須是壹種納什均衡。否則，這種制度安排便不能成立。(據《諾貝爾經濟學獎經典理論》壹書)

采納哦

上一篇:recycle是什麽意思

下一篇:關於名人持之以恒的簡短小故事，要小故事，簡短簡潔的

袁隆平對我國來說是壹種怎樣的存在呢？

移動硬盤ssd和固態硬盤有什麽區別

二人轉藝人孫小寶為什麽沒有投奔趙本山？

微軟自定義郵箱後綴免費設置出臺與傳統企業郵局對比

求十字架與吸血鬼第壹部和第二部的主題曲片尾曲和插曲

漢武帝是誰的兒子，和劉邦是什麽關系？

夢幻西遊新祥瑞雪域聖靈介紹好玩嗎