當前位置:編程學習大全網 - 圖片素材 - 博弈論(2)—納什均衡

博弈論(2)—納什均衡

如果想觀看相關視頻可以在西瓜視頻(賬號zidea)或者嗶哩嗶哩(賬號zidea2015)找到我發布視頻解說,註意頭像和使用頭像壹致。

又稱為非合作博弈均衡,是博弈論的壹個重要術語,以約翰·納什命名。 在壹個博弈過程中,無論對方的策略選擇如何,當事人壹方都會選擇某個確定的策略,則該策略被稱作 最佳應對 。 如果兩個博弈的局中人的策略組合分別構成各自的 最佳應對 ,那麽這個組合就被定義為納什均衡。

在給出納什均衡解釋前,我們先得把壹個概念說清楚最佳應對。

納什均衡是刻畫局勢,如果壹個局勢下,每個局中人的策略都是相對其他局中人當前策略的最佳對應,則稱該局勢是壹個 納什均衡

如果壹個局中人的某個策略對其他局中人的任何策略都是最佳對應,那麽這個策略就是該局中人的 占優策略

在納什均衡下,局中人沒有人會想要改變改變,因為誰改變誰就可能在博弈中處於不利地位。

首先我們來看壹看在囚徒困境中納什均衡,對於囚徒困境的問題的納什均衡是 雙方都坦白 ,屬於占優策略

其實不管局中人 2 是抗拒還是坦白,對於局中人的最佳應對都是坦白。從而可以看出納什均衡點並不壹定是整體的最優解。有人可能會說那麽為什麽不是對於兩個人都有利的(抗拒,抗拒)呢,這裏最佳應對是無論對手進行策略對自己都是最佳策略,在最後 maxmin 時候就更會了解為什麽他們會做出坦白選擇,這是壹個規避風險的策略。

<img src="./image_003/005.jpg">

這就是純策略納什均衡,混合策略下納什均衡,女生看舞蹈概率 p 看足球的概率就是 1 - p,男生看舞蹈概率 q 看足球的概率就是 1 - q

妻子隨機性的目的: 使丈夫無機可乘,不管丈夫選擇哪個策略,其期望收益均相同

當丈夫給出概率分布不會讓妻子在看足球和看,關於

以我對丈夫了解他更喜歡看足球,

局中人 1 的策略選擇分布記為 , 局中人 2 的策略選擇分布記為 。假設局中人 1 的策略分布不變,局中人 2 策略選擇的效用為

剪刀—石頭—布的混合 納什均衡態

任何有限博弈(參與人與策略數目均為有限)都至少存在壹個納什均衡,這個均衡可能是純策略納什均衡(例如剪刀-石頭-布),也可能是混合策略均衡,納什均衡的多重性(例如性別之戰)

  • 上一篇:哪些明星虛報了身高?
  • 下一篇:有什麽好看的美劇?
  • copyright 2024編程學習大全網