假設有n個局中人參與博弈,給定其他人的策略,每個局中人選擇自己的納什均衡最優策略(個體最優策略可能依賴也可能不依賴其他人的策略),使自己的利益最大化。所有玩家的策略構成壹個策略剖面。納什均衡就是指這樣壹種戰略組合,由所有參與者的最優策略組成。也就是給定別人的策略,沒有人有足夠的理由打破這個均衡。納什均衡,本質上是壹種非合作博弈狀態。
當達到納什均衡時,並不意味著博弈雙方都處於不動狀態。在順序遊戲中,這種均衡是在玩家的連續動作和反應中實現的。納什均衡並不意味著博弈雙方達到了整體最優狀態。下面的囚徒困境就是壹個例子。
假設甲、乙兩個小偷共同作案,私自入室,被警察抓住。警察把這兩個人放在兩個不同的房間裏審訊。對於每個嫌疑人,警方給出的政策是:如果壹個嫌疑人供認了自己的罪行,並交出了贓物,納什均衡被證明是確鑿的,兩人都被定罪。如果另壹名嫌疑人也供認不諱,他們各被判處8年徒刑;如果另壹個犯罪嫌疑人在沒有坦白的情況下否認,會以妨礙公務罪(因為有證據證明他有罪)再判兩年有期徒刑,坦白者減刑八年後立即釋放。如果兩人都否認,警方因證據不足不能判他們盜竊罪,但可以以非法侵入罪各判1年有期徒刑。
囚徒困境遊戲
╲坦率地否認了這壹點。
表白-8,-80,-10
拒絕-10,0-1,-1
關於案件,很明顯最佳策略是雙方都否認,結果大家都只判了1年。但由於兩人的隔絕,首先從心理學角度來看,雙方都會懷疑對方為了自保而背叛自己,其次亞當·斯密的理論假設每個人都是“理性經濟人”,都會以利己為目的做出選擇。這兩個人會有這樣壹個計算過程:如果他招供,我就否認,我要坐牢10年,招供最多也就8年;如果他否認,我可以被釋放,他要坐牢10年。考慮到以上情況,無論他是否坦白,我坦白都是劃算的。兩個人都會用這樣的腦子。最終,兩人都選擇了坦白,被判處有期徒刑八年。
基於經濟學中理性代理人的前提,兩個囚犯在各自利益上的選擇是坦白,不坦白就放了,原本對雙方都有利的策略就不會出現。就這樣,兩人都選擇了坦白的策略,被判了八年監禁。納什均衡首先挑戰了亞當·斯密的“看不見的手”原理:根據斯密的理論,在市場經濟中,每個人都是從利己的目的出發,最終整個社會達到利他的效果。但是,我們可以從納什均衡中得出壹個“看不見的手”原理的悖論:從利己目的出發,結果會是損人不利己,對自己無益。
還有亞當·斯密的理論,妳可以下載。