博弈論是研究決策主體的行為發(fā)生直接相互作用時(shí)的決策以及這種決策的均衡,也就是說,當(dāng)一個(gè)主體的選擇受到其他主體選擇的影響,而且反過來影響到其他主體選擇時(shí)的決策問題和均衡問題。
一個(gè)完整的博弈應(yīng)當(dāng)包括五個(gè)方面的內(nèi)容:第一,博弈的參加者,即博弈過程中獨(dú)立決策、獨(dú)立承擔(dān)后果的個(gè)人和組織;第二,博弈信息,即博弈者所掌握的對(duì)選擇策略有幫助的情報(bào)資料;第三,博弈方可選擇的全部行為或策略的集合;第四,博弈的次序,即博弈參加者做出策略選擇的先后;第五,博弈方的收益,即各博弈方做出決策選擇后的所得和所失。
“囚徒困境”
“囚徒困境”是博弈論里最經(jīng)典的例子之一。講的是兩個(gè)嫌疑犯(A和B)作案后被警察抓住,隔離審訊;警方的政策是 " 坦白從寬,抗拒從嚴(yán) " ,如果兩人都坦白則各判8年;如果一人坦白另一人不坦白,坦白的放出去,不坦白的判10年;如果都不坦白則因證據(jù)不足各判1年。
在這個(gè)例子里,博弈的參加者就是兩個(gè)嫌疑犯A和B,他們每個(gè)人都有兩個(gè)策略即坦白和不坦白,判刑的年數(shù)就是他們的支付??赡艹霈F(xiàn)的四種情況:A和B均坦白或均不坦白、A坦白B不坦白或者B坦白A不坦白,是博弈的結(jié)果。A和B均坦白是這個(gè)博弈的納什均衡。這是因?yàn)?,假定A選擇坦白的話,B是選擇坦白,因?yàn)椋绿拱着?年而抵賴卻要判十年;假定A選擇抵賴的話,B還是選擇坦白,因?yàn)椋绿拱着胁槐慌行潭仲嚧_要被判刑1年。即是說,不管A坦白或抵賴,B的選擇都是坦白。反過來,同樣地,不管B是坦白還是抵賴,A的選擇也是坦白。結(jié)果,兩個(gè)人都選擇了坦白,各判刑8年。在(坦白、坦白)這個(gè)組合中,A和B都不能通過單方面的改變行動(dòng)增加自己的收益,于是誰也沒有動(dòng)力游離這個(gè)組合,因此這個(gè)組合是納什均衡。
囚徒困境反映了個(gè)人理性和集體理性的矛盾。如果A和B都選擇抵賴,各判刑1年,顯然比都選擇坦白各判刑8年好得多。當(dāng)然,A和B可以在被警察抓到之前訂立一個(gè) " 攻守同盟 " ,但是這可能不會(huì)有用,因?yàn)樗粯?gòu)成納什均衡,沒有人有積極性遵守這個(gè)協(xié)定。
關(guān)于完全理性的思考
囚徒困境博弈的一個(gè)假設(shè)是博弈方都是完全理性。完全理性來源于經(jīng)濟(jì)學(xué)中的理性人假設(shè),即博弈方都以個(gè)體利益化為目標(biāo),且有準(zhǔn)確的判斷選擇能力,也不會(huì)“犯錯(cuò)誤”。以個(gè)體利益為目標(biāo)被稱為“個(gè)體理性”,有完美的分析判斷能力和不會(huì)犯選擇行為的錯(cuò)誤稱為“完全理性”。完全理性包括追求利益的理性意識(shí)、分析推理能力、識(shí)別判斷能力、記憶能力和準(zhǔn)確行為能力等多方面的完美性要求,其中任何一方面不完美就不屬于完全理性。我們可以看出,這是一個(gè)要求非常嚴(yán)格的假設(shè)。即便如此,完全理性仍在一個(gè)方面沒有做出規(guī)定(至少是沒有意識(shí)到或明確地規(guī)定出來),就是思維方式,也即是博弈方是以將問題分解的方式來思考問題呢,還是以系統(tǒng)的整體的方式來思考問題的。
一個(gè)完整的博弈應(yīng)當(dāng)包括五個(gè)方面的內(nèi)容:第一,博弈的參加者,即博弈過程中獨(dú)立決策、獨(dú)立承擔(dān)后果的個(gè)人和組織;第二,博弈信息,即博弈者所掌握的對(duì)選擇策略有幫助的情報(bào)資料;第三,博弈方可選擇的全部行為或策略的集合;第四,博弈的次序,即博弈參加者做出策略選擇的先后;第五,博弈方的收益,即各博弈方做出決策選擇后的所得和所失。
“囚徒困境”
“囚徒困境”是博弈論里最經(jīng)典的例子之一。講的是兩個(gè)嫌疑犯(A和B)作案后被警察抓住,隔離審訊;警方的政策是 " 坦白從寬,抗拒從嚴(yán) " ,如果兩人都坦白則各判8年;如果一人坦白另一人不坦白,坦白的放出去,不坦白的判10年;如果都不坦白則因證據(jù)不足各判1年。
在這個(gè)例子里,博弈的參加者就是兩個(gè)嫌疑犯A和B,他們每個(gè)人都有兩個(gè)策略即坦白和不坦白,判刑的年數(shù)就是他們的支付??赡艹霈F(xiàn)的四種情況:A和B均坦白或均不坦白、A坦白B不坦白或者B坦白A不坦白,是博弈的結(jié)果。A和B均坦白是這個(gè)博弈的納什均衡。這是因?yàn)?,假定A選擇坦白的話,B是選擇坦白,因?yàn)椋绿拱着?年而抵賴卻要判十年;假定A選擇抵賴的話,B還是選擇坦白,因?yàn)椋绿拱着胁槐慌行潭仲嚧_要被判刑1年。即是說,不管A坦白或抵賴,B的選擇都是坦白。反過來,同樣地,不管B是坦白還是抵賴,A的選擇也是坦白。結(jié)果,兩個(gè)人都選擇了坦白,各判刑8年。在(坦白、坦白)這個(gè)組合中,A和B都不能通過單方面的改變行動(dòng)增加自己的收益,于是誰也沒有動(dòng)力游離這個(gè)組合,因此這個(gè)組合是納什均衡。
囚徒困境反映了個(gè)人理性和集體理性的矛盾。如果A和B都選擇抵賴,各判刑1年,顯然比都選擇坦白各判刑8年好得多。當(dāng)然,A和B可以在被警察抓到之前訂立一個(gè) " 攻守同盟 " ,但是這可能不會(huì)有用,因?yàn)樗粯?gòu)成納什均衡,沒有人有積極性遵守這個(gè)協(xié)定。
關(guān)于完全理性的思考
囚徒困境博弈的一個(gè)假設(shè)是博弈方都是完全理性。完全理性來源于經(jīng)濟(jì)學(xué)中的理性人假設(shè),即博弈方都以個(gè)體利益化為目標(biāo),且有準(zhǔn)確的判斷選擇能力,也不會(huì)“犯錯(cuò)誤”。以個(gè)體利益為目標(biāo)被稱為“個(gè)體理性”,有完美的分析判斷能力和不會(huì)犯選擇行為的錯(cuò)誤稱為“完全理性”。完全理性包括追求利益的理性意識(shí)、分析推理能力、識(shí)別判斷能力、記憶能力和準(zhǔn)確行為能力等多方面的完美性要求,其中任何一方面不完美就不屬于完全理性。我們可以看出,這是一個(gè)要求非常嚴(yán)格的假設(shè)。即便如此,完全理性仍在一個(gè)方面沒有做出規(guī)定(至少是沒有意識(shí)到或明確地規(guī)定出來),就是思維方式,也即是博弈方是以將問題分解的方式來思考問題呢,還是以系統(tǒng)的整體的方式來思考問題的。