支招政治復習學博弈論理性思考

字號：小 中 大

博弈論是研究決策主體的行為發(fā)生直接相互作用時的決策以及這種決策的均衡，也就是說，當一個主體的選擇受到其他主體選擇的影響，而且反過來影響到其他主體選擇時的決策問題和均衡問題。
    一個完整的博弈應當包括五個方面的內容：第一，博弈的參加者，即博弈過程中獨立決策、獨立承擔后果的個人和組織；第二，博弈信息，即博弈者所掌握的對選擇策略有幫助的情報資料；第三，博弈方可選擇的全部行為或策略的集合；第四，博弈的次序，即博弈參加者做出策略選擇的先后；第五，博弈方的收益，即各博弈方做出決策選擇后的所得和所失。
    “囚徒困境”
    “囚徒困境”是博弈論里最經(jīng)典的例子之一。講的是兩個嫌疑犯（Ａ和Ｂ）作案后被警察抓住，隔離審訊；警方的政策是 " 坦白從寬，抗拒從嚴 " ，如果兩人都坦白則各判8年；如果一人坦白另一人不坦白，坦白的放出去，不坦白的判10年；如果都不坦白則因證據(jù)不足各判1年。
    在這個例子里，博弈的參加者就是兩個嫌疑犯Ａ和Ｂ，他們每個人都有兩個策略即坦白和不坦白，判刑的年數(shù)就是他們的支付?？赡艹霈F(xiàn)的四種情況：Ａ和Ｂ均坦白或均不坦白、Ａ坦白Ｂ不坦白或者Ｂ坦白Ａ不坦白，是博弈的結果。Ａ和Ｂ均坦白是這個博弈的納什均衡。這是因為，假定Ａ選擇坦白的話，Ｂ是選擇坦白，因為Ｂ坦白判8年而抵賴卻要判十年；假定Ａ選擇抵賴的話，Ｂ還是選擇坦白，因為Ｂ坦白判不被判刑而抵賴確要被判刑1年。即是說，不管Ａ坦白或抵賴，Ｂ的選擇都是坦白。反過來，同樣地，不管Ｂ是坦白還是抵賴，Ａ的選擇也是坦白。結果，兩個人都選擇了坦白，各判刑8年。在（坦白、坦白）這個組合中，Ａ和Ｂ都不能通過單方面的改變行動增加自己的收益，于是誰也沒有動力游離這個組合，因此這個組合是納什均衡。
    囚徒困境反映了個人理性和集體理性的矛盾。如果Ａ和Ｂ都選擇抵賴，各判刑1年，顯然比都選擇坦白各判刑8年好得多。當然，Ａ和Ｂ可以在被警察抓到之前訂立一個 " 攻守同盟 " ，但是這可能不會有用，因為它不構成納什均衡，沒有人有積極性遵守這個協(xié)定。
    關于完全理性的思考
    囚徒困境博弈的一個假設是博弈方都是完全理性。完全理性來源于經(jīng)濟學中的理性人假設，即博弈方都以個體利益化為目標，且有準確的判斷選擇能力，也不會“犯錯誤”。以個體利益為目標被稱為“個體理性”，有完美的分析判斷能力和不會犯選擇行為的錯誤稱為“完全理性”。完全理性包括追求利益的理性意識、分析推理能力、識別判斷能力、記憶能力和準確行為能力等多方面的完美性要求，其中任何一方面不完美就不屬于完全理性。我們可以看出，這是一個要求非常嚴格的假設。即便如此，完全理性仍在一個方面沒有做出規(guī)定（至少是沒有意識到或明確地規(guī)定出來），就是思維方式，也即是博弈方是以將問題分解的方式來思考問題呢，還是以系統(tǒng)的整體的方式來思考問題的。

支招政治復習 學博弈論 理性思考

字號： 小 中 大

支招政治復習學博弈論理性思考

字號：小中大