主頁 > 百科知識 > 什么是博弈論

什么是博弈論

時(shí)間:2024-12-17 03:00:01 瀏覽量:

博弈論又被稱為對策論文它是現(xiàn)代數(shù)學(xué)的一個(gè)新分支,也是運(yùn)籌學(xué)的一個(gè)重要組成內(nèi)容。

在《博弈》中寫到:博弈論是二人在平等的對局中各自利用對方的策略變換自己的對抗策略,達(dá)到取勝的意義。博弈論就是研究互動決策的理論。所謂互動決策,即各行動方的決策是相互影響的,每個(gè)人在決策的時(shí)候必須將他人的決策納入自己的決策考慮之中,當(dāng)然也需要把別人對于自己的考慮也要納入自己考慮,在如此迭**慮情形進(jìn)行決策,選擇最有利于自己的戰(zhàn)略。

博弈論的英文名字是:game theory。 顧名思義,就是做游戲的理論。這個(gè)游戲可以是我們正常理解的棋牌類游戲,也可以是電腦游戲,甚至打籃球踢足球這樣的游戲。簡單來講,博弈論就是告訴我們怎么玩贏這些游戲的理論。

(圖源:https://baike.baidu.com/item/%E5%8D%9A%E5%BC%88%E8%AE%BA/81545 )

先給出一段簡短的歷史吧。1928年,馮·諾依曼證明了博弈論的基本原理,宣告了博弈論的正式誕生。1944年,馮·諾依曼和摩根斯坦著成《博弈論與經(jīng)濟(jì)行為》將二人博弈推廣到n人博弈結(jié)構(gòu)并將博弈論系統(tǒng)地應(yīng)用于經(jīng)濟(jì)領(lǐng)域,奠定了這一學(xué)科的基礎(chǔ)和理論體系。1950-1951年,約翰·福布斯·納什(John Forbes Nash Jr)利用不動點(diǎn)定理證明了均衡點(diǎn)的存在,為博弈論的一般化奠定了堅(jiān)實(shí)的基礎(chǔ)。納什的論文《n人博弈的均衡點(diǎn)》(1950),《非合作博弈》(1951)等等,給出了納什均衡的概念和均衡存在定理。

馮·諾依曼

約翰·福布斯·納什

用一個(gè)最典型的例子來講,囚徒困境(prisoner's dilemma):

警方逮捕甲、乙兩名嫌疑犯,但沒有足夠證據(jù)指控二人有罪。于是警方分開囚禁嫌疑犯,分別和二人見面,并向雙方提供以下相同的選擇:

若一人認(rèn)罪并作證檢控對方(相關(guān)術(shù)語稱“背叛”對方),而對方保持沉默,此人將即時(shí)獲釋,沉默者將判監(jiān)10年,

若二人都保持沉默(相關(guān)術(shù)語稱互相“合作”),則二人同樣判監(jiān)2年,

若二人都互相認(rèn)罪(互相“背叛”),則二人同樣判監(jiān)5年。

(圖源:https://www.eisland.com.tw/Main.php?stat=a_pggZeHx)

博弈論有三大要素:

參與者,player:參與者需要作出動作,例子中的“甲”和“乙”;

動作空間,action space:參與者可以做的動作,例子中的“合作”和“被判”;

收益矩陣,payoff matrix:對應(yīng)每一個(gè)可能的結(jié)果的每個(gè)人的收益,例子中矩陣中的值,對應(yīng)參與者所獲得的收益。

博弈論需要解決的問題是:

如果你是“甲”或者“乙”,你需要做什么來最大化自己的收益?

如果你是旁觀者,你覺得這個(gè)博弈最可能出現(xiàn)的結(jié)果是什么?

在給的這個(gè)例子中,最可能出現(xiàn)的結(jié)果就是:甲和乙都選擇背叛。因?yàn)槿绻闶羌祝氵x擇合作,乙會選擇背叛;你選擇背叛,乙也會選擇背叛——那么你肯定選擇背叛;而乙也是這么想的。在這個(gè)情況下,沒有人可以通過改變自己的策略來提高自己的收益,這被稱為納什均衡(Nash equilibrium)。

——所以這兩人在牢里度過了兩年相親相愛的日子。

(圖源:https://www.***.com/watch?v=1cCS8RMtK7g)

上面這只是最簡單的一個(gè)例子。這個(gè)例子中甲和乙是互相競爭的,這被稱為“非合作博弈(noncooperative game)”,同時(shí)因?yàn)樗麄兊氖找婕悠饋聿坏昧悖砸步小胺橇愫筒┺模╣eneral-sum game)”。但是如果甲和乙在擲骰子,甲贏了5塊錢,乙就得輸5塊錢,這個(gè)就被稱為“零和博弈(zero-sum game)”。因?yàn)檫@里面只有兩個(gè)人,所以也叫“兩人博弈(two-player game)”,如果被抓的多于兩個(gè)人,就被成為“多人博弈(multi-player game)”。我們還可以給這個(gè)例子加上很多的條件,來變成博弈論的其他變體:

如果甲和乙不是最大化自己的收益,而是最大化總的收益呢?這個(gè)對應(yīng)的是合作博弈(cooperative game)。

如果甲和乙不是同時(shí)做出動作,而是甲先做動作,乙看到甲的動作之后再做動作呢?這個(gè)對應(yīng)的是“序貫博弈(sequential game)”。

如果甲和乙不是做一次博弈,而是做好多次呢?這個(gè)對應(yīng)“重復(fù)博弈(repeated game)”。

所以還可以有很多的變體,這些都屬于博弈論的范疇。

(圖源:https://wiki.mbalib.com/wiki/%E5%8D%9A%E5%BC%88%E8%AE%BA)

博弈論現(xiàn)在已經(jīng)廣泛地應(yīng)用在經(jīng)濟(jì)學(xué)領(lǐng)域。目前在生物學(xué)、經(jīng)濟(jì)學(xué)、國際關(guān)系、計(jì)算機(jī)科學(xué)、政治學(xué)、軍事戰(zhàn)略和其他很多學(xué)科都有廣泛的應(yīng)用。

© 轉(zhuǎn)乾企業(yè)管理-上海店鋪裝修報(bào)建公司 版權(quán)所有 | 黔ICP備2023009682號

免責(zé)聲明:本站內(nèi)容僅用于學(xué)習(xí)參考,信息和圖片素材來源于互聯(lián)網(wǎng),如內(nèi)容侵權(quán)與違規(guī),請聯(lián)系我們進(jìn)行刪除,我們將在三個(gè)工作日內(nèi)處理。聯(lián)系郵箱:303555158#QQ.COM (把#換成@)