不完全信息動態(tài)博弈
1.什么是不完全信息動態(tài)博弈
在動態(tài)博弈中,行動有先后次序;在不完全信息條件下,博弈的每一參與人知道其他參與人的有哪幾種類型以及各種類型出現(xiàn)的概率,即知道“自然”參與人的不同類型與相應(yīng)選擇之間的關(guān)系,但是,參與人并不知道其他的參與人具體屬于哪一種類型。由于行動有先后順序,后行動者可以通過觀察先行動者的行為,獲得有關(guān)先行動者的信息,從而證實或修正自己對先行動者的行動。
在不完全信息動態(tài)博弈一開始,某一參與人根據(jù)其他參與人的不同類型及其所屬類型的概率分布,建立自己的初步判斷。當(dāng)博弈開始后,該參與人就可以根據(jù)他所觀察到的其他參與人的實際行動,來修正自己的初步判斷。并根據(jù)這種不斷變化的判斷,選擇自己的策略。
2.相關(guān)例子
以下是幾個關(guān)于不完全信息動態(tài)博弈的例子:
- 1.黔驢技窮
精煉貝葉斯均衡是完全信息動態(tài)博弈的子博弈精煉納什均衡與不完全信息靜態(tài)博弈的貝葉斯納什均衡的結(jié)合。貝葉斯方法是概率統(tǒng)計中的一種分析方法。它是指根據(jù)所觀察到現(xiàn)象的有關(guān)特征,并對有關(guān)特征的概率分布的主觀判斷(即先驗概率)進(jìn)行修正的標(biāo)準(zhǔn)方法。中國著名成語故事黔驢技窮,就是貝葉斯方法思想的一個典型表達(dá)。
老虎沒有見過驢子,因而不知道自己比驢子強還是弱。老虎的戰(zhàn)略是:如果自己弱,那就只能躲,如果自己強,那就吃驢子。對于自己并不了解驢子,老虎的做法是不斷試探,通過試探,修改自己對驢子的看法。如果驢子表現(xiàn)溫順無能,老虎就認(rèn)為驢子是美食的概率比較大,起初驢子沒有反應(yīng),老虎認(rèn)為驢子不像強敵,膽子越來越大。后來驢子大叫,老虎以為驢子要吃它,嚇的逃走,但后來想想,又覺得不一定,于是繼續(xù)試探,直到驢子踢老虎,老虎才覺得驢子“僅此技耳”,于是采取自己強時的最優(yōu)行動——吃驢子。
- 2.信號傳遞
由于信息不完全,每個人都希望向?qū)Ψ絺鬟f對自己有利的信號。比如,在招聘時,應(yīng)聘者總是顯示自己最好的一面。談判中,企業(yè)總是把最能顯示自己實力的一面展示出來。公司越來越注意企業(yè)形象的塑造。女孩子總是把自己打扮得漂亮。人們總是把最好的衣服穿在外面。等等。問題是,對方不一定相信你所傳遞的信號是真實的。有的信號,一下子是難以識別真?zhèn)蔚模枰獣r間。所以,“百年老店”是最好的信號傳遞方式。
曾經(jīng)有幾家美國的企業(yè)聯(lián)合控告日本公司傾銷,美國法院的判決是:控告不成立,因為不可能有哪家公司能夠長期采用低于成本的價格。所以,長期采取低價策略的企業(yè)傳遞的信號是:我是低成本的,你成本高,別來。
長期在CCTV黃金時段做廣告的廠商傳遞的信號是:我有實力,企業(yè)經(jīng)營一直不錯。出示自己的高學(xué)歷證書和各種獲獎證書的求職者傳遞的信號是:我是一個優(yōu)秀的應(yīng)聘者。有的小公司對業(yè)務(wù)采取不冷不熱的態(tài)度,傳遞的信號是:我不愁沒業(yè)務(wù)做。故意裝著要離開的顧客傳遞的信號是,把價格再降點,否則我走了。初戀時經(jīng)常找不怎么符合邏輯的借口去找對方但又不說出口,傳遞的信號是,我對你有意思,你呢?當(dāng)然指望是對方先說出來。
由于對方不一定相信你傳遞的信號,而甄別信號需要成本,所以,一定要傳遞可信(可觀測)、并且甄別成本低的信號。
為什么招聘單位看重學(xué)歷,因為學(xué)歷容易甄別,而且比起能力的描述來,相對可靠;為什么顧客喜歡買名牌產(chǎn)品,因為名牌是經(jīng)過很多年才形成的,廣告、產(chǎn)品質(zhì)量、服務(wù)質(zhì)量等因素起了很大的作用,名牌傳遞的信號就是:質(zhì)量好,服務(wù)好。
教育信號傳遞模型是分析勞動力市場上工人的教育水平如何傳遞有關(guān)能力的信息的模型。在這個模型里,企業(yè)的生產(chǎn)率取決于工人的能力。工人的能力可能高可能低,工人本人知道,雇主不知道;教育本身不改進(jìn)工人的能力,但卻可以傳遞有關(guān)這種能力的信息,原因是,教育要花費成本,而高能力的人的教育成本相對于低能力的人的要低,因為一個笨蛋要比一個聰明人遭受更大的痛苦才能完成必修的課程,拿到文憑。這樣,文憑就成為能力的象征,盡管它不一定是能力的源泉。高能力的人要把自己與低能力的人分開,就要選擇受更多的教育,企業(yè)看到受過教育的人就推斷是高能力,支付高工資。如果這個模型是正確的話,我們也許不應(yīng)該簡單地因為所學(xué)內(nèi)容無用就否定一種教育制度,如中國古代社會的科舉制度,它或許也具有信號傳遞的功能。
一種行動要起到某種傳遞信息的功能,行動者必須為此付出足夠的成本,否則,所有其他類型的參與者都會模仿。這也就是說,只有負(fù)擔(dān)成本的行動才是可信的。簡單地告訴對方“我是低成本企業(yè)”、“我是強者”、“我是好人”、“我是高能力的人”之所以不傳遞信息,就是因為這類“行動”不花成本,誰都可以效仿。低成本企業(yè)要把自己與高成本企業(yè)分開從而阻止進(jìn)入者進(jìn)入,就得定一個比短期壟斷價格低的價格犧牲一部分短期利潤;強者要把自己與弱者分開以免遭持強欺弱者的進(jìn)攻,就要吃比一般情況下多的辣椒;好人要把自己與壞人分開,就得干更多更大的好事;高能力的人要把自己與低能力的人分開,就得接受沒有實際價值的教育,如此等等。
這種為傳遞信息支付的成本是由信息的不完全性導(dǎo)致的。那么,是不是說不完全信息就一定是件壞事呢?不一定。在有限次重復(fù)囚徒困境博弈中,不完全信息可以導(dǎo)致合作的后果,而在完全信息下是不可能的,理由是,當(dāng)信息不完全時,當(dāng)事人為了獲得合作帶來的長期利益,不愿過早地暴露自己的本性。說得更通俗一點,在一種長期的關(guān)系中,一個人干好事還是壞事常常不取決他在本性上是好人還是壞人,而很大程度上取決于其他人在多大程度上認(rèn)為他是好人。給定其他人并不知道自己的真實面目,一個壞人也會在相當(dāng)長的時間內(nèi)干好事。從這個意義上講,過早地揭穿壞人的“真面目”也許不是一件好事,因為壞人干好事本身并不一定是件壞事。當(dāng)然,在博弈的最后階段,壞人的真實面目總是要暴露的,這就是我們常說的“路遙知馬力,日久見人心”。