逆向歸納法backardinduction)
逆向歸納法是一種常用於動態博弈的求解方法,核心思想是從博弈的最後階段開始推導,逐步回溯,找到最優策略。es),尤其是在完全信息動態博弈中,即所有參與者都知道遊戲規則和其他玩家的可能選擇。
逆向歸納法的基本步驟
1.從最後一步開始分析:假設已經到達博弈的最後一個決策節點,找出在此節點上每個玩家的最優策略。
2.回溯至前一步:假設前一個決策者知道後續的最優選擇,並據此做出最優決策。
3.重複以上過程,直至回溯到起點:最終得出的策略就是整個博弈的最優均衡解。
atugae)
假設有兩個玩家:
?a玩家分配100元,決定給b玩家多少錢整數)。
?b玩家可以選擇接受aept)或拒絕reject):
?如果接受,雙方按a的分配拿錢。
?如果拒絕,雙方都拿不到錢。
逆向歸納分析
1.b的決策最後一步):
?如果b接受,他能獲得分配到的錢。
?如果b拒絕,雙方都拿不到錢。
?理性b玩家應接受任何非零金額,因為比0更好。
2.a的決策回溯):
?a知道b會接受任何非零金額,所以a的最優策略是給b最少的錢如1元),自己拿99元。
結論:a分1元,b接受,這是均衡策略。
2.進入威脅博弈entrydeterrencegae)
假設一個新企業e)考慮進入市場,而已有企業i)可以選擇降價競爭fierce)或維持高價aodate)。
博弈樹
1.e決定是否進入市場:
?進入enter)
?不進入stayout)
2.如果e進入,i決定策略:
?降價fierce):i和e都虧損10。odate):i賺10,e賺5。
?e不進入stayout):i獨占市場,賺15,e賺0。
逆向歸納分析
1.i的決策最後一步):
?如果e已進入,i在降價10)和高價10)之間選擇,高價更優,所以i會選擇高價。
2.e的決策回溯):
?知道i不會降價,e進入後可以賺5比0好),所以e會進入市場。
結論:e進入,i維持高價,這是均衡策略。e)
假設有兩個玩家輪流決定“拿走take)”還是“繼續pass)”獎金池:
?初始獎金池2元,每輪增加。
?如果某人“拿走”,他獲得大部分獎金,另一個人獲得少部分。
?遊戲最多持續4輪。
逆向歸納分析
1.最後一輪:
?若輪到玩家b,他會“拿走”,因為這是他的最後機會。
2.倒數第二輪:
?玩家a知道b會在下一輪拿走,因此他會在這一輪就拿走。
3.第三輪:
?玩家b知道a會在下一輪拿走,因此他會在這一輪就拿走。
4.回溯至第一輪:
?a知道b在下一輪會拿走,所以a在第一輪就拿走。
結論:儘管合作能讓獎金池增大,但完全理性玩家會在第一輪就終止遊戲。
總結
?逆向歸納法適用於有限步動態博弈,從最後一步開始推導。
?它能幫助玩家預見對手的最優策略,做出最優決策。
?適用於終局博弈、市場進入、談判、競標等策略決策。
逆向歸納法的應用
逆向歸納法廣泛應用於經濟、商業、政治、軍事、人工智能等領域,特彆適用於動態決策問題,即決策者的選擇會影響未來的結果。以下是幾個典型的應用場景:
1.經濟與商業
(1)定價策略
企業在製定長期定價策略時,會考慮競爭對手的反應。例如:
?掠奪性定價predatorypricing):