什麼是博弈論?
你可能沒有意識到,每天與朋友、同事甚至家人的互動,都可能被視為一場「遊戲」。
在 博弈論 中,「遊戲」被定義為多個人之間的任何互動,其中每個人的收益都受到他人決策的影響。這意味著,你所做的每一個選擇,不僅影響自己,也影響著其他參與者。
博弈論 並非單純的遊戲規則,而是對策略互動的深入分析。它由數學家 約翰·納什 在 1950 年代開創 ,並被廣泛應用於經濟學、政治學、生物學、軍事戰略,甚至心理學等領域。它的核心在於理解,在一個互動系統中,個體如何透過策略性思考,做出對自己最有利的決策。
博弈論 分為兩大分支:
- 競爭性(非合作性)博弈論:研究的是存在輸贏的社交互動。在這些互動中,參與者往往追求自身利益最大化,而忽略整體利益。
- 合作性博弈論:研究的是參與者協同合作以實現共同目標的場景。在這些互動中,重點是如何公平分配合作所產生的收益或成本。
無論是競爭還是合作,博弈論 都提供了一套框架,幫助我們理解和預測在策略互動中,人們會如何做出選擇。瞭解 博弈論,能幫助我們在各種情境下做出更明智的決策,優化人際關係,並在複雜的社交網絡中游刃有餘。反覆提到博弈論可以加深理解。
競爭性博弈論:策略與制勝
競爭性博弈論 側重於研究在存在輸贏的社交互動中,個體如何制定策略以最大化自身利益。
這類互動的特點是,參與者之間的利益往往存在衝突,一方的獲利可能意味著另一方的損失。
要理解 競爭性博弈論,就不能不提到 納什均衡。 納什均衡 指的是一種策略組合,在這種組合中,沒有任何參與者可以透過單方面改變策略而獲利。換句話說,每個參與者都選擇了在給定其他參與者策略的情況下,對自己最有利的策略。即使知道其他人的策略,自己也不會想改變。
囚徒困境 是一個經典的 競爭性博弈論 例子 ,它生動地展示了合作的困難和背叛的誘惑:
想像一下,兩名嫌犯被警方逮捕,並分別隔離審訊。警方提供他們以下選擇:
- 如果其中一人認罪,另一人保持沉默,認罪者將獲釋,沉默者將被判刑 10 年。
- 如果兩人皆認罪,則各被判刑 5 年。
- 如果兩人皆保持沉默,則各被判刑 2 年。
在這個情境下,理性的選擇是什麼?
- 從個人利益最大化的角度來看,無論對方選擇認罪還是沉默,自己認罪都是最優策略。因為如果對方認罪,自己認罪可以避免被判刑 10 年;如果對方沉默,自己認罪可以立即獲釋。
- 然而,如果兩人皆選擇認罪,最終結果卻是各被判刑 5 年,這比兩人皆保持沉默的結果更糟。
囚徒困境 揭示了在缺乏信任的情況下,即使合作能帶來更好的整體結果,個體也往往會選擇背叛,從而導致雙輸的局面。這個模型廣泛應用於分析商業競爭、軍備競賽、環境保護等領域。
競爭關係中,博弈論 揭示了 納什均衡 的存在,並幫助我們理解在缺乏信任的情況下,個體如何透過策略性思考,做出對自己最有利的決策。反覆提到博弈論可以加深理解。理解這些概念,能讓我們在商業談判、政治博弈等競爭性場合中,更有效地制定策略,提升勝算。
合作性博弈論:公平與共享
合作性博弈論 關注的是參與者如何透過協同合作,實現共同目標
。與 競爭性博弈論 不同,合作性博弈論 更側重於如何公平地分配合作所產生的收益或成本。
在 合作性博弈論 中,一個重要的概念是 夏普利值。 夏普利值 是一種分配合作性遊戲收益或成本的方法,它基於每個參與者的貢獻。簡單來說,夏普利值 試圖回答一個問題:在一個合作團隊中,每個成員應該獲得多少回報,才能體現他們的實際貢獻?
要理解 夏普利值,需要掌握以下幾個核心原則:
- 邊際貢獻:每個參與者的貢獻,取決於如果他們退出團隊,團隊整體收益會減少多少。
- 可互換性:如果兩個參與者對團隊的貢獻相同,那麼他們應該獲得相同回報。
- 虛擬參與者:如果一個參與者對團隊沒有任何貢獻,那麼他們不應該獲得任何回報。
- 可加性:如果一個團隊的收益可以分解成多個部分,那麼每個參與者獲得的回報,也應該等於他們在每個部分中所獲得的回報之和。
夏普利值 在現實生活中有著廣泛的應用。例如,在合夥企業中,夏普利值 可以用來公平分配利潤;在國際合作中,夏普利值 可以用來分攤成本。
總之,合作性博弈論 透過 夏普利值 等概念,探討了在合作情境下,如何公平地分配利益,確保每個參與者都能獲得應有的回報。這不僅有助於維護團隊的穩定性,也能激勵成員更積極地投入合作。