Chiến thuật lý thuyết trò chơi tiên tiến cho việc ra quyết định

Chiến lược kinh doanh - Vận dụng kế sách Ve sầu thoát xác trong kinh doanh (Tháng Chín 2024)

Chiến lược kinh doanh - Vận dụng kế sách Ve sầu thoát xác trong kinh doanh (Tháng Chín 2024)
Chiến thuật lý thuyết trò chơi tiên tiến cho việc ra quyết định

Mục lục:

Anonim

Lý thuyết trò chơi, nghiên cứu về ra quyết định chiến lược, tập hợp các nguyên tắc khác nhau như toán học, tâm lý học và triết học. Lý thuyết trò chơi được sáng tạo bởi John von Neumann và Oskar Morgenstern vào năm 1944 và đã đi một chặng đường dài kể từ đó. Tầm quan trọng của lý thuyết trò chơi đối với phân tích và ra quyết định hiện đại có thể được đánh giá bởi thực tế từ năm 1970, có tới 12 nhà kinh tế học và nhà khoa học hàng đầu đã được trao giải Nobel về Khoa học Kinh tế vì những đóng góp của họ cho lý thuyết trò chơi.

Lý thuyết trò chơi được áp dụng trong một số lĩnh vực bao gồm kinh doanh, tài chính, kinh tế, khoa học chính trị và tâm lý học. Hiểu được các chiến lược lý thuyết trò chơi - cả phổ biến và một số các chiến lược tương đối ít được biết đến - là điều quan trọng để nâng cao kỹ năng lập luận và ra quyết định của một người trong một thế giới phức tạp.

Trận lưỡng nan của Tù nhân - Tóm lại

Một trong những chiến thuật lý thuyết trò chơi phổ biến nhất và cơ bản là Thói nghiện ngập của Prisoner. Khái niệm này khám phá chiến lược ra quyết định của hai cá nhân, bằng cách hành động theo lợi ích cá nhân riêng của mình, kết thúc với kết quả tồi tệ hơn nếu họ đã hợp tác với nhau ở nơi đầu tiên.

Trong tình trạng tiến thoái lưỡng nan của tù nhân, hai nghi phạm đã bị bắt giữ vì tội đã được giữ trong các phòng riêng biệt và không thể giao tiếp với nhau. Công tố viên thông báo riêng cho từng người rằng nếu anh ta (gọi anh ta là nghi can 1) thú nhận và làm chứng với người kia, anh ta có thể tự do, nhưng nếu anh ta không hợp tác và nghi ngờ 2, nghi can 1 sẽ bị kết án 3 năm tù. Nếu cả hai đều thú nhận, họ sẽ bị phạt hai năm, và nếu không thú nhận, họ sẽ bị kết án 1 năm tù.

Trong khi hợp tác là chiến lược tốt nhất cho hai nghi phạm, khi đối mặt với tình trạng tiến thoái lưỡng nan như vậy, các nghiên cứu cho thấy hầu hết những người có lý trí muốn thú nhận và làm chứng chống lại người kia hơn là im lặng và có cơ hội rằng bên kia thú nhận.

Chiến lược Lý thuyết Trò chơi

Trận lưỡng nan của Tù nhân là nền tảng cho các chiến thuật lý thuyết trò chơi tiên tiến, trong đó các trò chơi phổ biến bao gồm:

Kết hợp Pennies

: Đây là một trò chơi không có tổng số bao gồm hai cầu thủ Người chơi A và Người chơi B) đồng thời đặt một đồng xu trên bàn, với khoản hoàn trả tùy thuộc vào việc đồng xu có khớp hay không. Nếu cả hai đồng xu là đầu hoặc đuôi, Người chơi A thắng và giữ đồng tiền của Người chơi B. Nếu họ không khớp, cầu thủ B sẽ thắng và giữ tiền của cầu thủ A.

Bế tắc : Đây là tình huống tiến thoái lưỡng nan về xã hội như Thói nghiện ngập của Prisoner ở hai người chơi đó có thể hợp tác hoặc khiếm khuyết (i.e. không hợp tác). Trong Deadlock, nếu cả hai cầu thủ A và cầu thủ B đều hợp tác, họ đều có được 1 điểm và nếu cả hai đều khiếm khuyết, họ đều có được 2 điểm. Nhưng nếu cầu thủ A hợp tác và cầu thủ B bị lỗi, thì A sẽ được hưởng 0 và B sẽ nhận được 3. Trong biểu đồ hoàn trả dưới đây, chữ số đầu tiên trong ô từ a đến d đại diện cho phần thưởng của cầu thủ A và số thứ hai là của Player B:

Ma trận trả dứt hạn < Người chơi B Hợp tác

Defect

Người chơi A

Hợp tác

(a) 1, 1

(b) 0, 3

Defect

(c) 3 , 0

(d) 2, 2

Bế tắc khác với tình trạng tiến thoái lưỡng nan của Prisoner vì hành động có lợi ích lớn nhất (cả hai khiếm khuyết) cũng là chiến lược chi phối. Một chiến lược chi phối cho một cầu thủ được định nghĩa là chiến lược có thể mang lại hiệu quả cao nhất cho bất kỳ chiến lược sẵn có nào, bất kể các chiến lược được sử dụng bởi các cầu thủ khác.

Một ví dụ điển hình của Bế tắc là trích dẫn của hai cường quốc hạt nhân đang cố gắng đạt được thỏa thuận để loại bỏ các kho vũ khí hạt nhân của họ. Trong trường hợp này, hợp tác có nghĩa là tuân thủ thỏa thuận, trong khi đào tào có nghĩa là vi phạm bí mật về thỏa thuận và duy trì kho vũ khí hạt nhân. Kết quả tốt nhất cho cả hai nước là không tôn trọng thỏa thuận và duy trì lựa chọn hạt nhân trong khi quốc gia khác loại bỏ kho vũ khí, vì điều này sẽ tạo ra lợi thế ẩn giấu to lớn đối với nước này nếu chiến tranh bùng nổ giữa hai nước. Lựa chọn thứ hai tốt nhất là cả hai khiếm khuyết hoặc không hợp tác, vì điều này giữ lại vai trò của họ như là các cường quốc hạt nhân.

Cournot Competition

: Mô hình này cũng giống khái niệm của Prisoner, và được đặt theo tên của nhà toán học người Pháp Augustin Cournot, người đã giới thiệu nó vào năm 1838. Ứng dụng phổ biến nhất của mô hình Cournot là mô tả một hoặc hai nhà sản xuất trong một thị trường.

Ví dụ, giả sử hai công ty A và B sản xuất một sản phẩm giống nhau và có thể sản xuất số lượng lớn hoặc thấp. Nếu cả hai hợp tác và đồng ý sản xuất ở mức thấp thì nguồn cung hạn chế sẽ chuyển thành giá cao cho sản phẩm trên thị trường và lợi nhuận đáng kể cho cả hai công ty. Mặt khác, nếu khiếm khuyết và sản xuất ở mức cao, thị trường sẽ bị ngập và dẫn đến một mức giá thấp cho sản phẩm và do đó làm giảm lợi nhuận. Nhưng nếu một người hợp tác (nghĩa là sản xuất ở mức thấp) và các khuyết tật khác (tức là sản xuất lén lút ở mức cao), thì người kia sẽ bị phá vỡ ngay cả khi người kia kiếm được lợi nhuận cao hơn nếu cả hai cùng hợp tác.

Ma trận hoàn trả cho các công ty A và B được thể hiện (con số biểu thị lợi nhuận bằng hàng triệu đô la). Do đó, nếu A hợp tác và sản xuất ở mức thấp trong khi B sai sót và sản xuất ở mức cao, thì lợi nhuận được thể hiện trong ô (b) - thậm chí phá vỡ đối với công ty A và 7 triệu đô la lợi nhuận cho công ty B. Cournot Payoff Ma trận Công ty B

Hợp tác

Khiếm khuyết

Công ty A

Hợp tác

(a) 4, 4

(b) 0, 7

Khiếm khuyết

) 7, 0

(d) 2, 2

Phối hợp

: Phối hợp, người chơi kiếm được điểm thưởng cao hơn khi họ chọn cùng một hành động.

Ví dụ: hãy xem xét hai gã khổng lồ công nghệ đang quyết định giới thiệu một công nghệ mới cấp tiến trong các chip nhớ có thể kiếm lợi nhuận hàng trăm triệu hoặc một phiên bản sửa đổi của một công nghệ cũ hơn sẽ giúp họ kiếm được ít hơn nhiều. Nếu chỉ có một công ty quyết định tiếp tục công nghệ mới, việc người tiêu dùng chấp nhận thị trường sẽ thấp hơn đáng kể, và kết quả là nó sẽ kiếm được ít hơn nếu cả hai công ty quyết định cùng một hành động. Ma trận hoàn trả được trình bày dưới đây (con số biểu thị lợi nhuận bằng hàng triệu đô la).

Như vậy, nếu cả hai công ty quyết định giới thiệu công nghệ mới, họ sẽ kiếm được 600 triệu USD mỗi lần, trong khi giới thiệu một phiên bản sửa đổi của công nghệ cũ sẽ kiếm được 300 triệu USD mỗi chiếc, như thể hiện trong ô (d). Nhưng nếu Công ty A tự quyết định giới thiệu công nghệ mới, nó sẽ chỉ kiếm được 150 triệu đô la, mặc dù công ty B sẽ kiếm được 0 đô la (có lẽ bởi vì người tiêu dùng có thể không sẵn lòng chi trả cho công nghệ đã lỗi thời của họ). Trong trường hợp này, nó có ý nghĩa đối với cả hai công ty để làm việc cùng nhau chứ không phải là của riêng mình.

Công ty mới Công ty

Công ty A

Công nghệ mới

(a) 600, 600

(b) 0, 150 < Công nghệ cũ

(c) 150, 0

(d) 300, 300

Trò chơi Centipede

: Đây là một trò chơi mang tính mở rộng trong đó hai người chơi luân phiên có cơ hội lấy chia sẻ của một stash tiền ngày càng tăng. Trò chơi Centipede là tuần tự, vì người chơi thực hiện hành động của họ một cái khác thay vì đồng thời; mỗi người chơi cũng biết các chiến lược được lựa chọn bởi các cầu thủ đã chơi trước họ. Trò chơi kết thúc ngay khi một người chơi lấy stash, với người chơi nhận được phần lớn hơn và người chơi khác nhận được phần nhỏ hơn.

Ví dụ, nếu Người chơi A và Người chơi B đang chơi trò chơi Centipede, giả sử Người chơi A đi trước và phải quyết định xem anh ta "Take" hay "Pass" cho phần stash, hiện đang ở mức $ 2. Nếu anh ta mất, thì A và B nhận được 1 đô la một cái, nhưng nếu A qua, thì quyết định "Take or Pass" bây giờ phải được thực hiện bởi Player B. Nếu B lấy, cô ấy sẽ nhận được 3 đô la (tức là $ 2 + ) và A nhận được $ 0. Nhưng nếu B đi, A giờ đây sẽ quyết định có nên hay vượt qua, vân vân. Nếu cả hai người chơi luôn luôn chọn để vượt qua, họ nhận được một payoff $ 100 vào cuối trò chơi.

Điểm của trò chơi là nếu cả A và B đều hợp tác và "vượt qua" vào cuối trò chơi, họ sẽ có được lợi tức tối đa là 100 đô la mỗi điểm. Nhưng nếu họ không tin tưởng vào người chơi khác và mong đợi họ "lấy" cơ hội đầu tiên, thì cân bằng Nash dự đoán rằng người chơi sẽ nhận được yêu cầu bồi thường thấp nhất có thể ($ 1 trong trường hợp này). Tuy nhiên, các nghiên cứu thực nghiệm đã chỉ ra rằng hành vi "hợp lý" này (theo dự đoán của lý thuyết trò chơi) ít khi được thể hiện trong cuộc sống thực. Điều này không gây ngạc nhiên trực giác do kích thước nhỏ bé của kết quả ban đầu liên quan đến kết quả cuối cùng. Hành vi tương tự của các đối tượng thử nghiệm cũng đã được trưng bày trong Điểm tiến thoái lưỡng nan của khách du lịch.

Điểm tiến thoái lưỡng nan của khách du lịch

: Đây là một trận tổng kết không phải bằng không, trong đó cả hai người chơi cố gắng tối đa hóa lợi nhuận của họ mà không phải lo lắng về vấn đề kia. Được phát triển bởi nhà kinh tế học Kaushik Basu năm 1994, trong Traveler's Dilemma, một hãng hàng không đồng ý trả hai khách du lịch bồi thường thiệt hại cho các mặt hàng giống hệt nhau. Tuy nhiên, hai du khách được yêu cầu riêng để ước tính giá trị của mặt hàng, với mức tối thiểu là 2 đô la và tối đa là 100 đô la. Nếu cả hai đều ghi lại cùng một giá trị, hãng hàng không sẽ hoàn trả cho mỗi người trong số tiền đó. Nhưng nếu các giá trị khác nhau, hãng hàng không sẽ trả cho họ giá trị thấp hơn, với một khoản tiền thưởng là $ 2 cho khách du lịch đã ghi lại giá trị thấp hơn này và một khoản phạt 2 đô la cho khách du lịch đã ghi lại giá trị cao hơn.

Mức cân bằng Nash, dựa trên sự khởi phát ngược, là $ 2 trong kịch bản này. Nhưng như trong trò chơi Centipede, các thí nghiệm trong phòng thí nghiệm luôn chứng minh rằng hầu hết những người tham gia - một cách ngây thơ hay cách khác - chọn một con số cao hơn $ 2.

Tình trạng tiến thoái lưỡng nan của khách du lịch có thể được áp dụng để phân tích các tình huống thực tế khác nhau. Ví dụ, quá trình suy nghĩ lạc hậu có thể giúp giải thích hai công ty tham gia vào cuộc cạnh tranh khốc liệt có thể làm tăng giá thành sản phẩm nhằm giảm thị phần, điều này có thể dẫn đến tổn thất lớn hơn trong quá trình này. Chiến lược lý thuyết trò chơi bổ sung

Trận chiến giới tính

: Đây là một hình thức khác của trò chơi phối hợp được miêu tả trước đó nhưng với một số sự bất đối xứng về hoàn trả. Về cơ bản nó liên quan đến một cặp vợ chồng cố gắng để phối hợp buổi tối của họ ra ngoài. Trong khi họ đã đồng ý gặp nhau tại một trong hai trò chơi bóng (sở thích của người đàn ông) hoặc tại vở kịch (người phụ nữ ưa thích), họ đã quên những gì họ đã quyết định, và để làm phức tạp vấn đề, không thể giao tiếp với nhau. Họ nên đi đâu? Ma trận trả là như được hiển thị - các con số trong các tế bào đại diện tương ứng mức độ thưởng thức của sự kiện cho người phụ nữ và người đàn ông, tương ứng. Ví dụ, tế bào (a) đại diện cho phần thưởng (về mức hưởng thụ) cho người phụ nữ và người đàn ông, tương ứng, tại vở kịch (cô ấy thích nó nhiều hơn anh ta). Tế bào (d) là hoàn trả nếu cả hai làm cho nó để bóng trò chơi (anh ấy thích nó nhiều hơn cô ấy). Cell (c) đại diện cho sự không hài lòng nếu cả hai đi không chỉ đến vị trí sai, mà còn cho các sự kiện mà họ thích ít nhất - người phụ nữ để các trò chơi bóng và người đàn ông để chơi.

Nữ Chơi

(a) 6, 3

(b) 2, 2

Trận đấu của giới tính Ma trận trả tiền > Trò chơi bóng

(c) 0, 0 (d) 3, 6

Trò chơi độc tài

: Đây là một trò chơi đơn giản trong đó Người chơi A phải quyết định cách phân giải giải thưởng tiền mặt với Player B , người không có ý kiến ​​vào quyết định của cầu thủ A. Mặc dù đây không phải là chiến lược lý thuyết trò chơi chiến lược

mỗi lần

, nó cung cấp một số thông tin chi tiết thú vị trong hành vi của người dùng. Các thí nghiệm tiết lộ rằng khoảng 50% giữ tất cả số tiền cho mình; 5% chia làm hai, và 45% khác cho người tham gia khác chia nhỏ. Trò chơi nhà độc tài có liên quan chặt chẽ đến trò chơi tối hậu thư, trong đó Người chơi A được cho một số tiền nhất định, một phần trong đó phải được trao cho Người chơi B, người có thể chấp nhận hoặc từ chối số tiền được đưa ra.Việc bắt là nếu người chơi thứ hai từ chối số tiền được cung cấp, cả A và B không có gì. Nhà độc tài và trò chơi tối hậu giữ những bài học quan trọng cho những vấn đề như từ thiện và từ thiện.

Hòa bình-Chiến tranh

: Một sự khác biệt của tình trạng tiến thoái lưỡng nan của Tù nhân, trong đó các quyết định "Hợp tác hoặc Bị khiếm khuyết" được thay thế bằng "Hòa bình hoặc Chiến tranh. "Một sự tương tự có thể là hai công ty tham gia vào một cuộc chiến giá cả. Nếu cả hai đều không cắt giảm giá, họ sẽ hưởng được sự thịnh vượng tương đối (cell a), nhưng chiến tranh giá sẽ làm giảm đáng kể các khoản hoàn trả (ô d). Tuy nhiên, nếu A tham gia vào việc cắt giảm giá (chiến tranh) nhưng không phải B, thì A sẽ có lợi nhuận cao hơn là 4 vì nó có thể chiếm được thị phần đáng kể, và khối lượng cao hơn này sẽ bù lại giá sản phẩm thấp hơn.

Công đoàn A

Hòa bình (a) 3, 3

(b) 0, 4

Công ty B

Hòa bình

Ma trận > Chiến tranh (c) 4, 0 (d) 1, 1

Tình trạng tiến thoái lưỡng nan của Tình nguyện : Trong tình trạng tiến thoái lưỡng nan của tình nguyện viên, ai đó phải làm việc nhà hoặc làm việc vì lợi ích chung. Kết quả tồi tệ nhất có thể được nhận ra nếu không có tình nguyện viên. Ví dụ: hãy xem xét một công ty nơi gian lận kế toán tràn lan nhưng quản lý cấp cao thì không biết. Một số nhân viên cấp dưới trong phòng kế toán nhận thức được sự gian lận nhưng do dự nói với quản lý cấp cao, bởi vì nó sẽ dẫn đến những nhân viên tham gia vào vụ gian lận bị đuổi việc và có thể bị truy tố. Được dán nhãn là một "người tố cáo" cũng có thể có một số hậu quả xuống dòng. Nhưng nếu không có tình nguyện viên, gian lận quy mô lớn có thể dẫn đến sự phá sản cuối cùng của công ty và mất việc của mọi người.

The Bottom Line

Lý thuyết trò chơi có thể được sử dụng rất hiệu quả như một công cụ để ra quyết định dù là trong môi trường kinh doanh, kinh doanh hay cá nhân.