Trò chơi Lý thuyết: Trên cơ sở

Hollow Knight Lore and Plot Explained (Tháng Chín 2024)

Hollow Knight Lore and Plot Explained (Tháng Chín 2024)
Trò chơi Lý thuyết: Trên cơ sở
Anonim

Sử dụng lý thuyết trò chơi, kịch bản thế giới thực cho các tình huống như cạnh tranh giá và phát hành sản phẩm (và nhiều hơn nữa) có thể được đặt ra và kết quả của họ dự đoán. Các công ty sử dụng (và gắn bó với) thiết bị này để xác định cân bằng Nash thấy một lợi ích to lớn trong chiến lược ngân sách của họ. (Để xem nhanh, xem Khái niệm cơ bản của Lý thuyết trò chơi .)

Ai là Bật?
Trong khi các trò chơi tuần tự được chơi theo lượt, các trò chơi đồng thời được chơi với mỗi người chơi cùng đưa ra quyết định của mình. Với các trò chơi đồng thời, chúng ta không còn sử dụng phương pháp giới thiệu thông thường của sự cảm ứng ngược. Những người ủng hộ lý thuyết trò chơi thường xếp các kết quả khác nhau trong cái được gọi là ma trận (thể hiện dưới đây).

-9->
Người chơi một người / Người chơi hai Còn lại Phải
Lên (1, 3) (4, 2)
Dưới ( 3, 2) (3, 1)

Ma trận này được gọi là hình thức bình thường. Lựa chọn của người chơi được hiển thị trên trục dọc bên trái và lựa chọn của người chơi hai được hiển thị trên trục ngang trên cùng. Phần thưởng cho mỗi người chơi nằm trong giao điểm tương ứng và được hiển thị như sau (người chơi một, người chơi thứ hai). Cân bằng Nash (Nash Equilibrium)

cân bằng Nash là kết quả đạt được, một khi đã đạt được, có nghĩa là không một cầu thủ nào có thể tăng lợi nhuận bằng cách thay đổi quyết định đơn phương. Nó cũng có thể được coi là "không hối tiếc," theo ý nghĩa khi một quyết định được đưa ra, người chơi sẽ không hối tiếc về quyết định xem xét hậu quả.

Các cân bằng Nash đạt được theo thời gian, trong nhiều trường hợp. Tuy nhiên, một khi đạt được cân bằng Nash, nó sẽ không bị lệch. Sau khi chúng ta học cách tìm cân bằng Nash, hãy xem làm thế nào một động thái đơn phương sẽ ảnh hưởng đến tình hình. Liệu nó có ý nghĩa gì? Không nên, và đó là lý do tại sao cân bằng Nash được mô tả là "không hối hận".

Tìm một Equilibria Nash

Bước Một: Xác định người chơi phản ứng tốt nhất với hành động của người chơi. Khi kiểm tra các lựa chọn có thể tối đa hóa khoản thanh toán của người chơi, chúng ta phải xem xét cách thức người chơi phải trả lời từng cầu thủ lựa chọn hai. Một cách dễ dàng để làm điều này trực quan là để che giấu sự lựa chọn của người chơi hai. Hãy xem xét ma trận mô tả ở đầu bài viết này khi chúng ta áp dụng phương pháp này.
Người chơi một / Người chơi hai

Còn lại Phải Lên
(1, -) (4, -) Xuống
(3, -) > (3, -) Người chơi có hai lựa chọn có thể chơi: "lên" hoặc "xuống". Người chơi hai cũng có hai lựa chọn để chơi: "trái" hoặc "phải." Trong bước này để xác định cân bằng Nash, chúng ta xem xét các phản ứng đối với hành động của người chơi. Nếu người chơi hai lựa chọn chơi "trái", chúng tôi có thể chơi "lên" với phần thưởng của một người, hoặc chơi "xuống" với mức lương ba. Kể từ ba lớn hơn một, chúng tôi sẽ đậm 3 cho thấy tùy chọn để chơi "xuống" ở đây. Nếu người chơi hai lựa chọn chơi "đúng", chúng ta có thể chọn chơi 'up' cho một phần thưởng bốn hoặc chơi "down" cho một playoff của ba. Kể từ bốn lớn hơn ba, chúng tôi in đậm bốn để cho biết tùy chọn để chơi "lên" ở đây. Các kết quả táo bạo được hiển thị dưới đây trên ma trận đầy đủ.

Người chơi một / Người chơi hai

Còn lại

Phải Lên (1, 3)
( 4 , 2) Dưới
3 , 2) (3, 1) Bước Hai: Xác định phản ứng tốt nhất của người chơi đối với hành động của người chơi. Như chúng ta đã làm trước đây với người chơi hai lần hoàn trả cho người chơi một, chúng tôi sẽ giấu payoffs của người chơi khi xác định phản ứng tốt nhất cho người chơi hai. (

Chỉ dẫn hàng đầu về tài chính hành vi
. Một người chơi / Người chơi hai Còn lại

Phải Lên (-, 3 )
(-, 2) Xuống (-, 2)
(-, 1) Cũng giống như khi nhìn vào cầu thủ, mỗi cầu thủ đều có hai lựa chọn. Nếu người chơi chọn chơi "lên", chúng tôi có thể chơi "trái", với một phần thưởng là ba hoặc "phải" với một khoản hoàn trả là hai. Kể từ ba lớn hơn hai, chúng tôi đậm ba để cho thấy các tùy chọn để chơi "trái" ở đây. Nếu người chơi chọn chơi "xuống", chúng tôi có thể chơi "trái", cho một phần thưởng là hai hoặc "đúng" cho một phần thưởng của một. Vì hai là lớn hơn một, chúng tôi đậm hai cho biết tùy chọn để chơi "trái" ở đây. Các kết quả táo bạo được hiển thị dưới đây trên ma trận đầy đủ. Người chơi một / Người chơi hai

Còn lại

Phải Lên (1,
3 ) (4, 2) Dưới 3,
2 ) (3, 1) Bước Ba: Xác định kết quả nào có kết quả tốt. Kết quả cụ thể đó là cân bằng Nash. Bây giờ, chúng ta kết hợp các tùy chọn đậm cho cả hai người chơi vào ma trận đầy đủ.

Người chơi một / Người chơi hai
Còn lại

Phải Lên (1,
3 ) ( 4 , 2) >(
3 , 2 ) (3, 1) Tìm giao lộ nơi cả hai kết quả đều đậm. Trong trường hợp này, chúng ta tìm thấy giao điểm của (xuống, trái) với dòng hoàn trả của (3, 2) phù hợp với tiêu chí của chúng tôi. Điều này cho biết cân bằng Nash của chúng tôi. Phương pháp này để tìm cân bằng Nash thích hợp để tìm ra sự cân bằng trong các trò chơi đồng thời vì chúng ta đang xem xét cách thức người chơi có thể phản ứng một cách độc lập với các hành vi khác như thế nào. Kịch bản của một trò chơi đồng thời thường được chơi trong các doanh nghiệp như các hãng hàng không. Dưới đây là một ví dụ, tương tự như trò chơi ở trên, về cách thức giá vé có thể phát ra. Khoản thanh toán là hàng ngàn đô la. Hãy nhớ rằng, đây là những khoản thanh toán chứ không phải giá cả. Phương pháp chúng tôi áp dụng trước đây đã được áp dụng để hiển thị nơi cân bằng Nash xuất hiện.

Hãng hàng không / Hãng hàng không hai

Giá thấp

Giá cao Giá thấp (
3, 000 , 3, 000 ) ( 4, 000 , 2, 000) Giá cao (2, 000, 4, 000
) (3, 500, 3, 500) Nhìn vào các lựa chọn của A1, chúng ta có thể thấy rằng nếu A2 chọn chơi với giá thấp, chúng ta chọn giữa Low Price cho giá 3 000 hoặc cao cho 2 000. Chúng ta chọn "low" từ 3 000> 2, 000.Chúng tôi cũng làm như vậy cho A2 chơi High Price và thấy rằng chúng tôi chơi "thấp" vì 4,000> 3, 500. Ngược lại, nhìn vào sự lựa chọn của A2, chúng ta có thể thấy rằng nếu A1 chọn chơi giá thấp, chúng tôi chọn giữa "giá thấp" cho 3, 000 và "giá cao" cho 2, 000. Kể từ 3, 000> 2, 000, chúng tôi chọn tùy chọn "giá thấp" ở đây. Nếu A1 chơi giá cao, chúng tôi có thể tính giá thấp cho 4,000 hoặc giá cao cho 3, 500. Kể từ 4,000> 3, 500, chúng tôi chọn chơi "giá thấp" ở đây. Các cân bằng Nash là cả hai hãng hàng không sẽ tính một mức giá thấp (hiển thị khi lựa chọn cho mỗi bên được đánh dấu). Nếu cả hai hãng hàng không tính giá cao, họ sẽ tốt hơn so với họ đang ở cân bằng Nash. Vậy tại sao họ không đồng ý làm điều này? Trước hết, bất hợp pháp để thông đồng. Thứ hai, nếu điều này xảy ra, một hành động đơn phương thay mặt một hãng hàng không tính phí thấp sẽ mang lại lợi ích, dẫn đến việc hãng hàng không đó sẽ kiếm được nhiều tiền hơn. Logic này cũng cho thấy sự cân bằng Nash đạt được như thế nào và tại sao nó không có lợi khi nó đi chệch khỏi khi nó đạt được. (Để biết thêm thông tin, xem hướng dẫn của chúng tôi về

Tài Nguyên Hành Vi

.)

Sự cân bằng Nash đa dạng và Sự cân bằng Nash tạo ra Nói chung, có thể có nhiều cân bằng trong một trò chơi. Tuy nhiên, điều này thường xảy ra trong các trò chơi có nhiều yếu tố phức tạp hơn hai lựa chọn của hai người chơi. Trong các trò chơi đồng thời được lặp lại theo thời gian, một trong những cân bằng nhiều đạt được sau khi một số thử nghiệm và sai sót. Kịch bản về những lựa chọn khác nhau theo thời gian trước khi đạt được trạng thái cân bằng là điều thường thấy nhất trong thế giới kinh doanh khi hai công ty đang xác định giá cho các sản phẩm có thể hoán đổi cho nhau, chẳng hạn như vé máy bay hay rượu soda. The Bottom Line

Với những phương pháp tiên tiến này, nhiều tình huống thực tế hơn có thể được mô phỏng và giải quyết. Các loại khác nhau của cân bằng Nash chúng tôi thảo luận là những giải pháp phổ biến nhất cho các trò chơi mô hình thế giới thực. Một kiến ​​thức về Game Theory có thể giúp bạn hình thành một chiến lược, cho dù chơi một người bạn chơi tic-tac-toe hoặc vying cho lợi nhuận lớn nhất.