Бескоалиционные игры (110
..pdf«
»
. . !
"#$%-' ()"#*+ # , *$)# ( / !01 !
1(2'# 3*+-, )4 25)"#*+)6 7#%' %#8*+ 4 4 *0(2 *'!#%% 4 0%)!# *)'#'2 2012
'!# 8(#% %20"% -' ()"#*+)& * !#' & &2'#&2')"#*+ 4 52+0 3'#'2 25 +'/$ / 2012 4., , ' + > 0500-07
#7#%1#%' (- 5)1.-&2'. %20+ . . !)+ !
"#$% -' ()"#*+ # , * $)# , (4 ' ! #% %2 +25#( # &2'#&2')"#*+ 4 & (# ) !2%)/ &2'#&2')"#*+ 4 52+0 3'#'2 %#8*+ 4 4 *0(2 *'!#%% 4 0%)!# *)'#'2.
#+ %(0#'*/ ( / *'0(#%' ! 1-4 +0 *2 &24)*' 2'0 @ &2'#&2')"#*+ 4 52+0 3'#'2 %#8*+ 4 4 *0(2 *'!#%% 4 0%)!# *)'#'2.
/ %2, 2! #%)6: 010100 – 2'#&2')+2; 010200 – 2'#&2')+2. )+ 2(%2/ &2'#&2')+2
Содержание
1 |
Введение |
4 |
2 |
Бескоалиционные игры |
6 |
3 |
Равновесие по Нэшу |
8 |
4 |
Оптимальность по Парето |
11 |
5 |
Смешанное расширение бескоалиционной игры |
15 |
3
1.Введение
Настоящее пособие посвящено приложениям теории бескоалиционных игр для ряда практических задач. Бескоалиционные игры возникают в различных сферах жизнедеятельности человека. К бескоалиционным играм относятся такие игры, в которых участники игры выбирают свои стратегии независимо друг от друга, и любые соглашения между игроками запрещены правилами игры. Бескоалиционная игра n лиц определяется множествами стратегий X1, X2, . . . , Xn игроков и их функциями выигрышей H1(x), H2(x),
. . . , Hn(x), где x X1 × X2 × . . . × Xn. При этом каждый из игроков стремится к максимизации своего выигрыша. Задачи, возникающие в теории бескоалиционных игр, заключаются в том, чтобы рекомендовать каждому из игроков i, где i {1, . . . , n}, наилучший для него ход xi , обеспечивающий «наибольший» в некотором смысле выигрыш. Это приводит к необходимости формализации понятий игры, наилучшего хода и наибольшего выигрыша. В данном случае наилучший ход обеспечивает игроку наибольший гарантированный выигрыш, то есть максимальный выигрыш, который игрок может получить независимо от ходов других участников игры.
Данное пособие состоит из введения и нескольких разделов.
Вразделе «Основные понятия» даются определения бескоалиционной игры, равновесия по Нэшу, оптимальности по Парето и приводятся соответствующие примеры. Также в этом разделе сформулированы правила нахождения ситуаций равновесия по Нэшу и ситуаций, оптимальных по Парето в биматричной игре.
Вразделе «Смешанное расширение бескоалиционной игры» определяются понятия смешанной стратегии игрока, спектра смешанной стратегии, ситуации в смешанных стратегиях, функции выигрыша игрока, заданной на мно-
жестве ситуаций в смешанных стратегиях, приводятся с доказательствами
4
теорема о существовании ситуации равновесия по Нэшу в конечной бескоалиционной игре n лиц и свойства ситуаций равновесия по Нэшу. Кроме того, в этом разделе решена задача о построении множества всевозможных векторов выигрышей в смешанных стратегиях в игре «Семейный спор».
5
2.Бескоалиционные игры
Пусть заданы непустые множества Xi, где i = 1, . . . , n. Рассмотрим множество X = X1×. . .×Xn, то есть X = {x = (x1, . . . , xn)| xi Xi, i = 1, . . . , n}.
Для каждого i = 1, . . . , n определим функцию Hi : X1 ×X2 ×. . .×Xn → R1. Процесс бескоалиционной игры кратко можно описать следующим образом. Участники игры независимо друг от друга выбирают стратегии xi Xi, i = 1, . . . , n. В результате в игре складывается набор стратегий x = (x1, x2, . . . , xn) X, называемый ситуацией, и i-й игрок получает выигрыш Hi(x). В качестве исхода игры рассматривается вектор H(x) = (H1(x), . . . , Hn(x)). При этом игрок i предпочитает ситуации x ситуацию x тогда и только тогда, когда Hi(x ) > Hi(x). Если Hi(x ) = Hi(x), то ситуации x и x для игрока i равноценны.
Определение 1. Система
Γ= (N, {Xi}i N , {Hi}i N ),
вкоторой N = {1, 2, 3, . . . , n} - множество игроков, Xi - множество стратегий игрока i, Hi - функция выигрыша игрока i, определённая на декар-
товом произведении множеств стратегий игроков X = n Xi (множество
i=1
ситуаций игры), называется бескоалиционной игрой.
Рассмотрим теперь частные случаи бескоалиционной игры n лиц.
Определение 2. Если множества стратегий игроков Xi, где i {1, . . . , n} конечны, то игра называется конечной бескоалиционной игрой n лиц.
Определение 3. Бескоалиционная игра Γ, в которой принимают участие два игрока, называется игрой двух лиц (Γ = (X1, X2, H1, H2)).
Определение 4. Конечная бескоалиционная игра двух лиц называется биматричной.
6
При этом удобно считать, чтоX1 = {1, . . . , m}, X2 = {1, . . . , n}, а функции H1 и H2 записываются в виде матриц
A = |
|
α11 . . . |
α1n |
|
и B = |
|
β11 . . . |
β1n |
|
. . . . . . . . . |
|
. . . . . . . . . |
. |
||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
αm1 . . . |
αmn |
|
|
βm1 . . . |
βmn |
|
Здесь элементы αij = H1(i, j) и βij = H2(i, j) матриц A и B являются соответственно выигрышами игроков 1 и 2 в ситуации (i, j), i X1, j X2.
Замечание 1. В процессе биматричной игры игрок 1 выбирает номер i-й строки, а игрок 2 (одновременно и независимо) - номер j-го столбца матрицы (A, B). В результате в игре образуется ситуация (i, j), причём игрок 1 получает выигрыш αij, а игрок 2 - выигрыш βij.
Часто биматричную игру записывают в виде |
|
||
(A, B) = |
(α11, β11) |
. . . (α1n, β1n) |
|
. . . |
. . . . . . |
. |
|
|
|
|
|
|
|
|
|
|
(αm1, βm1) . . . (αmn, βmn) |
|
В качестве примера бескоалиционной игры рассмотрим биматричную игру «Семейный спор».
Пример 1 (Игра «Семейный спор»). Рассматривается биматричная игра (игра двух лиц) с матрицей
|
I1 |
II1 |
II2 |
|
|
(4, 1) |
(0, 0) |
||
(A, B) = |
I2 |
(0, 0) |
(1, 4) |
. |
Муж (игрок 1) и жена (игрок 2) могут выбрать одно из двух развлечений: футбольный матч или театр. Таким образом множество стратегий игрока 1 имеет вид X1 = {I1, I2}, где I1 - футбольный матч, I2 - театр, а множество 7
стратегий игрока 2 X2 = {II1, II2}, где II1 - футбольный матч, II2 - театр. Муж (игрок 1) предпочитает футбольный матч, а жена (игрок 2) - театр. Поэтому в случае появления ситуации (I1, II1) игрок 1 выигрывает больше чем игрок 2 (вектор выигрышей (4, 1)), а в ситуации (I2, II2) игрок 2 выигрывает больше чем игрок 1 (вектор выигрышей (1, 4)). Однако обоим важнее быть вместе, чем участвовать в развлечении (хотя и предпочтительном) одному, так как если они имеют разные желания (ситуации (I1, II2) или (I2, II1)), то в обоих случаях выигрыши игроков 1, 2 равны нулю.
Как уже отмечалось, решить игру означает рекомендовать каждому игроку наилучший (оптимальный) в некотором смысле ход (стратегию). Однако в теории бескоалиционных игр нет единого подхода к выработке понятия оптимального хода, так как известно целое множество принципов оптимальности, дающих различные решения игры. При этом выбор определённого принципа оптимальности приводит к различным постановкам задачи, что надо искать. По существу, за одним названием скрываются разные задачи.
Для бескоалиционных игр будут рассмотрены два основных принципа оптимальности: равновесие по Нэшу, и оптимальность по Парето.
3.Равновесие по Нэшу
Рассмотрим понятие равновесия по Нэшу для бескоалиционной игры n лиц. Пусть x = (x1, . . . , xi−1, xi, xi+1, . . . , xn) - произвольная ситуация в бескоалиционной игре Γ, а xi - некоторая стратегия игрока i. Построим ситуацию, которая отлична от x только тем, что стратегия xi игрока i заменена на стратегию xi. В результате мы получаем ситуацию (x1, . . . , xi−1, xi, xi+1, . . . , xn), которую будем обозначать через (x xi) = x.
Определение 5. Ситуация x = (x1, . . . , xi , . . . , xn) называется ситуацией равновесия по Нэшу, если для всех xi Xi и i = 1, . . . , n имеет место
8
неравенство
Hi(x ) Hi(x xi).
Обозначим через Z(Γ) множество ситуаций равновесия по Нэшу в игре Γ.
Замечание 2. Из определения 5 следует, что если ситуация x = (x1, . . . , xi , . . . , xn) является ситуацией равновесия по Нэшу, то ни один из игроков i не заинтересован в отклонении от своей стратегии xi , входящей в ситуацию x . При использовании i-м игроком стратегии xi вместо xi его выигрыш может лишь уменьшиться при условии, что остальные игроки придерживаются стратегий, образующих ситуацию равновесия x .
Лемма 1. В биматричной игре Γ(A, B), где A и B - m×n матрицы выигрышей 1-го и 2-го игроков, ситуация (i , j ) является ситуацией равновесия по Нэшу, если для всех i = 1, . . . , m выполняется неравенство αi j αij и для всех j = 1, . . . , n выполняется неравенство βi j βi j.
Доказательство леммы очевидным образом вытекает из определения 5. В силу леммы 1 справедливо следующее правило поиска ситуаций равновесия по Нэшу в биматричной игре Γ(A, B).
Правило 1. Ситуация (i , j ) будет равновесной по Нэшу в биматричной игре Γ(A, B), если элемент αi j является наибольшим в j -м столбце матрицы A, а элемент βi j является наибольшим в i -й строке матрицы
B.
Рассмотрим пример использования правила 1 для нахождения ситуации равновесия по Нэшу в биматричной игре.
Задача 1. Найдём множества всех ситуаций равновесия по Нэшу в следующих биматричных играх Γ(A, B).
1) Матрицы A и B - диагональные и положительные, то есть m = n, αij =
βij = 0, i = j и αii > 0, βii > 0, i = 1, . . . , m, j = 1, 2, . . . , n.
9
2) Пусть |
2 |
|
5 |
|
2 |
|
|
1 |
|||
|
0 |
|
2 |
||||||||
A = 2 2 |
3 , |
|
B = 0 |
7 |
8 . |
||||||
3) Пусть |
3 |
8 −1 |
|
|
1 |
|
|
4 |
|||
A = |
, |
B = |
3 |
||||||||
4 |
0 |
2 |
|
2 |
1 |
8 . |
|||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
2 |
3 |
|
|
|
2 |
3 |
0 |
Решение. Для решения задачи будем использовать правило 1.
1) Просматриваем все элементы первого столбца матрицы A и находим наибольший. Таким элементом будет α11, который игрок 1 получает в ситуации (1, 1). Выясним, будет ли элемент β11 максимальным в первой строке мат-
рицы B. Так как β11 > 0, а β1j = 0 для j = 2, . . . , n, то max β1j = β11.
j {1, ..., n}
Следовательно, ситуация (1, 1) является равновесной по Нэшу. Выполняя аналогичную процедуру поиска равновесия по Нэшу для 2-го, . . . , n-го столб-
ца получаем |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
|
Z(Γ) = {(1, 1), . . . , (n, n)}. |
|
|
|
|
|
||||||||||
2) Аналогично первому случаю находим |
max αij |
для всех j |
= 1, . . . , |
3. |
||||||||||||||
Имеем |
|
|
|
|
|
|
|
|
|
i {1, 2} |
|
|
|
|
|
|
||
max αi1 |
= α11 = α21 |
= 2, |
|
max αi2 |
|
= α22 |
= 2, max αi3 |
= α13 = 5. |
||||||||||
i {1, 2} |
|
|
|
|
|
i {1, 2} |
|
|
|
i {1, 2} |
|
|
|
|
||||
Проверим теперь будут ли ситуации (1, 1), |
(2, 1), |
(2, 2), (1, 3) равновесны- |
||||||||||||||||
ми по Нэшу в данной игре Γ(A, B), рассмотрев соответствующие элементы |
||||||||||||||||||
матрицы B. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
Так как |
β |
11 = 2 = j {1, ..., |
3} |
1j |
, |
то |
(1, 1) |
Z(Γ). |
При этом |
β |
21 |
= 0 < β |
23 |
, |
||||
|
|
max |
β |
|
|
|
|
|
|
|
|
β22 = 7 < β23, β13 = 1 < β11, и, следовательно, (2, 1), (2, 2), (1, 3) не являются ситуациями равновесия по Нэшу в игре Γ(A, B). Таким образом,
|
|
|
Z(Γ) = {(1, |
1)}. |
3) Находим |
max |
αij |
для всех j = 1, 2, |
3. Получаем max αi1 = α21 = 4, |
|
i {1, 2, 3} |
|
i {1, 2, 3} |
|
max αi2 |
= α12 |
= 8, |
max αi3 = α33 |
= 3. Переходим к рассмотрению |
i {1, 2, 3} |
|
|
i {1, 2, 3} |
|
|
|
|
10 |
|