Кулик Елементы теории принятия решений 2010
.pdfТребуетсяприменить критерийГурвица, длякоторого( поопре-
делению) справедливоследующее выражение ( χ=0.6 ):
|
|
χ minaij +(1 |
|
|
, |
H = max |
−χ) maxaij |
||||
1≤i≤m |
|
1≤ j≤n |
1≤ j≤n |
|
|
т.е. в каждом столбце |aij| выбирают минимальное значение Mi и максимальное значение Ei, затем вычисляют значение
hi = χ Mi +(1−χ) Ei . Оптимальному решению соответствует то решение (т.е. стратегия Ai приi =i* и ai* j* ), которому соответствуетминимум hi . Вданной задаче n=3 иm=4.
2). Вычислимминимум Mi по каждой строке платёжной матрицы. Для1йстроки:
M1= min{19,30, 41, 49}=19 .
Для2йстроки:
M2= min{50,38, 10, 20} =10 .
Для3йстроки:
M3= min{73,18, 81, 11} =11.
3). ВычислиммаксимумыEi покаждойстрокеплатёжнойматрицы. Для1йстроки:
E1= max{19,30, 41, 49} = 49 .
Для2йстроки:
E2= max{50,38,10, 20} = 50 .
Для3йстроки:
E3= max{73,18, 81,11} = 81 .
4). Вычислим( при χ=0.6 ) значения hi для каждой строкиплатёж-
нойматрицы ( hi = 0.6 Mi +(1−0.6) Ei ). Для1йстроки:
h1 = 0.6 19 +(1−0.6) 49 =11.4 +19.6 = 31.
Для2йстроки:
h2 = 0.6 10 +(1−0.6) 50 = 6 +20 = 26 .
Для3йстроки:
81
h3 = 0.6 11+(1−0.6) 81 = 6.6 +32.4 = 39 .
5). Запишем полученные значения Mi, Ei, hi для каждой строки в
соответствующий дополнительный столбец справа платёжной матрицы.Получим следующую таблицу:
Матрицавыигрышей 3 ×4
Варианты |
|
Предположения |
|
Min |
Max |
hi |
|||
решенийдля |
|
(ситуацияП j) |
|
|
|
||||
ЛПР (стра- |
П1 |
|
П2 |
П3 |
|
П4 |
Mi |
Ei |
|
тегияAi) |
|
|
|
|
|
|
|
|
|
A1 |
19 |
|
30 |
41 |
|
49 |
19 |
49 |
31 |
A2 |
50 |
|
38 |
10 |
|
20 |
10 |
50 |
26 |
A3 |
73 |
|
18 |
81 |
|
11 |
11 |
81 |
39 |
6). Среди уже найденных минимумов Mi выберем тот из них, которыймаксимален.
Получаем,что ai* j* ={a11} ,так как
R = max{19,10,11} =19 .
Определимоптимальную стратегию, соответствующую R. Значению R=19 соответствуетстратегияA 1.
Согласно критерию Вальда стратегия A1 оптимальна. Этот критерий очень осторожен, так как ориентирован на наихудшие условия, среди которых отыскивается наилучший и гарантированныйрезультат.
7). Среди уже найденных значений hi выберем тот из них, который
максимален. Получаем,что
H = max{31,26, 39}= 39.
Определимоптимальную |
стратегию, |
соответствующую H . |
|
Значению H = 39 соответствует только однастратегия— |
A3. |
В соответствии с критерием Гурвица стратегия A3 является оптимальной.
82
8). Для критерия Сэвиджа вычислим максимумы Dj по каждому j-мустолбцу платёжной матрицы,т.е.
Dj = max{akj }.
1≤k≤m=3
Для1гостолбца:
D1= max{19, 50, 73} = 73 .
Для2гостолбца:
D2= max{30, 38,18} = 38 .
Для3гостолбца:
D3= max{41,10, 81}= 81.
Для4гостолбца:
D4= max{49, 20,11} = 49 .
9). Для критерия Сэвиджа запишем полученные максимумы Dj по каждому j-му столбцу в дополнительную строку снизу платёжной матрицы (т.е. матрица выигрышей). Получим следующую таблицу:
Матрицавыигрышей 3 ×4
Варианты |
|
Предположения |
|
|||
решенийдля ЛПР |
|
(ситуацияП j) |
|
|||
(стратегияA i) |
П1 |
|
П2 |
П3 |
|
П4 |
A1 |
19 |
|
30 |
41 |
|
49 |
A2 |
50 |
|
38 |
10 |
|
20 |
A3 |
73 |
|
18 |
81 |
|
11 |
МаксимумыDj по каждому |
73 |
|
38 |
81 |
|
49 |
j-мустолбцу |
|
|
|
|
|
|
10). Для критерия Сэвиджа перейдём от матрицы выигрышей к матрице рисков. Для этого вычислим все элементы матрицы рисковпо следующей формуле:
rij = Dj −aij
83
иполучим следующую матрицурисков:
Матрицарисков 3 × 4
Варианты |
|
Предположения |
|
Max |
|||
решенийдля |
|
(ситуацияП j) |
|
|
|||
ЛПР (стра- |
П1 |
|
П2 |
П3 |
|
П4 |
Wi |
тегияAi) |
|
|
|
|
|
|
|
A1 |
54 |
|
8 |
40 |
|
0 |
|
A2 |
23 |
|
0 |
71 |
|
29 |
|
A3 |
0 |
|
20 |
0 |
|
38 |
|
В этой матрице рисков пока ещё не заполнен последний столбецсо значениями Wi.
11). ВычислиммаксимумыW |
i по каждой строке матрицы рисков. |
Для1йстроки: |
|
W1= max{54, 8, 40, 0} = 54 .
Для2йстроки:
W2= max{23, 0, 71, 29} = 71.
Для3йстроки:
W3= max{ 0, 20, 0, 38} = 38 .
12). Запишем полученный результат Wi в дополнительный столбецсправа матрицы рисков. Получимследующую таблицу:
|
Матрицарисков 3 × 4 |
|
|
|||||
|
Варианты |
|
Предположения |
|
Max |
|||
|
решенийдля |
|
(ситуацияП j) |
|
|
|||
|
ЛПР (стра- |
П1 |
|
П2 |
П3 |
|
П4 |
Wi |
|
тегияAi) |
|
|
|
|
|
|
|
|
A1 |
54 |
|
8 |
40 |
|
0 |
54 |
|
A2 |
23 |
|
0 |
71 |
|
29 |
71 |
A3 |
0 |
|
20 |
0 |
|
38 |
38 |
|
|
|
|
84 |
|
|
|
|
13). Среди уже найденных максимумов Wi выберем тот из них, которыйминимален.
Получаемчто
Q = min{54,71, 38} = 38.
14). Определим оптимальнуюстратегию,соответствующую Q.
Значению Q=38 соответствуетодна стратегия—A |
3. |
В соответствии с критерием Сэвиджа стратегия A3 является оптимальной. Таким образом, выбрано такое решение (стратегия A3), при котором величина риска принимает наименьшее значение в самой неблагоприятной (т.е. когда максимален риск) ситуации.
15). Запишем полученные результаты по выбору оптимальной стратегии в следующуютаблицу:
Оптимальные стратегиидля 3-хкритериев
|
Оптимальная |
Критерий |
стратегия дляЛПР |
Вальда |
A1 |
Гурвица |
A3 |
Сэвиджа |
A3 |
Таким образом, оптимальная стратегия согласно критерию Вальда есть A1.
С точки зрения критериев Гурвица и Сэвиджа, оптимальной стратегиейявляется A 3.
Важно отметить, что на практике возможны различные случаи. В частности, возможен случай, когда все три критерия (Вальда, Сэвиджа, Гурвица) указывают на одну и ту же стратегию. При этом не исключён и случай, когда все три эти критерия указывают на три разных стратегии. Конечно, трудно ожидать, что все три критерия укажут только на одну-единственную стратегию, хотя это и не исключено и может иметь место на практике.
16). И темсамым задачарешена▄
85
Пример 1.8
Используя критерии Байеса( Лапласа), принять решение (выбрать стратегию) по этому критериев в случае следующей платёжнойматрицы |aij| (матрицывыигрышей ЛПР):
Матрицавыигрышей 4 ×4
Варианты |
|
Предположения |
|
|||
решений дляЛПР |
|
|
(ситуация Пj) |
|
||
(стратегияA i) |
П1 |
|
П2 |
П3 |
|
П4 |
A1 |
1 |
|
3 |
1 |
|
1 |
A2 |
3 |
|
1 |
1 |
|
2 |
A3 |
2 |
|
1 |
1 |
|
1 |
A4 |
1 |
|
3 |
0 |
|
4 |
Решение
1). Требуется применитькритерий Байеса( Лапласа), для которого (поопределению) справедливоследующее выражение:
|
1 |
n |
a |
|
, |
L = max |
|
∑j=1 |
|
||
1≤i≤m n |
ij |
|
|
где в каждой строке матрицы |aij| подсчитывается среднее арифметическое значение величин aij. Оптимальному решению соответствует такое решение (т.е. стратегия Ai при i=i*), которому соответ-
ствует максимум этого среднего значения (т.е. ai* j* ). В данной задачеn=4 иm=4.
2). Вычислимсумму Mi по каждой строке матрицы выигрышей.
Для1йстроки:
M1=1+3 +1+1 = 6 .
Для2йстроки:
M2= 3 +1+1+2 = 7 .
Для3йстроки:
M3= 2 +1+1+1 = 5 .
Для4йстроки:
M4=1+3 +0 +4 = 8 .
86
3). Запишем полученный результат Mi в дополнительный столбец справаматрицы выигрышей.Получим следующую таблицу:
Матрицавыигрышей 4 × 4
Варианты |
|
Предположения |
|
Mi |
|||
|
(ситуацияП j) |
|
|||||
решений дляЛПР |
|
|
|||||
(стратегияA i) |
П1 |
|
П2 |
П3 |
|
П4 |
|
A1 |
1 |
|
3 |
1 |
|
1 |
6 |
A2 |
3 |
|
1 |
1 |
|
2 |
7 |
A3 |
2 |
|
1 |
1 |
|
1 |
5 |
A4 |
1 |
|
3 |
0 |
|
4 |
8 |
4). Вычислимсреднее |
значение Ei покаждой строке матрицы вы- |
игрышей. Полученныйрезультат запишемвдополнительный |
столбецсправа матрицы выигрышей.Получим следующую таблицу:
Матрица выигрышей 4 ×4
|
Варианты |
|
Предположения |
Li |
|
|||||||||
|
|
(ситуацияП |
j) |
|
||||||||||
|
решенийдля ЛПР |
|
|
|||||||||||
|
(стратегияA |
i) |
|
П1 |
|
П2 |
|
П3 |
|
П4 |
|
|
||
|
|
A1 |
|
|
1 |
|
3 |
|
1 |
|
1 |
1.50 |
|
|
|
|
A2 |
|
|
3 |
|
1 |
|
1 |
|
2 |
1.75 |
|
|
|
|
A3 |
|
|
2 |
|
1 |
|
1 |
|
1 |
1.25 |
|
|
|
|
A4 |
|
|
1 |
|
3 |
|
0 |
|
4 |
2.0 |
||
5). Вычислимкритерий |
Байеса( Лапласа). |
|
|
|
|
|
||||||||
Воспользуемся следующим выражением: |
|
|
|
|
||||||||||
|
|
1 |
4 |
|
|
|
|
|
|
|
|
|
|
|
L=max |
|
∑aij =max{Li }=max {1.50;1.75;1.25; 2.0}=2.0 |
|
|||||||||||
4 |
|
|||||||||||||
|
1≤i≤m=4 |
j=1 |
1≤i≤m=4 |
|
|
|
|
|
|
|
|
|
||
|
иполучим окончательныйрезультат |
: |
|
|
|
|
|
|||||||
|
Значению L=2.0 соответствуетстратегияA |
4. |
|
|
Таким образом, оптимальная стратегия согласно критерию Байеса( Лапласа) есть A4.
6). Итем самым задача решена▄
87
Пример 1.9 (см.и ср. [2, с. 180-181])
Проверить наличие седловой точки и решить игру, т.е. найти оптимальные стратегии для двух игроков A и B. Платёжная матрицаизвестна и представлена в следующемвиде:
Платёжная матрица игры 3 ×4
СтратегииAi |
|
СтратегииB i |
|
||
|
для игрока B |
|
|||
для игрокаA |
|
|
|||
B1 |
B2 |
B3 |
|
B4 |
|
|
|
||||
A1 |
2 |
4 |
7 |
|
5 |
A2 |
7 |
6 |
8 |
|
7 |
A3 |
5 |
3 |
4 |
|
1 |
Решение
1). Найдём нижнююцену игры α (максимин) по формуле
α= max1≤i≤m (1min≤ j≤n {aij }).
В даннойзадаче m=3 и n=4.
2). Вычислимминимум Mi по каждой строке платёжной матрицы. Для1йстроки:
M1= min{2, 4, 7, 5} = 2 .
Для2йстроки:
M2= min{7,6, 8, 7} = 6 .
Для3йстроки:
M3= min{5,3, 4, 1} =1 .
3). Запишем полученный результат Mi в дополнительный столбец справаплатёжной матрицы.Получим следующую таблицу:
Платёжнаяматрица игры 3 ×4
СтратегииAi |
|
СтратегииB i |
|
Mi |
|||
|
дляигрока B |
|
|||||
дляигрока A |
|
|
|||||
B1 |
|
B2 |
B3 |
|
B4 |
|
|
|
|
|
|
||||
A1 |
2 |
|
4 |
7 |
|
5 |
2 |
A2 |
7 |
|
6 |
8 |
|
7 |
6 |
A3 |
5 |
|
3 |
4 |
|
1 |
1 |
Тогда нижняяцена игры α = max{2, 6,1} = 6 .
88
4). Найдём верхнюю цену игры β (минимакс) по следующей форму- |
|||||||
ле( n=4 и m=3): |
β= 1min≤ j≤n (max1≤i≤m {aij }). |
|
|
|
|||
|
|
|
|
|
|||
5). Вычислиммаксимум |
Dj в каждом столбце платёжной матрицы: |
||||||
|
|
Dj = max{akj }. |
|
|
|
||
|
|
1≤k ≤m=3 |
|
|
|
|
|
Для1- |
гостолбца: |
D1= max{2, 7, 5}= 7 . |
|
|
|||
|
|
|
|
||||
Для2- |
гостолбца: |
D2= max{4, 6, 3}= 6 . |
|
|
|||
|
|
|
|
||||
Для3- |
гостолбца: |
D3= max{7, 8, 4}= 8 . |
|
|
|||
|
|
|
|
||||
Для4- |
гостолбца: |
D4= max{5, 7,1} = 7 . |
|
|
|||
|
|
|
|
||||
6). Запишем полученный результат |
Dj в дополнительную строку |
||||||
снизу платёжной матрицы. Получим следующуютаблицу |
: |
||||||
|
Платёжнаяматрица игры 3 ×4 |
|
|
||||
|
СтратегииAi |
|
|
СтратегииB i |
|
Mi |
|
|
|
|
дляигрока B |
|
|||
|
дляигрока A |
|
|
|
|||
|
|
B1 |
B2 |
B3 |
B4 |
|
|
|
A1 |
|
|
||||
|
|
2 |
4 |
7 |
5 |
2 |
|
|
A2 |
|
7 |
6 |
|
|
|
|
A3 |
|
5 |
3 |
|
|
|
|
Dj |
|
7 |
6 |
|
|
|
Тогда β = min{7,6, 8, 7} = 6 . |
|
|
|
|
|||
7). Установлениеналичияседловойточки |
|
|
|
a22 = 6 , |
|||
Так как для (1.1) α = β = 6, |
то имеется |
|
|
||||
которой соответствует стратегия A2 для игрока A и стратегия B2 |
|||||||
для игрока B. Оптимальному решению соответствует стратегия |
|||||||
A2 дляигрока A и стратегияB |
2 дляигрока B. |
|
|
||||
8). Итем самым задача решена▄ |
|
|
|
|
|||
|
|
|
89 |
|
|
|
|
Пример 1.10 (см.и ср. [2, с. 186-187])
Упростить игру. Платёжная матрица известна и представлена в следующем виде:
Платёжная матрица игры 5 ×5 |
|
||||
СтратегииAi |
|
Стратегии B i |
|
||
|
дляигрока B |
|
|||
дляигрока A |
|
|
|||
|
|
|
|
|
|
|
|
|
|
|
|
|
B1 |
B2 |
B3 |
B4 |
B5 |
A1 |
4 |
7 |
2 |
3 |
4 |
A2 |
3 |
5 |
6 |
8 |
9 |
A3 |
4 |
4 |
2 |
2 |
8 |
A4 |
3 |
6 |
1 |
2 |
4 |
A5 |
3 |
5 |
6 |
8 |
9 |
Решение
1). Поиск дублирующих стратегий дляигрока A.
Заметим, что стратегия A2 дублирует стратегию A5. Тогда применим Правило 1.2 — отбросим (т.е. удалим) любую из них, например,A 5. Получимследующую таблицу:
Платёжная матрица игры 4 ×5 |
|
||||
СтратегииAi |
|
Стратегии B i |
|
||
|
дляигрока B |
|
|||
дляигрока A |
|
|
|||
|
|
|
|
|
|
|
|
|
|
|
|
|
B1 |
B2 |
B3 |
B4 |
B5 |
A1 |
4 |
7 |
2 |
3 |
4 |
A2 |
3 |
5 |
6 |
8 |
9 |
A3 |
4 |
4 |
2 |
2 |
8 |
A4 |
3 |
6 |
1 |
2 |
4 |
2). Поиск доминирующихстратегий для игрока A.
Заметим, что в строке для стратегии A1 все выигрыши игрока A больше или равны соответствующим выигрышам строки со стратегией A4. Получается, что стратегия A1 доминирует над стратегией A4. Тогда применим Правило 1.1 — вычеркнем (т.е. удалим) из платёжной матрицы строку с заведомо невыгодной стратегиейA4 для игрока A.
90