- •Основные понятия
- •Строгие и эвристические методы поддержки принятия решений
- •Классификация задач и условий принятия решений
- •Задачи в условиях неопределенности
- •Критерий Гурвица (Hurwicz criterion)
- •Принятие решения в условиях противодействия (конфликта)
- •Матричные игры, решаемые в чистых стратегиях
- •Матричные игры, решаемые в смешенных стратегиях Решение задач графическим методом
- •Дублирование и доминирование стратегий
- •Многокритериальные задачи принятия решения
Принятие решения в условиях противодействия (конфликта)
Итак, раздел теории принятий решений в условиях противодействия называется теорией игр. А конфликтные ситуации представлены в виде матриц будем называть матричными играми.
Лицо принимающее решение, управляющий своими стратегиями (ходами) А1 и т.д., и его противник B1 и т.д. в данной ситуации называются игроками.
[тут будет матрица с ходами]
Матрицу мы будем называть платежной матрицей.
aij – выигрыши игрока А
Возможны два случая:
-
Если задана одна платежная матрица, то естественно предположить, что выигрыш первого игрока будут являться проигрышем второго. Такая ситуация называется матричной игрой с нулевой суммой. Цель игры для первого игрока – побольше выиграть, а второго игрока – поменьше проиграть. Цель игры является определение оптимальной стратегии.
-
Когда противник преследует сугубо свои цели, определенные своими выигрышами матричная игра задается двумя платежными матрицами.
Необходимо найти сразу два решения (aij, bij)
Такая ситуация матричной игры будет называться матричной игрой с ненулевой суммой. Данные игры широко изучены, когда два противника, а если берется 3 противника, то данные по ним не изучены и решение будет сложнее.
Возможны несколько ситуаций, когда матричные игры состоятся:
-
Ходы игроками делаются одновременно
-
Первым ходит второй игрок (под цифрой 2 обозначается «противник»), но первый игрок (лицо принимающее решение) не имеет информации о ходе противника
-
Первым ходит второй игрок и первый игрок знает о ходе противника
-
Первым ходит игрок один, но второй игрок не имеет информации о ходе противника
-
Первым ходит игрок один и второй игрок знает о ходе противника
Очевидно, что случаи 1, 2 и 4 идентичны, т.е. одинаковы. Случай 3 сводится к задаче линейного программирования (для нас он не представляет никакого интереса). В 5 случае игра сводится к принципу максимальной осторожности, т.е. принципу max min.
Т.е. мы будем рассматривать только случаи 1, 2, 4.
Матричные игры, решаемые в чистых стратегиях
Пусть игрок А располагает m стратегиями, т.е. это А1, А2, …, Аm
А игрок B располагает n стратегиями, т.е. это B1, B2, …, Bn
Говорят, что данная игра имеет размерность m x n.
При этом результатом является выбор одной стратегии Аj, Bj при которой i = 1 -> m, а j = 1 -> n
аij – выигрыш А, -аij – проигрыш B
Таким образом мы найдем гарантированный выигрыш.
alpha = max min aij – нижняя цена игры
Beta = min max aij – верхняя цена игры
Alpha =< beta
Особый интерес представляется в том, когда alpha = beta. Это называется чистой ценой игры.
Найденный элемент платежной матрицы, в котором достигается чистая стратегия будет называться угловой точкой. А стратегия игрока A и B называются чистыми стратегиями.
Пример.
Alpha = max (j) min (i) aij = max(j) {2, 1, 4, 3} = 4
Beta = min(i) max(j) aij = min(i) {8, 4, 11, 15, 7} = 4
Найденная точка называется седловой точкой.
Матричные игры, решаемые в смешенных стратегиях Решение задач графическим методом
PA = (p1, p2), QB = (q1, … , qn), q = 1, n
p1 = 1 – p2
α*j = a1j * p1 + a2j * p2 = a1j * p2j (1 – p1) = (a1j – a2j) * p1 + a2j
Таким образом нахождение наименьшего гарантированного выигрыша игрока А подразумевает минимизацию данного выражение. В итоге мы будем иметь N аналогичных выражений, которые надо минимизировать и после этого согласно принципу максимина (max(min)) нужно выбрать наибольшее значение.
α*j -> min
α = max min ((a1j
4 3 8 2
3 7 1 3
α*1 = p1 + 3 (где, α* = (a1j – a2j) * p1 + a2j)
α*2 = -4p1 + 7
α*3 = 7p1 + 1
α*4 = -p1 + 3
[тут будет график, который у Алены]