Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Учебное пособие 3000310.doc
Скачиваний:
14
Добавлен:
30.04.2022
Размер:
1.67 Mб
Скачать

3.2 Применение теории Байесовых игр для моделирования процесса информационно-психологического воздействия в открытых иткс

В байесовых играх вся частная (т.е. не являющаяся общим знанием) информация, имеющаяся у агента на момент выбора им своего действия, называется типом агента. При этом каждый агент, зная свой тип, имеет и предположения о типах остальных агентов (в виде вероятностного распределения).

Формально байесова игра описывается следующим набором:

– множеством агентов;

– множествами возможных типов агентов, где тип -го агента , , вектор ;

– множеством допустимых векторов действий агентов;

– набором целевых функций (целевая функция агента зависит в общем случае от типов и действий всех агентов);

– представлениями , , агентов (здесь через обозначено множество всевозможных наборов типов всех агентов, кроме -го, , а через обозначено множество всевозможных вероятностных распределений на ).

Решением байесовой игры является равновесие Байеса–Нэша, определяемое как набор стратегий агентов вида , которые максимизируют математические ожидания соответствующих целевых функций:

, (3.9)

где обозначает набор стратегий всех агентов, кроме -го.

Подчеркнем, что в байесовой игре стратегией агента является не действие, а функция зависимости действия агента от его типа. Модель можно интерпретировать различным образом. В соответствии с одной интерпретацией все агенты знают априорное распределение типов и, узнав собственный тип, вычисляют из него по формуле Байеса условное распределение . В этом случае представления агентов называются согласованными (и, в частности, являются общим знанием – каждый агент может их вычислить, знает, что это могут сделать остальные и т.д.).

Другая интерпретация состоит в следующем. Пусть существует некоторый набор потенциальных участников игры всевозможных типов. Каждый такой «потенциальный» агент выбирает свою стратегию в зависимости от своего типа, после чего случайным образом выбирается «актуальных» участников игры. В этом случае представления агентов, вообще говоря, не обязательно согласованы (хотя и являются общим знанием).

Ситуацию, когда условные распределения не обязательно являются общим знанием удобно описывать ее следующим образом. Пусть выигрыши агентов зависят от их действий и от некоторого параметра («состояния природы», которое может интерпретироваться и как набор типов агентов), значение которого не является общим знанием, т. е. целевая функция -го агента имеет вид , . Как было отмечено ранее, выбору агентом своей стратегии логически предшествует информационная рефлексия – размышления агента о том, что каждый агент знает (предполагает) о параметре , а также о предположениях других агентов и пр.

Ограничимся рассмотрением игр двух лиц, при этом представления агентов задаются точечной структурой информированности (у агентов имеются вполне определенные представления о значении неопределенного параметра; о том, каковы представления (также вполне определенные) оппонента, и т. д.) С учетом этих упрощений нахождение равновесия Байеса–Нэша сводится к решению системы двух соотношений, определяющих две функции, каждая из которых зависит от счетного числа переменных.

Пусть в игре участвуют два агента с целевыми функциями:

, , , , (3.10)

причем функции и множества , являются общим знанием. Первый агент имеет следующие представления: неопределенный параметр равен ; второй агент считает, что неопределенный параметр равен ; второй агент считает, что первый агент считает, что неопределенный параметр равен и т. д. Таким образом, точечная структура информированности первого агента задается бесконечной последовательностью элементов множества ; пусть, аналогично, и у второго агента имеется точечная структура информированности :

, (3.11)

Типом агента в данном случае является его структура информированности , . Для нахождения равновесия Байеса–Нэша необходимо найти равновесные действия агентов всевозможных типов, а не только некоторых фиксированных типов.

В данном случае распределения получим из определения равновесия (3.9). Если, например, тип первого агента , то распределение приписывает вероятность 1 типу оппонента и вероятность 0 остальным типам. Соответственно, если тип второго агента , то распределение приписывает вероятность 1 типу оппонента и вероятность 0 остальным типам.

Будем использовать в дальнейшем следующие обозначения (BR означает наилучший ответ – best response):

,

, (3.12)

,

Введем обозначения и для функций, ставящих в соответствие типу равновесное действие:

(3.13)

В рамках точечной структуры информированности -й агент уверен, что значение неопределенного параметра равно (вне зависимости от представлений оппонента).

Таким образом, для нахождения равновесия необходимо решить систему функциональных уравнений (3.13) для определения функций и , каждая из которых зависит от счетного числа переменных [113].