Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
1-9.doc
Скачиваний:
114
Добавлен:
10.02.2015
Размер:
1.1 Mб
Скачать

13. Принятие решений в условиях неопределенности. Постановка задачи. Виды неопределенности. Критерий Сэвиджа. Минимаксный. Критерий Гурвица.

Принятие решений в условиях неопределенности.

Неопред-сть м.б.вызвана недостатком технической, социальной,экономич-й и др-й информ-ей, невозможностью получения инф-йй в силу ограниченности по времени или финансов. Неопред-сть нехваткой опыта или знаний. Поведение среды или противника,влияющее на принятие решения.

Пример:оценивание вариантов ИС(инф-ых систем).

-Коэф-т готовности ИС.

-время восстановления ИС.

-Время установления соединения при передаче инф-ии.

-зависят от степени загружности ИС.-неопред-сть.

Постановка задачи:

1)имеется некот.мн-ва аль-тив или решений.Х={x1,…,xn}

2)мн-во состояний среды.Y={y1,…,ym}

3)известны распределение оприорных вероятностях состояний среды.

P={p1,…,pm} с вероятностьюpiсреда примет состояниеyi.

4)критерий zоценки альтернатив описывается с помощью матрицы полезностиU={uij(xiyj)}i=1,n;j=1,m или матрицы потерь.

V={Vij(xi yj)}i=1,n;j=1,m.

U

y1

y2

ym

x1

U(x1,y1)

U(x1,y2)

U(x1,ym)

xn

U(xn,y1)

U(xn,ym)

Возможны 3 вида оприорной информированности лица принимающего решения(ЛПР):

1)известно оприорное распределение pi

2)известно,что среда противодействует ЛПР.

3)промежуточный между 1 и 2 ЛПР известно приблизительная инф-ия о состоянии среды.

Минимаксный(максиминный)

z(x)=

z(x)=

Пример: таблица*.

Ответ:x*=x3

Пример:V==>

4)Критерий Сэвиджа

1)r(xi,yi)={}

2)К {r(xi,yj)} применяют минимаксный критерий.

Пример:

V=(

r=(}min=1000=>x*=x1

Пример:

y1

y2

y3

y4

x1

5

10

18

25

x2

8

7

8

23

x3

21

18

12

21

x4

30

22

19

15

min

5

7

8

15

r=}min=8=>x*=x2

5)Критерий Гурвицаa€[0,1]

Z(x,y)=a

X*-наилучшая,еслиz(x*,y)=

a-1=>среда противодействует

a=0=>-среда содействует

a=1/2=>среда либо сод-ет,либо против-ет

a-показатель оптимизма.

V(xi,yj)

Z=min(a

Пример:

max

min

25

5

23

7

21

12

30

15

a=1/2

a min+(1-a)max

15

15

}min=15=>x*=x1 илиx2

16,5

22,5

3 возможных ситуаций оприорной информированности

1)pi=>Байес-ЛаплассаB(x,p) ср.квадратич. ᵴ(x,p)

2)среда противод.=>минимакс(максимин).крит.Сэвиджа.

3)крит.Гурвица a.

  1. Построение критерия оценки и выбора решений для разных ситуаций априорной информированности ЛПР.

1) piнеизвестны

Кр Гурвица z1(x,y)= λ1minU(xi,yj)+(1-λ1)maxU(xi,yj)

Z1(x,y)= λ1minV(xi,yj)+(1- λ1)maxV(xi,yj)

2) piизвестны

Комбинированный критерий для U(xi,yj)

Z2(x,p)= λ2B(x,p)

Z2(x,p)= λ2B(x,p)-(1- λ2)σ(x,p)

B(x,p) критерий Байса-Лапласа

σ(x,p)-сред. квадратич. отклонение

для V:z2(x,p)= λ2B(x,p)+(1- λ2)σ(x,p)

3) Строим универсальный критерий

Z(x,y,p)=Bz1(x,y)+(1-B)z2(x,p)

Для U(xi,yj)z(x*,y,p)=minz(x,y,p)

λ 1, λ2 ,Bвходят [0,1]

B=0 =>z(x,y,p)=z(x,p) => 1я ситуация априорной информ-ти

λ 2 входит {0, 0.1,…,1}

B=1 =>z(x,y,p)=z(x,y) => 2я ситуация априорной информ-ти

λ 1входит {0;0.1;0.2;…;1}

B≠0;1

B=0;0,1;…

Λ1=0;0,1;… λ2=0;0,1;….

Пример

Сравниваются 4 варианта ИС. X={x1,x2,x3,x4}

S1-низкий уровень загрузки.S2-ниже среднего.S3- сред. уровень загрузки.S4- выше среднего.S5-сверхвысокий уровень загрузки.

P={0.2,0.2,0.4,0.15,0.05}

V

S1

S2

S3

S4

S5

B(x,p)

σ(x,p)

X1

0.1

0.4

0.5

0.8

1

0.47

0.243

X2

0.3

0.5

0.6

0.8

0.9

0.565

0.156

X3

0.1

0.3

0.5

1

1.1

0.485

0.309

X4

0.2

0.3

0.4

1

1.2

0.470

0.302

Выбрать лучший вариант проекта

z(x.y,p)=Bz1(x,y)+(1-B)z2(x,p)

B=0

z2(x,p)= λ2B(x,p)+(1- λ2)σ(x,p)

B(x,p)=

σ(x,p)=(∑(V(xi,yj)*B(x,p))2pj)1/2

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

X1

0.447

0.425

0.334

X2

0.524

0.483

0.319

X3

0.467

0.450

0.379

X4

0.453

0.436

0.373

Min x1 x1 x1 x1 x1 x2 x2 x2 x2

  1. Марковские модели принятия решений.

S-динамическая.S1,S2,…,Sm

Система изменяет свои состояния мгновенно. t1<t2<…<tl<…

Марковость процесса заключается в том, что вер-ть перехода Sв какое либо состояние в моментеt(i) зависит только от состояния системы в моментt(i-1) и не зависит от того, как система в это состояние пришла заi-1 шаг.

Обозначим событие Ski – в момент времениti система приняла состояниеSkк=1,m,i=0 начальное состояние системы,p(Ski) вероятность, что наi-м шаге система примет состояниеSk.

=1

Решение-стратегия. G={Xli} –мн-во допустимых решений.

Pjk(i/Xli-1)-вер-ть перехода изSj в Sk при условии, что наi-1 шаге приняли решениеXli-1

Pjk(i/Xli-1)=p(Ski/Sji-1,Xl,i-1)

p(i/Xli-1)={pjk(i/Xli-1)}mj,k-1 матрица переходных вероятностей сi-1 наi-й шаг.

Пример. Садовник, проводя хим. анализ почвы каждый год в начале сезона, оценивает состояние почвы как хорошее, удовлетворит., или плохое. Это позволяет ему принять одно из допустимых решений: 1) не вносить удобрения; 2) вносить удобрения. Садовник планирует проработать еще Nлет и его интересует оптимальная стратегия.

Состояния

S1 хорошее

S2 удовлетворительное

S3 плохое

X1-не удобрять почву.

P1=

P1(S1i|S3i-1)=0

X2-вносить удобрения.

P2=

Матрица дохода R(i|Xli-1)={rjk(i|Xli-1)}

Uj(Xli-1)==ожидаемый доход при доходе из состоянияSj.

Задача максимизировать доход за Nшагов. ЕслиNконечное, то с конечным горизонтом планирования. ЕслиNбесконечная, то с бесконечным горизонтом планирования.

Если ЛПР решает, что после i-1 этапа если система находится в состоянииSjнужно принимать решениеX* независимо от состояния наi-м этапе, то говорят, что процесс принятия решений описывается стационарными стратегиями.

Пример.

P1=p2=

Стационарная стратегия- вносить удобрения тогда и только тогда, когда состояние почвы плохое S3.

P=

R=

Обозначим fi(j)-оптимальный ожидаемый доход за этапыi,i+1,…,Nпри условии, что после (i-1) шага система находится в состоянииSj,j=1,m

Будем считать, что N<бесконечности.

SN+1(j)=0

Uj(Xli-1))=

fi(j) зависит также от того, какой оптимальный ожидаемый доходfi+1(к)k=1,m

был получен на шаге i+1.

fi(j)=max{Uj(Xli-1)+∑pjk(i|Xli-1)*fi+1(k)} fN+1(j)=0

Пример. Метод итерации по стратегиям.

Выбрать оптимальную стратегию поведения садовника при N=3.

f4(j)=0

U1(X1)=0.2*7+0.5*6+0.3*3=5.3

U2(X1)=0*0+0.5*5+0.5*1=3

U3(X1)=0*0+0*0+1*(-1)=-1

U1(X2)=0.3*6+0.6*5+0.1*(-1)=4.7

U2(X2)=0.1*7+0.6*4+0.3*0=3.1

U3(X2)=0.05*6+0.4*3+0.55*(-2)=0.4

S

Ui(xk)

f3(j)

Опт решение

X1

X2

1

5,3

4,7

5,3

X1

2

3

3,1

3,1

X2

3

-1

0,4

0,4

X2

S

Uj(Xli-1)+∑pjk(i|Xli-1)*fi+1(k)

f2(j)

Опт решение

X1

X2

1

5.3+0.2*5.3+0.5*3.1+0.3*0.4=8.03

4.7+0.3*5.3+0.6*3.1+0.1*0.4=8.19

8.19

X2

2

4.75

5.61

5.61

X2

3

-0.6

2.125

2.125

X2

S

Uj+∑pjk*f2(k)

f1(j)

Опт решение

X1

X2

1

10.38

4.7+0.3*8.19+0.6*5.61+0.1*2.125=10.74

10.74

X2

2

6.87

7.92

7.92

X2

3

1.13

4.23

4.23

X2