Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги из ГПНТБ / Галушкин, А. И. Синтез многослойных систем распознавания образов

.pdf
Скачиваний:
11
Добавлен:
22.10.2023
Размер:
12.65 Mб
Скачать

х (п) представляет собой сумму нормальных законов с за­ данной дисперсией и математическими ожиданиями, рав­ ными 2, 4, , 16. Число мод распределения / {х) в про­ цессе эксперимента устанавливалось фиксированным от двух до восьми. На рис. 8-33 представлена типовая зави­ симость b (xk, п) в режиме настройки, полученная на ЦВМ для одного из вариантов случайных начальных условий.

Результаты работы алгоритма представлены в табл. 8-1 и

8-2. В таблицах

i — номера мод распределения /

(х),

уча­

ствующие

в эксперименте

(считая слева

по оси

х

моды

с

координатами

2,

4 . . .), Z — модальность

распределе­

 

 

 

 

 

 

 

ния f(x), / — номер

цикла

 

 

 

 

 

 

 

выбрасывания

случайных

 

 

 

 

 

 

 

начальных

условий

b

 

(xk,

 

 

 

 

 

 

 

0 ) поиска экстремума

R.

 

 

 

 

 

 

 

Таблица 8-1 просчитана

 

 

 

 

 

 

 

на ЦВМ для случая К Р=Ъ,

0

_1___

I

I___I

I

1_

 

М =

300

(число

итераций

S0

100

150 200 250 300 350

по п), К*

=

0,02.

В

 

ней

Рис. 8-33. Изменение координат

для каждого о в правой ко­

лонке

представлено

число

центров

классов в

процессе

на­

мод

распределения

/

(х),

стройки

при

К* =

0,02; ст =

0,5.

найденных

алгоритмом

на

 

 

 

 

 

 

 

данном /-м шаге выброса

случайных начальных условий. В левой

колонке

пред­

ставлено соответственно число мод,

найденных

за

 

все

предыдущие циклы,

включая

й. Такого

же

рода данные

представлены в табл. 8-2 для

случая

Z =

К р, К* =

0,01,

М = 100, о = 0,5. Анализ результатов работы рассматри­

ваемого

алгоритма самообучения, представленных в

табл. 8 -1,

8 -2 , позволяет сделать выводы:

1) рассматриваемый алгоритм достаточно работоспосо­ бен при значительной сложности (Z) задачи самообучения; 2) экспериментальные результаты подтверждают теоре­ тические выводы, сделанные в гл. 7 относительно предла­ гаемого алгоритма поиска локальных и глобального экс­

тремумов функций; 3) чем больше а (степень пересечения классов), тем

ниже качество работы алгоритма при фиксированных Z,

Кр, К *, г, /•

Данный алгоритм был несколько видоизменен, так как очевидно, что задание начальных условий для поиска экс­ тремума функционала вторичной оптимизации (начальных значений координат центров классов) лучше производить

240

 

 

 

 

 

 

 

 

 

 

Т а б л и ц а

8-1

i

z

i

(7= 0,1

 

=0,3

a= 0,5

a= 0,7

a=0,9

i

 

i

2 2 2

2

2

2

2

2

0

0

2

 

2

2

2

2

2

2

1

2

1

0

0

 

 

 

2 3

2 2 2

0

2

r

2

0

0

0

 

 

4

2

1

2

2

2

2

2

0

0

0

 

 

5

2

0

2

0

2

0

2

0

1

1

1

 

1

3

3

1

1

1

1

1

1

1

1

2

 

2

3

2

3

3

1

0

1

0

1

0

 

 

3

3

3

3

3

3

2

2

2

2

2

2

1

 

 

4

3

3

3 '

3

3

3

2

1

2

2

 

 

5

3

2

3

2

3

1

2

2

2

1

1

 

1

2

2

2

2

1

1

1

1

2

2

2

 

2

4

4

3

3

2

1

2

1

2

1

3

4

3

4

2

3

1

2

1

2

1

2

2

4

 

4

4

2

4

3

3

1

3

1

2

0

 

 

5

4

4

4

4

4

3

3

2

2

1

1

 

1

3

3

2

2

0

0

0

0

0

0

2

 

2

4

2

3

1

1

1

1

1

2

2

3

5

3

5

3

5

3

2

2

3

2

4

3

4

 

4

5

2

5

1

4

1

4

2

5

2

 

 

5

5

1

5

1

5

1

4

1

5

1

241

 

 

 

 

 

Т а б л и ц а 8-2

 

£ = 1

,2 ,3,4,5,6

£=1 ,2 ,3,4,5,6 ,7

£=1 ,2 ,3,4,5,6 ,7,8

/

Z=Kp = 6

 

Z=Kp=7

Z=Kp =

 

 

 

8

1

0

0

3

3

2

2

2

2

2

4

1

4

3

3

2

1

6

2

4

1

4

4

2

6

2

5

1

5

4

0

7

3

6

2

6

4

1

7

0

6

1

7

4

0

7

0

6

2

8

4

2

7

2

7

4

9

5

1

7

1

8

3

1 0

5

3

7

3

8

2

1 1

5

1

7

0

8

2

1 2

5

1

7

0

8

2

13

5

2

7

0

8

0

14

5

0

7

1

8

3

15

6

2

7

2

8

2

16

6

2

7

5

8

1

17

6

0

7

1

8

1

18

6

1

7

2

8

3

19

6

2

7

0

8

0

2 0

6

1

7

2

8

2

242

Т а б л и ц а 8-3

 

Ч и с л о

Н омер

В ы бор

н ач а льн ы х услови й

 

М оды

 

 

 

 

i

м од

э к с п е р и ­

 

 

 

. х{г)

 

Z

м ента /

Р ав н о в ер о я тн о

ПО (*!> .

 

 

1

0

0

3

3

 

 

2

1

1

3

3

1— 4

4

3

2

2

3

4

 

 

4

0

2

3

4

 

 

5

1

2

2

4

 

 

1

2

2

1

1

 

 

2

1

2

5

5

1— 5

5

3

1

2

1

5

 

 

4

1

3

1

5

 

 

5

1

3

3

5

 

 

1

1

1

4

4

 

 

2

3

4

0

4

1— 6

5

3

0

4

2

5

 

 

4

2

5

3

6

 

 

5

0

5

1

6

 

 

1

1

1

4

4

 

 

2

3

3

1

4

1— 7

7

3

2

4

1

5

 

 

 

 

 

 

 

4

1

4

1

6

 

 

Г

4

5

3

6

 

 

1

4

4

2

2

 

 

2

1

4

4

6

1— 8

8

3

3

4

2

7

 

 

 

 

 

 

 

4

3

4

2

8

 

 

5

3

5

2

8

243

в виде координат первых Z образов, поступивших на вход СР в режиме самообучения. Повышение качества работы алгоритма самообучения в данном случае по сравнению с равновероятностным заданием начальных условий на некотором интервале иллюстрируется табл. 8-3, в которой для данных двух способов задания начальных условий и описанного выше алгоритма самообучения представлено число мод распределения, найденных на Л-м шаге выброса начальных условий и за Л шагов. В данном эксперименте

/С* — 0,02, а = 0,5, коэффициенты / (х) blt b2, Ья, biy Ь5,

Ьв, Ь7, Ьй соответственно равны — 9,1; — 7, — 3, — 5, — 1; 3,13. Пространство X ограничено интервалом [— 11, 5].

б) СР с N* выходными каналами

Вданном случае рассматривалась СР в виде слоя ЛПЭ

схарактеристиками N — \, N* — 3. Структурная схема

данной СР представлена на рис. 8-34. В данном случае

x k = { x ~ b [x ki Ы -

М «оз)]}2’ <8-10)

 

 

Ь1

ьг

 

Ьц х

 

 

—о---------1—

о —

4— о — |--------- о - » ~

 

 

аа/

аог

аоз

Рис. 8-34.

Структурная схема

Рис. 8-35.

К

расчету коорди­

слоя

ЛПЭ (N = 1).

нат центров

классов.

причем величина b (xk) однозначно определяется по извест­ ным в текущий момент времени величинам а01, а02, а03 в соответствии с рис. 8-35, табл. 8-4 и следующими выра­ жениями:

bi = a01-

 

ло£' ■а,о, £— 1

i = 2,3;

 

bi ~ \ £-1 + '

 

 

Ь* = а03+

 

 

 

 

Из (8-10) следует, что

 

 

 

dx'k

[x(n)-b(x,

n ) ] ^ - ^d L

(8- 11)

- 2

daoi

 

 

дх/n dani

 

244

 

 

 

 

 

 

 

■ Т а б л и ц а 8-4

ч

 

 

 

 

ь (Ч)

 

 

ь,

h

 

b3

 

 

 

 

xkl

1

+ 1

+

1

+ 1

Xk2

1

1

+

1

+ 1

xk3

I

1

l

4-1

Здесь согласно рис. 8-34 дхн1даы = — 1. Вектор дЫдхы вычисляется следующим образом. Таблица 8-4 мо­ жет быть представлена иначе, а именно в виде табл. 8-5.

Отсюда следует, что

дЪ (х/;)

db (хк)

db (хк) [&2-- Ьх, Ьз---&2> Ьц---bg\.

дхк[

дхк2

dxkz

Окончательный алгоритм настройки коэффициентов СР в данном случае выглядит:

a0i(n-\-\) = a0i(n) + K*oi [х{п) — Ь{хнп )\Щ ^ -

(8- 12)

dxki

Ч=Ч

Вектор b (xk, п) вычисляется либо так, как указано выше, либо (для СР с более сложной структурой) по рекур­ рентной формуле, аналогичной рассмотренной в предыду­ щем пункте. Экспериментально исследованный алгоритм содержит следующие этапы работы:

1.На вход СР поступает образ х (п).

2.Случайным образом на интервале изменения х за­

даются

начальные

значения

настраиваемых

параметров

а0( (i =

1, 2 , 3).

 

 

 

, 64.

3.

По значениям a0i вычисляются значения Ьъ

4.

Выбирается

компонента

вектора b (xk),

ближайшая

кх (п).

5.Для данной компоненты выбирается соответствующая

ввекторе дЫдхы.

6. Пользуясь данными пп. 1, 2, 4, 5 и выражением (8-12),

производят настройку коэффициентов СР.

7. На вход СР поступает образ х (п -f 1) и далее про­ должается процесс настройки, начиная с п. 3.

245

Т а б л и ц а 8-5

Исследовалось качество работы алгоритма как при оп­ ределенным образом задаваемых начальных условиях, так и при случайно задаваемых с усреднением результатов по множеству случайных выбросов начальных условий на­ стройки.

На рис. 8-36 представлена иллюстрация динамики на­ стройки СР при определенных начальных условиях (ко­ ординаты мод равны 3, 5, 7; сплошная линия — один ва­ риант, пунктирная — другой).

На рис. 8-37, 8-38 представлены некоторые результаты работы алгоритма при случайных начальных условиях и конечной последовательности образов, а также заданных

246

начальных условиях и различной длине последовательно­ сти образов. Жирные линии соединяют коэффициенты цент­ ров классов начальные (п = 0) и ' конечные (п = М) моменты настройки.

Рис. 8-36. Динамика стройки коэффициентов представленной на рис.

Рис. 8-37.

Результаты

иссле­

Рис. 8-38. Результаты ис­

дования слоя

ЛПЭ

в режиме

следования слоя ЛПЭ в ре­

самообучения

при

различных

жиме

самообучения

при

начальных

условиях

и

оди­

одинаковых

начальных

наковой длине выборки

М на

условиях

и

различной

 

входе.

 

 

 

длине выборки М на входе:

 

 

 

 

 

 

М 4

=

150;

М г = 300;

 

 

 

 

 

 

М3

=

450;

=

600.

в) ЛПЭ с К р решениями

В данном случае

** = 1 + Т 2 [sign ( £ - « /./+1) + 1].

g (п) = (п) X (п)а0 (п)..

Как и ранее,

247

Используя полученные в гл. 7 значения дхк1да, для дан­ ного случая можно записать рекуррентные выражения, являющиеся основой для построения соответствующего алгоритма настройки СР в режиме самообучения:

а0 (п + 1) = а0(п) — К*о [х (п) Ъ(х4)]

,

Ко> 0;

dxk

 

ах (n + 1) = Й1 (п) + К Г [х (п) b (х*)]

dxk

sign х.

 

 

Алгоритм настройки СР содержит в данном случае сле­ дующие этапы:

1.На некотором заданном интервале случайным обра­ зом выбираются значения коэффициентов а0 и av

2.В соответствии со структурой разомкнутой СР и значениями коэффициентов а0 и аг вычисляются текущие

значения

порогов

а/./+1 + ао(»)

 

 

 

х,/, / i :

 

 

 

Щ(п)

 

3.

Вычисляются значения

b (хк) в соответствии с выра­

жениями

 

 

2,3"

4,2

 

 

 

\ = ХМ

 

 

 

 

 

 

bj -

(Xj_u j + X. /+ ,)

, / — 2, 3,

^ р- ]

 

 

 

 

 

 

■х

1, к г

сК п- 1 ,

<-Кр-2, * р -‘

 

 

 

 

 

4.На вход СР в момент времени п поступает образ х (п)

ивычисляется величина xk.

5. По величине xk выбираются соответствующие значе-

, / ч дЬ (хь)

.

ния о (xk) и — —

dxk

 

6 . Производится коррекция настраиваемых коэффици­ ентов а0 и Й! в соответствии с приведенными выше выраже­ ниями.

7. Процедура повторяется начиная с п. 2.

8 . Процедура повторяется начиная с п. 1, и результаты усредняются по множеству выбросов начальных условий.

Экспериментально в данном случае исследовалась лишь работоспособность алгоритма. Результаты не приводятся ввиду ограниченности объема книги.

248

8-10. Двухслойная СР в режиме самообучения

Вначале предметом исследования являлась двухслойная СР, в которой в первом слое было четыре ЛПЭ с двумя ре­ шениями, во втором — ЛПЭ с /Ср = 5 решениям. Здесь

xk = F(g)= 1 + — 2

sign

2 aysignx

feP=>

 

/= 1

' N= 2

kv

+1

X 2 atixt

(= 0

 

 

С использованием материалов гл. 7 были получены вы­ ражения, являющиеся основой для построения замкнутой двухслойной СР в режиме самообучения, в следующем виде:

ау(п + 1) =

--aj(n)+K* (n)—b (хк,п)]тдЬ^ к’ n)sign

2

(”)*/(«)

 

 

дхк

1— 0

 

 

 

 

 

/ =

1, •

• • . 5;

 

 

ац (п + 1) = аи (п) +

 

 

+ К** [х(п) — Ъ{хк,

п)]т

(xk\n) sign [а,(п)х{(п)],

 

 

дхк

 

 

i= 1, • ■•

. N\

i = i.

 

 

Ъ(хк, n) = b(xk, п) + К***[х(п) — Ъ(хк, n)].

Экспериментальное исследование данного алгоритма по­ казало, что скорость сходимости при нахождении некоторой локальной моды мала и причиной этого является примене­ ние в многослойной СР ЛПЭ с двумя решениями, которые в значительной степени «загрубляют» информацию о гра­ диенте функционала вторичной оптимизации при кванто­ вании выходного сигнала. В связи с этим основным пред­ метом исследования являлась двухслойная СР, по струк­ туре подобная описанной выше, но состоящая из ЛПЭ с кон­ тинуумом решений. Для данной СР

К р= 5 Г Я = 4

ч -

1 -

 

2

— arctg В

arctg В х

 

2

кр

П

/=1

 

 

х

(

N

 

 

 

 

2 а и ч

 

V1=0

249

Соседние файлы в папке книги из ГПНТБ