Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги из ГПНТБ / Галушкин, А. И. Синтез многослойных систем распознавания образов

.pdf
Скачиваний:
11
Добавлен:
22.10.2023
Размер:
12.65 Mб
Скачать

ж) Двухслойная СР с обратными связями (рис. 4-17, в)\

xk (п) -■ F [g («)]; g (п) = 2 ару (п) + akxk («— 1); /=о

Xki (И) = F Igy («)];

N

 

gj (n) = V a,,*, (n) +

 

 

о

 

|- akixk (n

1) -1- akjxkj {n— 1).

(4-11)

В принципе возможно рассмотрение многослойных СР произвольной заданной структуры с обратными и пере­ крестными связями. Объективная необходимость введения перекрестных связей в многослойных СР отмечается и обо­ сновывается в следующем параграфе, а обратных связей— в гл. 8 при исследовании замкнутых СР нестационарных образов.

4-6. Оптимизация структуры многослойных СР с перекрестными связями

Вопрос выбора структуры разомкнутой многослойной СР является сложным. Структура разомкнутой СР может задаваться либо априори, либо исходя из соображений, высказанных выше при рассмотрении двухслойной и трех­ слойной СР, либо исходя из ограничений технического характера. Ниже рассматривается возможность выбора структуры (числа слоев и числа ЛПЭ в слое) многослойных СР с перекрестными связями, состоящих из ЛПЭ с двумя решениями.

Необходимо остановиться на критерии сложности задачи распознавания решаемой многослойной СР. При использо­ вании детерминированной модели СР таким критерием мо­ жет служить количество эталонных образов, заключаемых в замкнутые области гиперплоскостями, реализуемыми ЛПЭ первого слоя в исходном пространстве признаков. При рассмотрении вероятностной модели СР каждому эта­ лонному образу соответствует мода функции распределе­ ния вероятностей совокупности образов на входе СР. При этом в каждой области исходного пространства признаков многослойная СР выделяет уже не эталонный образ, а не­ которое компактное множество образов. При многомодаль­ ных распределениях совокупностей образов на входе СР эти компактные множества могут характеризоваться об­ ластями в многомерном пространстве признаков, образо-

110

ванными линиями равных значений плотности распреде­ лений (на определенном уровне). Число и сложность дан­ ных областей совместно характеризуют сложность решае­ мой задачи. При этом детерминированная модель СР может рассматриваться как частный случай вероятностной и реа­ лизует, по сути дела, систему памяти для конечного числа многомерных векторов. Принимая в данном параграфе за критерий качества многослойной СР число областей, реализуемых подобной СР в исходном пространстве при­ знаков, необходим отметить, что качество многослойной

Рис. 4-18. Двухслойная СР с перекрестной связью, одномерный вариант.

СР с последовательными связями, рассмотренной выше, монотонно возрастает при увеличении числа слоев и числа элементов в каждом слое. Поэтому в подобной СР задача оптимизации структуры (минимизация числа ЛПЭ и числа слоев) может быть поставлена только либо в плане ликви­ дации избыточности числа ЛПЭ, либо при наличии ограни­ чений на число ЛПЭ.

Основное внимание ниже уделяется многослойным СР с полными перекрестными связями, когда множество при­ знаков каждого слоя состоит из признаков исходного про­ странства и выходных сигналов первого, второго и (/—1)-го слоя. Для подобной СР задача оптимизации структуры, в частности выбора числа слоев и числа ЛПЭ в каждом слое при ограничении на общее число ЛПЭ в сети, является актуальной.

Рассмотрим на простейшем примере одномерного варианта, когда N = 1 (одни признак х), принцип действия перекрестной связи. Структурная схема рассматриваемой двумерной СР представ­ лена на рис. 4-18. Разделяющая поверхность, реализуемая подоб­

111

ной

СР при отсутствии

перекрестной связи, представлена на

рис.

4-19. В областях /,

//, III аналоговый выходной сигнал CP g

при включенной перекрестной связи представляется следующим образом:

£l = «0 + апХ~ а1 - аГ

gll = а0+ апХ+ а1 ~ аГ em = ao + anx + ai + a2-

Каждую из областей I, II, III СР делит на две подобласти, где g > 0 и g < 0. Из условия равенства нулю gv gn , ^ следуют вы­

ражения для дополнительных порогов при включении обратной

связи

в пространстве

X:

 

 

 

 

.,

ЩН"

л

 

а0 . ..

Щ

а0 _

ctn

Л1 —

 

 

>

Х2--

~

>

Хд-- ------- ----------- .

■'-—О'

 

X

 

Рис. 4-19. К принципу дей­

 

 

 

ствия

перекрестной

связи

I

°-т

 

Л

а 02 Ш

 

в многослойных СР.

Таким образом, рассматриваемая СР (рис. 4-18) реализует максимально пять порогов, делящих ось х на шесть областей. В этом случае СР, изображенная на рис. 4-18, эквивалентна (по критерию максимума количества областей, реализуемых кусочно-линейной разделяющей поверхностью в исходном пространстве признаков) многослойной СР с последовательными связями с пятью ЛПЭ в пер­ вом слое, т. е. СР с перекрестными связями реализуется значительно проще, чем СР с последовательными связями.

В процессе анализа многослойной СР необходимо знать максимальное число областей, на которое пространство признаков размерности N может быть разбито Н 1 гипер­ плоскостями. Согласно результату, полученному в [Л. 19],

максимальное количество

областей

¥ NH

определяется по

следующей рекуррентной формуле:

 

 

 

 

¥

¥

 

4 - ¥

N- 1,

Н,—1

(4-12)

N H ,

N , H , - - Р

т

 

или в нерекуррентном виде

 

 

 

 

 

 

T „Hl = C" _

, + 2 v 'c ; ( _ r

 

(4-13)

Здесь имеется в виду,

что

1--0

 

 

 

 

 

 

 

 

 

С] = 0

при /-<s.

 

 

 

Отметим, что из (4-12) следует:

 

 

 

 

WNH, =

2" ‘

ПРИ Я , <

N

 

(4-14)

^

я < 2

Я‘

при

H{ > N.

.

(4-15)

112

Вывод верхней и нижней оценки количества областей

Рассмотрим многомерный вариант (г -- 1, . . . , N) СР, структура которой представлена на рис. 4-20. Обозначим количество областей, на которое разбивает исходное про­ странство признаков (у—1)-слойная СР через f где

через [/—1] обозначено условно эквивалентное количество гиперплоскостей, реализуемых многослойной сетью с пол­

ными

перекрестными связями

и с

(у— 1)-м слоем. Данная

сеть

содержит

L.

 

/'-1

 

 

где через Н обозначено

 

- - V

Н . ЛПЭ,

 

 

 

 

 

 

г=1

 

 

 

 

 

количество ЛПЭ в i-м слоеСР.

 

 

 

 

Как

следует

из

структурной

 

 

 

 

схемы, входные каналы каж­

 

 

 

 

дого h,-го ЛПЭ у-го слоя (hj -

 

 

 

 

=

1.......... Hj) могут быть раз­

 

 

 

 

 

делены на два множества.

 

 

 

 

Первое множество составляют

 

 

 

 

входные

сигналы

СР,

вто­

Рис. 4-20.

К решению задачи

рое — выходные

сигналы СР

оптимизации структуры разом­

с

1-го,

2-го,

. . . ,

(у—1)-го

кнутой

СР с полными после­

слоев. Тогда

уравнение

раз­

 

довательными связями.

деляющей поверхности, реа­

 

слое,

имеет следующий

лизуемой одним hj-м ЛПЭ

в /-м

вид:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

аГлх“

а£;-

аГ л ,/- 1

=

0-

 

Здесь

ah . — вектор

настраиваемых

весов входных сиг-

 

 

 

/

элементе

(ЛПЭ)

A.; ah2 — вектор настраи­

налов СР на

ваемых весов входных и промежуточных сигналов (у—1)-

слойной сети элемента А.; а? — порог А.-элемента; х. .

.

/ «у

/

К» /

I

вектор выходных сигналов ЛПЭ (у—1)-го слоя.

Отсюда следует, что по отношению к исходному прост­ ранству признаков каждый из ЛПЭ в у-м слое реализует столько параллельных гиперплоскостей, сколько вариантов вектора xk ._t порождает (у—1)-слойная СР. Предполагая,

что существует метод настройки СР, при котором все ги­ перплоскости, порождаемые вектором в у'-м слое,

попадают в область исходного пространства признаков, соответствующую ему, запишем рекуррентную формулу для вычисления верхней оценки в виде

X^ N [/] =

[ i - \ ] ^ N H j •

(4 - 1 6 )

113

Это следует из того, что каждая из Ч ^ ^ .^ областей выделяемая (/—1)-слойиой подсетью, разбивается на XVNII. областей. Здесь Ч *^. определяется рекуррентным выра­

жением (4-12). Запишем теперь нерекуррентную формулу. Из (4-16), а также из того, что первый слой СР разбивает

пространство признаков на

Ч ^ ^ областей, следует:

WN [/]

И V NH{'

(4-17)

 

1=1

 

Для вывода нижней оценки количества областей потре-

буем от каждой из Ч*1

гиперплоскостей,

порождае-

N [ / - I ]

 

 

мых hj-м ЛПЭ, выполнения условия более сильного, чем попадание в область, соответствующую вектору хА ._г

Именно потребуем, чтобы некоторое количество гиперпло­ скостей из 4*^ могли быть проведены через любую точку

исходного пространства изменением только свободного члена в уравнении гиперплоскости. Отметим, что в этом случае эти гиперплоскости, несомненно, могут попасть в любую область. Для оценки их количества составим си­ стему линейных уравнений относительно настраиваемых весов и порога элемента hx

 

0 . . .

0

0

1

хг _

 

0

 

0

1

1

хг

Ч'N [ / - 1 ] '

0

 

1 0 1 х т X

 

 

 

1

1

1

хг

 

 

Ч- 1

 

 

 

 

а 1к/ 2

 

 

q i

 

 

 

 

 

 

 

 

 

а '2Н-2

 

 

 

 

 

 

 

=

 

 

 

(4-17а)

ao - , v

 

 

 

 

 

 

0

 

 

 

 

 

 

а/,.

 

 

 

 

 

 

J

 

 

 

 

 

_

av

_ wL-

 

 

1J

 

114

Здесь q. [i — 1, . . . ,

— произвольно зада­

ваемые числа. Отметим, что

количество чисел qh которые

можно задать произвольно, не нарушая равенства (4-17а), есть искомое число гиперплоскостей из числа [;._j

которые могут быть проведены через любую точку исход­ ного пространства. Из (4-17) следует, что это число есть (Ls_j + 1), т. е. равно размерности вектора ah2 плюс еди­

ница.

Отсюда следует рекуррентная формула для вычисления нижней оценки количества областей:

[/] =

[/-1] ~ ' (^у-1 + 1 ) + (^/-1 +

1 ) XVNHj

Здесь ¥

—число областей, в которых не

проводятся новые гиперплоскости; (L._j +

1) XVNH,—число

новых областей, которое появляется после разбиения.

Окончательно

 

 

 

[/]=

[/-1] +

(^/-1 +

1) j^ N H j ~ ~ 1] ’

 

 

 

 

(4-18)

 

L l = L i - i +

H r

 

Выражение (4-18) есть окончательный результат вывода. В одномерном случае (4-18) имеет следующий вид:

v . [ n = 4ri[/ - u+(L /-. + 1№

(4-19)

L. = V 1+ tfy.

 

Частная задача оптимизации

Можно сформулировать несколько задач оптимизации структуры многослойных СР с перекрестными связями.

1. Задано число слоев и число ЛПЭ многослойной СР. Найти распределение ЛПЭ по слоям, максимизирующее число областей ¥ , образованных кусочно-линейной разде­ ляющей поверхностью, реализуемой данной многослойной

СР в исходном пространстве признаков.

2. Задано общее число ЛПЭ сети. Найти число слоев и распределение ЛПЭ по слоям, максимизирующее ¥ .

3.Задано количество областей ¥ , которое должно быть реализовано сетью, и число слоев в ней. Найти структуру, минимизирующую количество элементов в сети.

4.Найти структуру (количество слоев и распределение

ЛПЭ по слоям) при заданном ¥ , минимизирующую коли­

115

чество ЛПЭ в сети. Отметим, что оптимизация структуры по числу областей представляет частный критерий опти­ мальности СР. Рассмотрим синтез структуры одномерного варианта сети для указанных задач оптимизации.

1. Для заданного числа слоев CP

W и числа ЛПЭ во

 

w

Д/> найдем распределение элемен-

всей сети Я, равного ^

тов по слоям,

/=1

 

 

максимизирующее VP1U7. Формально задача

ставится в виде соотношений,

записанных с учетом (4-17)

и (4-12):

w

 

 

 

 

 

 

V

H j ~ Я ;

 

 

i=‘

 

(4-20)

 

,

 

w

 

max

 

 

=

И (Я .+ 1).

 

1[W] ' Н.

н w i 1

 

Метод множителей Лагранжа дает решение в виде си­

стемы уравнений

 

 

 

w

 

'

 

. . . , W;

I I

( Я ;- ~ | 1 Н - Я = 0,

/ 1 ,

/=1

 

 

 

 

i+1

W

 

 

(4-21)

 

 

 

 

я,— Я

= 0.

 

 

V

 

 

 

 

.

 

/=1

 

Решением системы (4-21) являются:

 

 

Д /= W Я ( /= 1,

wy,

 

X

н_

W—1

(4-22)

 

W

 

 

 

 

 

 

Из (4-22)

и (4-17) следует,

что при этом

 

U/opt

_

w

(4-23)

 

 

 

 

 

 

т. е. при заданном числе слоев имеющееся число ЛПЭ надо

распределять по слоям равномерно.

В связи с (4-22) воз­

никает

вопрос о

целочисленное™ Hf (j = I,

, W).

Если Я

не делится на W нацело, то,

как следует из (4-17)

и (4-22), остаток

элементов также

следует распределить

по слоям равномерно, причем не имеет значения как именно.

116

В этом смысле (4-23) есть верхняя оценка 4r?pt IW ], которая становится точной верхней оценкой при Я — KW, где К — целое.

2. Для заранее незаданного числа слоев W и при огра­ ничениях на количество ЛПЭ Я в сети найдем оптималь­ ную по верхней оценке структуру. Это можно записать сле­ дующим образом:

шах

 

 

W<H

 

(4-24)

W

 

2 Я, =

Я-

 

Из очевидного неравенства с учетом (4-23)

w

Н

w \ 1

< W

 

 

 

следует, что число областей с ростом числа слоев монотонно возрастает. Отсюда получается, что оптимальной в данном случае является Я-слойная сеть с одним элементом в каж­ дом слое, для которой из (4-23) следует, что

есть точная верхняя оценка.

3.Для заранее заданного числа слоев W и суммарного

количества ЛПЭ в сети найдем структуру, оптимальную по нижней оценке. С этой целью представим (4-19) в виде

нерекуррентной формулы:

 

У 1[Г]

(4-24а)

 

w

Условный экстремум (4-24а) при условии

= ^ С0‘

 

i=1

гласно методу множителей Лагранжа достигается в случае,

если

Я г- (г = 1,

. . . , W) являются

решениями системы:

 

 

Hi (к

1)4- Я -f 1 =

0;

 

 

w

н {- н = о,

(4-25)

 

 

2

 

 

 

i—i

 

 

где

/ = 1, . . . ,

W.

 

 

117

Отсюда

 

 

 

 

 

Н1 = Н2—

. . . Hw = - ^ - H

и

при

заранее

заданном W

 

ч 'Г Ь ,- 1 + н +

№_

fP_

(4-26)

 

2

2W

 

 

Из (4-26) следует, что

 

монотонно возрастает при

W -> со и является точной

при Я -- KW, где К — целое.

Отсюда

— 1 -----L—

для

Я-слойной

сети с одним

ЛПЭ в слое. Таким образом, в одномерном случае (N = 1) структуры, оптимальные по верхней и нижней оценкам, совпадают.

Для многомерного варианта сети, оптимальной по верх­ ней оценке, на основании (4-17), так же как в одномерном случае, можем записать:

m ° p t — m a x

 

w

max

П YNHf

 

N W<H Нг . . .

Яд, /=i

 

W

(4-27)

v H, =

H.

/=1

Из (4-27), а также из (4-14) и (4-15) следует, что усло­ виям оптимальности (4-27) отвечает целый класс структур, именно все структуры, для которых Я,- < N (/ = 1, . . .

. . . , Г ) :

w

 

 

2 Я / = Я.

 

(4-28)

Для

 

/=1

 

 

 

этих структур

 

 

 

 

 

 

W

 

 

 

 

Ч 7 ‘ =

-

Hi

2Н.

(4-29)

 

2'“ ‘

=

Для

структур,

у

которых

Яу> Я , для

любого

(/= 1 , ... ,U 7 ) ¥ ° / m

< 2 H.

 

 

 

4-7. Оптимизация структуры по некоторым основным топологическим характеристикам

При технической реализации СР возникает естествен­ ное желание ограничить суммарное число входов в сети, вызванное тем, что число входов есть число технически трудно реализуемых блоков умножения. На этапе настройки

118

выбранной структуры число входов равно размерности пространства настраиваемых коэффициентов, в котором производится поиск экстремума функционала качества СР. Поэтому уменьшение числа входов многослойной СР облегчает как реализацию, так и настройку.

Для СР с полными перекрестными связями суммарное

количество входов ЛПЭ в г-м слое равно:

 

yr^ { L r VN )H ir il= 1, . . . ,

W.

Отсюда следует выражение для суммарного количества

■■ходов ЛПЭ в 1С-слойной сети:

 

 

W

W

/ i

 

w

[ w :2 V

2 2 Я /+

N H, = N % H +

/=1

/=i

\/=1

w

/=1

 

+ - Я 2------

(4-30)

 

2 Я Л

 

2

2

/=1

 

На основании

(4-30)

задача

синтеза многослойной СР

с полными перекрестными связями, оптимальной по верх­ ней или нижней оценке количества областей при ограниче­ нии на суммарное число входов у в сети, формулируется следующим образом:

¥ NWV

шах

шах

¥ N [ W ] '

 

 

W

W

н1 . . . н W

 

W

(4-31)

 

■W

 

? > * 2 я / + т

2 н !

- | 2 ^

 

/=1

/

\/=1 /

1

/=1

 

Индекс* означает экстремальное значение. С учетом (4-30) обратная задача, т. е. задача синтеза многослойной СР с полными перекрестными связями, минимальной по суммарному числу входов, при ограничении на количество областей ¥ , реализуемых СР, имеет следующий вид:

y'L = min шш

w

,

W

\ 2

N V

Я. + —

2

"

/

W h \ . . . Hw

-fcJ

I 9

7= 1

 

h

-1

 

1

W 9

 

 

 

(4-32)

z/=i

¥'> ¥

N [ № ] ^ -

В формулах (4-31) и (4-32) ¥ ;V[U7] в зависимости от вида оценки определяется выражением (4-17) или (4-18).

119

Соседние файлы в папке книги из ГПНТБ