Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги из ГПНТБ / Галушкин, А. И. Синтез многослойных систем распознавания образов

.pdf
Скачиваний:
11
Добавлен:
22.10.2023
Размер:
12.65 Mб
Скачать

Двухслойная СР. Рассмотрим случай ограничений на коэффициенты ЛПЭ многослойной СР. Ниже представлены рекуррентные соотношения, являющиеся основой для по­ строения замкнутых СР в данном случае.

Ограничения типа равенств («а» — второй слой, «б» — первый слой):

а) а' (п ф 1) = а' (п) ф Ка'а' (я)

хАп) dF(g)

Ч (я) +

 

 

dg

 

g = g ( « )

Ф 1А/ (п )

-\~Ka-\- (П)

Н,

 

 

21 aj{n)— a

 

 

i= о

 

 

 

 

dF(g)

 

xk (п) +

К'(п+\) = К'(п)-'\-Кх'а' (п) х (п)

 

 

 

dg

g=g(л)

 

 

я,

ф U ' ( n )

+ ^ v (Я)

 

 

21 М л) — 106

 

 

/=о

 

 

б ) ау- (я ф 1) = ау(/г) ф / С а д (я)

X —2ау (/г) Xg (я) dffe)

dg g=g(«)

X

dF (gj)

х(я)ф

dBi gj=gjW

N

+ KS7a7. (я) 21 au {n)— a + 1 (я); i=0

Xj(n + l) = bj(n)+ Kifjiri) Да,- (n) xg(я) dF(g)

x(n) +

dg g=g(n)

N

Ф(я) 1 + К1^(п) 21 яц (я) —a

;=о

Ограничения типа неравенств («а» — второй слой, «б»— первый слой):

а) а' (п ф 1) — а' (я) ф /Cav (я) **(я) ^ (g )

(я)+

 

g = g ( n )

Ф QX (п) + К<к(я)я [а' (я)];

 

180

Х(л + l) = max О, X (п) + Kla' («) xg(n) dF (g)

----------------------- mn

xk ( n) +

dg g=g<rt>

+ QX (n) + K h ( n ) q [a'(n )]j.

Здесь Q и q определяются так же,

как в гл. 6:

б) а, (л + 1) = aj (п) + /G .0/ («) X

 

 

X

—2aj(n)xg (п) dF(g)

dF (gj)

x(n) +

 

 

dg

g=g(n)

dgj

gj=gj(n)

 

 

+ QX/ (n)

+ Kl.%j (n)q[ai (n)y,

 

 

к, (n + 1) = max jo, X/ (n) + /С уу (л)

X

X

-2aj (n) xg(n) dF(g)

 

dF (gj)

x(n) +

 

 

dg

g=g(n)

dSi

гг g/<">

 

+ QX/ (n)

+ K lyx .(n)g[a/(n)]j.

 

Представленные алгоритмы достаточно просто могут быть обобщены на произвольное число слоев и для случаев ограничений произвольного частного вида.

7-6. Реализация критериев первичной оптимизации в ЛПЭ с двумя решениями

Рассмотрим критерий минимума средней функции риска. Выражение для преобразованной дискретной ошибки мо­ жет быть представлено

= ( е - х А) [ - 2 А + С) ( 6 - 1) + (2В + С) (е + 1)] -L +

+ — (е + xk)

181

Необходимая для построения замкнутой СР величина градиента в данном случае

 

 

,2

,

дха

 

 

 

дхе

 

 

 

2х' (п)

 

да{

 

 

 

да{

g V

 

 

или,

иначе,

 

 

 

 

 

^

= \ { г - х к) [(— + С) (е—1) +

 

(2В + С) (е + 1)] ± - +

дсц

{

 

 

 

 

4

+ - у (е + хк) /в| 2 sign xt j ~

к ---- Х-

[(—2А +

1) (е— 1) +

 

+

(2В +

С )(е+1)] .

(7-6)

Величины А, В,

С здесь определяются

выражениями

(5-13) и (5-14). В случае (5-14)

,2

= —2xgsignxt j ~ [ ( / i 2 —/ц )(е— 1)+ (/21— ^22) (е + l)]j •

(7-6a)

При использовании выражения (5-14а) для формиро­ вания преобразованной дискретной ошибки имеем:

^ = ( 8+ ^ ) [ Zu (8- 1) + Z22(e + l ) ] 'Y

+

+ (е—xk) [Z12 (е— 1) -|-Z21 (е + 1)].

(7-7)

После соответствующих преобразований получаем:

.2

% = Т :sig" К1—1')1(z‘ ~z‘,) V+ ** (z.1-

2Z.J +

- |-(l+ « )[(Z |1- Z y x 1, + I t (Za - Z !1)2Z2!]|

, (7-8)

что совпадает с полученным выше результатом при исполь­ зовании ЛВС-преобразования при Z 11 = Z 22 = 0. Оценку градиента второго момента распределения преобразованной дискретной ошибки можно получить, используя иное, не­ жели (7-7), выражение для xg:

4*g = (1

[(1 + S)Z22 +

(1 e) Z21] +

+ ( ! - * „ )

[(l+ e )Z 12 +

( l _ e)Z n| .

182

В приведенных выше выражениях Zk k == j/~ /

обеспечения равенства R = x'*.

Критерий минимума R при условии pirx~ р 2г2 опре­ деляется следующим образом. Оценка градиента R * (5-17) по настраиваемым коэффициентам выражается в виде (7-6), где коэффициенты А, В, С определяются выражением (5-18). Оценка градиента R* по А определяется в виде оценки пер­ вого момента распределения преобразованной дискретной ошибки, записываемой в соответствии с (5-19) и (5-20)

1

~- = ie ~~xk) К—2ЛХ+ Ci) (е— 1) + (2В]. -j- Сх)(е +

1)] — +

+ ~ (е + xk) Ci е.

(7-8а)

Выражения (7-6), (5-18), (5-20) и (7-8а) служат в дан­ ном случае основой для построения соответствующей замк­ нутой СР.

При использовании для формирования преобразован­ ной дискретной ошибки СР преобразования Z, описанного выше, выражение для оценки градиента R* по а{ опреде­ ляется (7-8) и (5-21), а выражение для оценки градиента R* по А:

(7-9)

Определим критерий минимума R при условии р 1г1 — = const. В данном случае оценка градиента R* (5-24) по настраиваемым коэффициентам выражается в виде (7-6), где коэффициенты А, В, С определяются выражением (5-25). Оценка градиента R* по А определяется в виде оценки пер­ вого момента распределения преобразованной дискретной ошибки, записываемой в виде (7-8а) с коэффициентами А ъ В ъ Съ определяемыми (5-26). При использовании преобра­

зования Z x выражения для оценок градиентов R*

по at

и А определяются соответственно (7-8), (5-27) и (7-9),

(5-28).

183

7-7. Реализация критерия минимума средней функции риска в ЛПЭ с континуумом и К решениями

Для ЛПЭ с континуумом решений (два класса образов)

всоответствии с (5-30) имеем:

6)2,2 (xg) + — (1— e)Z1(Jce) —

Y (1+ е) V k (хк) + ± ( \ - г ) У ~ 1 1(xk) (7-9a)

Здесь

Xk = E — Xg = F(g)

После некоторых преобразований получаем необходи­ мое выражение для оценки градиента средней функции риска через текущие сигналы в СР в следующем виде:

1

dF(g)

(1+е)

dl2(xk)

(1 - е )

dli (Xk)

(7-10)

2

dg

dxk

 

 

 

dxb

 

В частном случае

 

 

 

 

 

 

 

h (xt) =

(1 + **)2!

k

(**) =

(1 — xkf \

 

 

/1( - 1- x g) = (1- l

-

^

= 4

 

 

xg = - L ( l + e ) x g + - L ( l - e ) x g = xg.

Отсюда

dx„

- 2 d- L ^ Xixg dat dg

что соответствует ЛПЭ с минимизацией a 2g, рассмотрен­ ному в § 7-2. Из (7-10) следует известное выражение для оценки градиента R в случае двух классов образов и ЛПЭ

сдвумя решениями в виде (7-6а).

Вслучае континуума классов образов (гл. 5)

=(xg) = y^l [(е—xg) е] ;

тп

dxg _ d l ( x k, е) dF (g) X; .

(7-11)

da; dxk dg

Отсюда как частный случай следует соответствующее выражение (7-10) для двух классов образов. В (7-11) функ­

ция должна быть задана априори.

дхк

Для ЛПЭ с К решениями классов образов) выходной сигнал (гл. 4) описывается следующим выражением:

xk= FP(g) = l + - ^

2

s i g n M M p J + 1

 

 

*p=1

 

 

g = 2

 

°iXi-

 

Здесь, как и ранее,

1=0

 

 

 

 

 

 

 

 

дх,

г П

 

ч

, ^ ,

(7-12)

а а

 

UCti

dXfo

 

 

yflj

 

где l (xk, e) — X /б)-матрица,

элементы которой

пред­

ставляют собой первую разность соответствующей дискрет­ ной функции I (xk, е). В частности, эта матрица может иметь следующий вид:

 

 

 

 

0

1

1 .

.1

-

 

dl(xk, е)

 

— 1

0

1 .

.

1

 

 

— 1

- 1

0 .

.

1

(7-13)

дхк

 

 

 

 

 

 

— 1

- 1

- 1 .

.

0

 

В формуле

(7-12)

 

 

 

 

 

 

 

 

дчk

 

К - 1

 

 

г

 

 

 

 

1 V 4

д .

kji

 

 

 

да,

 

 

 

 

 

 

 

 

 

‘ = т

2

^

3‘в п ^

 

 

 

 

 

 

к

 

 

 

 

 

 

 

 

 

 

feP=‘

 

 

 

 

 

 

 

 

К-- 1

 

 

 

 

Вх[

 

 

 

= — V . П т

 

 

 

 

 

 

л

 

l + B * (g - flV p + 1 )

 

2

2

вВ-оооо

 

 

 

р

 

 

 

 

 

 

у

 

 

Отсюда следует,

что

 

 

 

 

 

 

 

 

 

 

.

 

дх.

= sign xt

 

 

 

 

 

sign

 

 

 

 

и окончательно

 

 

 

дас

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

дхё _dl (хк,

е) Sign Xt.

 

 

 

 

 

да{

 

дхк

 

 

 

 

185

7-8. Реализация критерия минимума средней функции риска в СР с N* выходными каналами (слой ЛПЭ)

Ниже рассмотрено построение замкнутых CP с N* вы­ ходными каналами. Построение оптимальных моделей та­ ких СР и выбор для них функционалов вторичной оптими­ зации рассмотрены в гл. 2 и 5. Здесь рассматривается слу­ чай одинаковой размерности сигналов е и xk, хотя в прин­ ципе эти сигналы могут иметь различную размерность.

При вычислении преобразований дискретной ошибки, когда выходной сигнал имеет по каждому каналу Ко гра­ даций, измеренный вектор дискретной ошибки, имеющий вид:

(Б1> • • •>

[xxk............

XN*k)=={^1 ’

■•

^N*)

(^1р ’

• • •’

^N*p) = {Xlg’ • • •’

XN*g]

умножается на скаляр (5-33) и далее вычисляется норма результирующего вектора. Отсюда

*t = V xZ + - " ■+xN*e = V l {kv

ъ ь

•• •y KN*> *lp>• -’^N*p)

если

(Ej>

. . ., Еуу») =

• •■M kN,) и

[Xlk’ • •

•> XN*k) ~ (^lp’

• • •> ^N*p)-

Рассмотрение общего случая Ко градаций выходного сигнала СР по каждому каналу, имеющего вид:

не является принципиальным. Поэтому остановимся на случае Ко = 2:

 

 

 

 

sign gt..

 

Можно

показать,что

 

 

 

дх'е

д

, ,

 

 

,

да

~ дх

^(8 >’ ‘

 

’ 8лг*’ *1*’

' ' ‘ ’ XN*k) Х

oaii*

oxi*k

 

 

 

 

 

 

X

д

x i*k‘

(7-14)

 

 

да.

 

 

 

 

 

186

Здесь / (вр . . . .

eN„ xlK. . . , xN*k) [2N* x 2W*) мат­

рица. Градиент вычисляется как

соответствующая пер­

вая разность по x.*k

дискретной

функции. В частности,

эта матрица может иметь вид, аналогичный (7-13). Вели­ чина дх.*к/да(. определяется только своим знаком следую­

щим образом:

дхi*k

sign sign*,-.

да;;*

Пусть система распознавания имеет континуум решений по каждому из N* каналов. Предполагается, что функции F идентичны для каждого выходного канала. Преобразо­ ванная дискретная ошибка, первый начальный момент рас­ пределения которой равен средней функции риска R, по­ лучается как сумма квадратов компонент вектора измерен­ ной дискретной ошибки, преобразованной в соответствии с (5-34):

= [ Д [в4. - Р , . ( х ) ] 2 = /[Р (х), е].

Вданном случае

иокончательно

дх„

дХ;* I (8j, .

4k’

 

даи*

XN*k) *

X dF (Si.) xi(n). dg;*

Это выражение служит основой для построения соот­ ветствующей СР, настраивающейся по замкнутому циклу.

7-9. Реализация критерия минимума средней функции риска в многослойных СР

Ниже для трех типов многослойных СР представлены алгоритмы настройки по замкнутому циклу, реализующие критерий минимума средней функции риска. Обобщение результатов на другие критерии, рассмотренные выше для ЛПЭ, не представляет принципиальных трудностей.

187

Для СР двух классов образов, имеющей один выходной канал (N* = 1), при произвольной структуре разомкнутой системы справедливо соотношение (7-9а). Оценка градиента средней функции риска имеет в общем случае следующий вид:

дх„

дх„

 

 

да.

 

■= 2x1

 

 

 

 

 

 

 

 

 

W—i

 

g да

hw-j+v hw-i

 

Здесь

tW—i+l'

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

дхе (n)

— r

“ +*> . 2

jF/2{хь)

 

dl-2 (Xfc)

X

 

да

 

 

dxfc

 

 

hVi7-1+1' kW-j

 

 

 

 

 

 

 

 

 

 

 

dF (g)

dg(n)

 

+ f d

- e

)

 

 

 

X

 

X

danw-j+v ftw—i

2

 

 

 

dg

 

 

 

 

 

V k { x k)

 

 

dl-i (Xk) dF (g)

dg(n)

 

 

 

 

 

 

 

dxk

dg

da

 

 

 

 

 

 

 

 

 

 

 

 

hw - i hw - i

 

 

 

 

где

dg(n)

определяется

соотношением (7-4).

Окончатель-

d . . .

 

 

HO

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

дх„

 

 

 

 

 

 

 

 

 

 

 

да

 

 

 

 

 

 

 

 

 

 

 

 

hw - i+ V hw—i

 

 

 

 

 

 

 

 

1

dF (g)

 

dg

 

 

X

 

 

 

 

 

2

dg

da.

 

w—i

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

V - /+ 1

 

 

 

 

 

 

X (1 + e) dli{Xk). + ( l -

-e)

dh (Xk)

 

 

 

 

 

 

Лх^

' '

 

'

dxk

 

 

 

 

 

В частности, в случае многослойной СР с полными свя­

зями между слоями имеем:

 

 

 

 

 

 

 

 

 

 

 

 

,2

П

 

 

 

 

 

 

 

 

 

 

 

дх„

 

 

 

 

 

 

 

 

 

 

 

да

 

 

 

 

 

 

 

 

 

 

 

 

hw—j + \' hw—j

 

 

 

 

 

 

 

 

_1_ (\

|_ е)

dxk

|_ (j _

е) dli(*ft)1 X

 

 

 

2

 

 

 

 

dxk

J

 

188

 

 

 

HW—l Hw —j; 3

 

 

 

X dF (g) у

у

X

 

 

 

 

ftu/—1= 1 ft«7—/+ 3 =1

 

/•rl

dF

а

 

 

/+2

 

X И

т

*F_/

(/г)

П aft

, ft

 

 

 

V - /

7 n=0

V - n - i

 

V

- V

g--=g (n)

 

 

 

Для многослойных CP из ЛПЭ с двумя решениями:

 

 

 

,2

П

 

 

 

 

дх„

 

 

 

даhW—/ ' Г ftir-/

 

^ _j_ dl2 (xk)

_j_ ^j __ dli (*fc)

dxk

 

 

 

 

/4-2

sign ah

, ft

 

X n

r - ri- i

 

 

b "w'-n’

ri=o

 

 

 

 

signxF -/ x w-j

(7-15)

Рассмотрение многослойных CP с континуумом классов образов и решений не представляет принципиальной труд­ ности. Поэтому рассмотрим СР с К градациями по уровню сигналов е (п) и хк (п), т. е. число классов образов и число решений СР равны К ■Разомкнутая СР при N* = 1 описы­ вается следующим выражением:

xk=l +Y

У [sign (glw

 

+

1

J

*р=‘

W V *р+‘)

где g F определяется

выражением (4-7) в случае сети

из

 

lw

 

 

 

 

 

 

ЛПЭ с континуумом решений. Выражение для градиента

 

функционала оптимизации

 

 

 

 

 

дхе

1{г,

xk)

дхк

 

 

 

да.lw—i+г w—/

даhw-j+ г

 

 

 

дхк

 

hw—j

 

 

Матрица д I (е, xk) здесь определяется так же, как

в § 7-7.

дхк

 

 

 

 

Далее,

так как

дхк

 

 

да.

^sign x f - '

 

 

 

 

w-i

 

V

 

w—i

189

Соседние файлы в папке книги из ГПНТБ