Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги из ГПНТБ / Галушкин, А. И. Синтез многослойных систем распознавания образов

.pdf
Скачиваний:
11
Добавлен:
22.10.2023
Размер:
12.65 Mб
Скачать

В случае применения описанного в предыдущем пункте преобразования Z сравнение a 2g, полученного по (5-14а), и R* (5-17) дает условие для их совпадения в следующем виде:

^ г О + Я )', ^22”

^22 О — Я);

2 ц = | / /ц(1 + Я,) ;

Zal= V

l» i( l - b ) .

(5-21)

Преобразование, необходимое для получения дискрет­ ной ошибки, первый момент распределения которой был бы равен левой части (5-16), имеет следующие параметры:

^I2= hr ^22 = ^22’ ^21 = ^21 • ^11 = hi'

(5*22)

в) Критерий минимума R при условии рхтг = а = const

Минимум R при условии равенства ругх — а, т. е. при условии

р1^цФ1 + Pi^i2 [1— — а = 0,

(5-23)

обеспечивается при минимизации функционала Лагранжа:

R* = Pi/ 12 (1 + Я) + р4%г^г Pi (^и — ^12) (1 +

Я) Фх -f-

-+-Р2 (^21 —^22 )^ 2 Ясс.

(5-24)

Сравнение (5-24) и (5-12а) дает выражения для коэффи­ циентов А, В, С данного преобразования, обеспечивающие равенство R* и a 2g:

С — ] / Рг^22 + 2pxlX2(1 + Я)—Pi/ц (1 + Я)— аЯ,;

А = — \ у Г(1 +Я) [Р2^11+ (Pi--Рг) ^I2l + P2^22---а Я +

+ У' P2^22+ 2pi/i2 (1 + Я)—р ^ и О + Я ) — а Я |; (5-25)

В = l21—Pi^22 + (1 + Я) (2pi/18 —Pi/ц) —аЯ—

Рг^22 + 2pi/i2 (1 + Я)—Pi/ц (1 + Я)— аЯ j .

Параметры Л j, Лх, Сх преобразования дискретной ошибки, делающие равными первый момент распределения (5-12) и левую часть (5-23), имеют следующий вид:

А г = /u ~ /l2 ■; Л2 = 0; С1^ р 1111- а .

(5-26)

140

В случае применения к дискретной ошибке СР преобра­ зования Z равенство (5-24) и второго момента распределе­ ния (5-14а) обеспечивается при условии:

 

-

Y

^12

оЛ

% 2 1 ^21 > ^ 2 2

]/ ^22 > ^ 1 2

 

( +

'

 

 

 

 

Pi

Z n=

У h i(\ + b ) - —

(5-27)

 

г

Pi

 

Определение градиента /?* по Я в данном случае произ­ водится в СР формированием дискретной ошибки xg (п),

первый момент распределения которой равен левой части (5-33). Параметры преобразования Z в этом случае полу­ чаются следующими:

7' —7'

— О*

Т -

Z<21—Z-22

А12‘ ■ K - j r r Zn = /1 . - 1 - (5-28)

Континуальные модели СР

Для континуальных моделей СР рассмотрим процедуру формирования функционалов вторичной оптимизации, со­ ответствующих критерию минимума средней функции риска, так как обобщение на другие критерии первичной оптимизации не представляет принципиальных затрудне­ ний.

Так же как и в предыдущем параграфе, вопрос форми­ рования функционала оптимизации решается для СР с про­ извольной структурой и иллюстрируется на конкретных структурах.

а) СР с континуумом решений; два класса образов

Преобразование дискретной ошибки в данном случае имеет следующий вид:

7г lxg(га)Ь е (п) = 1,

х'(п) =

Zi[xg(n)], e(n) = —1.

Отсюда распределение преобразованной ошибки имеет следующий вид:

dzr> (4)

+

dx„

+ P-J2*. 7 - 1 dZo

dx„

141

а выражение для второго момента данного распределения (после соответствующей замены переменных и при условии монотонности функций Zj и Z2)

 

С О

о о

a 2g—

J [Zi{xg)]2p1f1Xg(xg)dxs +

J [Z2 (Хг)]2p2f2Xg (xs)dxg.

При произвольной структуре разомкнутой СР имеют

место

соотношения xk = Р (х), xg — г Р (х). Отсюда

 

x N = p i { x g’ р > x i ’ • • • ’ x / / - i ) п р и 8 = — 1;

 

XN = P 2 ( Xg ’ Р > ХГ

XN - 1) П Р И e = = 1 -

В данном случае распределение дискретной ошибки для образов k-ro класса имеет следующий вид:

 

 

N—1

 

 

 

 

 

ОО

 

 

 

fkxe{Xg ) =

I ' • ■ № *

• • • ’ XN -

P &(Xg> Р ’ Xl> • • •> XW - l ) ] X

*>

 

—no

 

 

 

 

X

d ^ k [ x g

x l ’ • • •>

X N — l )

dxN—t

 

 

dxg

 

 

 

 

 

 

Отсюда после соответствующих преобразований и за­ мены переменных можно получить следующее выражение для второго момента распределения дискретной ошибки:

N

ОО

a 2g— J • • •

— P (x)])2pl/l(x)^X +

 

N

 

 

+J •••J {Z2[ l — P(x)]}2p2/2(x)dx.

(5-29)

В частности, для ЛПЭ с континуумом решений с исполь­ зованием (5-8а) можно получить следующее:

 

N

 

N

 

 

а.ч =

J *- •

I ^

 

pJi (*)dx +

1 — F 2

Я Л — а 0

 

—оо

 

i=i

 

 

 

N

 

N

 

 

 

 

 

 

 

+

J ‘ ‘ ‘

J Y “.

1—F

— а 0

Р2/2 (х) dx.

 

 

 

j =i

 

 

142

В общем случае

N

00

a2g= J • • • I (Za [*g(x)]}api/i(x)dx +

N

оо

+ J • • • J {Z2[xg(x)]}2p J 2{x)dx.

Сравнение данного выражения с выражением для сред­ ней функции риска

N

ОО

Я = 1 • ■■J P i/i( x ) /i[ ^ = /:>(x )l+ p 2/2(x)/2[ ^ = P(x)]) dx

дает соотношения для преобразования дискретной ошибки необходимые для равенства a 2g и R:

Zi {Xg) = V li (— 1 — xg) ; Z2 (xg) = \ f l2(1 — Xg). (5-30)

6)CP с континуумом решений; континуум классов образов

Вданном случае

б ; К ) = /« « [ * - 'К .)] ^

Отсюда при условии монотонности функции Z (xg) сле­ дует, что

 

 

a 2g=

J

[Z(Xg)]2fx

(xk)dxg.

(5-31)

Здесь

 

 

 

 

 

 

 

xft = P(x);

xg =

e— Р(х); xN = P '(xg, P, e, xv . .

xN_ x)

N

 

 

 

 

 

 

oo

 

 

 

 

P, 8 , Xj,. .

 

fx J ' '

J /

[•Xp

• •>

ХдГ_ 1, P

X

 

dP' (x

,

P,

e, Яр

dxN_ x dxx de.

X / e

(8 )

 

 

 

 

143

Отсюда и из (5-31) следует после соответствующей за­ мены переменных:

N

оооо

a 2g= I I • • • J (Z[e — Я(х)])2/(х | е)/е (е) de dx. (5-32)

ОО — ОО

Вчастности, с учетом (5-7а) для ЛПЭ с континуумом решений

 

I

N

 

a'2g ■

J •••J \z 6—^ ( 2 « Л — a0

X

 

 

X / (x | e) /e (e) cfc dx.

 

Из сравнения (5-32) с выражением для средней функции

риска

 

N

 

 

 

 

я = J

J

• • • I /е (е) / (XI е) I [xk = Р (х), е] dx de

—ОО

—ОО

 

следует соотношение для преобразования дискретной ошибки, необходимого для равенства a 2g и

Z (*g) =

V П ( е — x g), е] .

в) СР с К решениями-,

К классов образов

Из выражения (5-8а) следует выражение для распре­ деления преобразованной соответствующим образом ди­ скретной ошибки СР (ЛПЭ с К решениями) для образов

k-ro класса при xg= (& —k ) Ah

1k k

р

кр’ *р + аh

ах

aN—1

k k

 

 

 

N

 

 

a N

(g p - l , k p Н а о

a i

aN- 1

'j

- ф ,

 

 

 

aN

 

“ AT

/ ’

Отсюда

КК

а.'2g

= 2

2 [(*-

K ) \

k\ p fex

 

 

*=1 ftp=x L4

 

 

 

X Ф„

' V

tpl-l + а0

a i

a N — l

\

 

 

UN

 

f l JV

/

 

-Ф*

- 1 , k r

' °о

ax )

 

 

 

 

 

 

° J V / .

144

Вслучае СР с произвольной структурой

кк

J fk (*)dx.

S ^p\x) >0

Из сравнения a 2g и R

кк

я =2

2 h k pk

I

/ft(x) dx

ft=i*

=1

v *

S ' p'(x )> 0

 

p

 

следует условие для

их

совпадения

в следующем виде:

Ak k - T ± r V T7k- kpk k — kp

г) СР с N*-выходными каналами-, K f) градаций сигнала по каждому классу

В этом случае функция распределения дискретной ошибки для совокупности образов класса (klt . . . , kN,):

 

 

 

 

N

 

f { kl ..... kN>) (*!«’

"

•’

XN*g) =

J - - ' l

X

 

 

 

 

s ^ p.... kN*p)w >o

 

X f (kl.... *„.)(*) dx

 

при (*lg, . . . . ** .,)

=

(*,,

. . . . V

M V . . . .

kNtp).

Применяем к вектору (x,g, . . . , xN, } следующее пре­ образование, необходимое для получения преобразованной дискретной ошибки xg (п). Умножаем вектор xg на скаляр

A [ k v . . . , kNt, klp, . . . , kNtp} и вычисляем сумму квад­

ратов компонент данного результирующего вектора. Ре­ зультат будет преобразованной дискретной ошибкой x'g (п).

В этом случае для совокупности образов всех классов

.

п

 

9

1

^0

^0

^0

 

м

*;' + ...+Х*

= 2 ...

2

2

 

 

 

 

 

 

*,=1

k N * ~ l k l P ~

1

 

К о

 

 

 

 

 

 

[(*,—*.Р)2+-■+(*«•—

 

X

 

S

 

 

 

k..*

- 1

 

 

 

 

 

 

N * р

 

 

 

 

 

 

 

X A2 [kv .

.

kNt, k{p, .

. kN,p) /e (^r

• • •’

^n*) X

 

X

I -

•I

f{kl..^*)Wdx-

 

145

Сравнение данного выражения с R (гл. 2) дает соотно­ шение для параметров преобразования А в следующем виде:

 

 

 

A {kv ..

kN„

k ip

V

p )

=

 

 

 

 

 

 

kN*’ fel p '

'

feAT*p)

 

(5-33)

 

 

 

 

klp Y +

• • + ( kN* — kN * p ) 2

 

 

 

 

 

 

 

 

Это преобразование дискретной ошибки делает равными

М [ * £ + .. • + % .*] и R.

 

 

 

 

 

 

д)

СР с N*-выходными каналами-,

континуум решений СР

 

В данном случае

xg =

е — Р (х) — вектор

размерно­

сти N*. Распределение. суммы квадратов компонент век­

тора xg имеет вид:

 

 

 

 

 

 

 

ц

е

К ) -

Г ^ Т

х '

/ 1 * ......... **-!•

о

I•]

х

 

 

f

 

 

 

 

 

 

 

 

 

х Ш

dP' (*

dxN—1

 

dxl de.

 

 

 

 

 

dxl

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Здесь

 

 

 

 

 

 

 

 

vJV= P'(x>g,

Plt

 

 

' N*

 

 

XW) =

*'(*)•

 

Распределение квадрата

преобразованной

дискретной

ошибки

 

 

 

 

 

 

 

 

Отсюда первый Момент данного распределения

I

IHWxV

 

•dxl= J

F K ) ] x

N*

N—l

 

 

 

 

P' (*) I e] fe(e) x

E x

 

[xv

.

.

xN_ v

 

 

 

 

 

 

 

X

dP' (*)

dx.,

, dx, ds dx2.

 

2

 

N—l

1

g

 

 

dxg

 

 

 

 

 

146

После соответствующей замены переменных

{J , [в,. - Р , ( х ) ] 2} X

X f (х | е) /е (е) ds dx.

Из сравнения a lg с выражением для R в СР с N* выход­ ными каналами и континуумом решений следует уравнение для функций преобразования дискретной ошибки в сле­ дующем виде:

Z {Д [е<. - Рс* (х)]2} = I [Р (х), в].

(5-34)

5-4. СР в режимах самообучения и при произвольной квалификации учителя

В случае решений выражение для средней функции риска в режиме самообучения имеет вид:

В случае СР с К ? решениями можно показать, что пре­ образование выходного сигнала СР xk, формирующее сиг­ нал x'k, первый момент распределения которого равен R,

определяется:

Xfe = p [x —b ( xft)],

(5-35)

а в случае с произвольной квалификацией учителя

xk = l {xk’ ® ) b + (l — Ь2) р [ Х — Ь ( Х *)].

(5-36)

Выражения (5-35) и (5-36) справедливы также и для случая СР с континуумом решений.

Г л а в а ш е с т а я

РАЗРАБОТКА АЛГОРИТМОВ ПОИСКА ЭКСТРЕМУМА ФУНКЦИИ МНОГИХ ПЕРЕМЕННЫХ

6-1. Организация процедуры поиска экстремума функционала вторичной оптимизации в СР

В соответствии с принятой в работе методикой синтеза СР экстремум функционала вторичной оптимизации на­ ходится с помощью итерационных методов, с использова­ нием градиентной процедуры поиска в основном локального

147

экстремума. Рассматриваются вопросы анализа устойчи­ вости и сходимости градиентных процедур при отсутствии и наличии ограничений на переменные, а также возмож­ ность ускорения процессов поиска экстремума. В качестве ограничений на переменные настраиваемые коэффициенты рассматриваются ограничения типа равенств и неравенств, реально присутствующие как в случае реализации много­ слойных СР на аналоговых и цифровых вычислительных машинах, так и в случае рассмотрения нейронных ансамб­ лей.

Итерационные методы поиска экстремума функций мно­ гих переменных развиваются в основном в двух направ­ лениях. Первое направление включает поиск экстремума функций многих переменных на ЦВМ с построением стан­ дартных программ поиска. При этом вид функции и ее свойства задаются достаточно полно. В процессе исследо­ вания изучается в основном сходимость методов, иногда их точность в установившемся состоянии; динамике пере­ ходных процессов уделяется незначительное внимание.

Второе направление включает в себя построение алго­ ритмов настройки адаптивных систем. Здесь функция за­ дана в самом общем виде вследствие специфики задачи, заключающейся в необходимости работы системы в усло­ виях малой априорной информации о входном сигнале

[Л. 40, 41 ].

Система распознавания есть частный случай адаптив­ ной системы. Особенности построения адаптивных систем связаны с тем, что при неизвестных характеристиках вход­ ного сигнала [в случае СР — условной плотности /' (х/s) ] даже при фиксированной структуре разомкнутой СР ни­ чего нельзя сказать о виде функционала вторичной оптими­ зации, кроме того что он имеет несколько локальных экс­ тремумов, все или по крайней мере некоторые из которых должны быть найдены в процессе настройки по замкнутому циклу. Решить задачу оптимизации контура настройки многослойной СР в общем на этапе организации поиска экстремума функционала вторичной оптимизации нельзя. В процедуре поиска всегда остается степень субъективизма, это выражается, в частности, в выборе коэффициентов па­ раметрической матрицы системы поиска.

В связи с этим в гл. 8 основной упор делается на опти­ мизацию контура настройки многослойной СР при иссле­ довании замкнутой СР с оценкой качества по текущему зна­ чению функционала первичной оптимизации.

148

6-2. Анализ итерационного метода поиска экстремума функций многих переменных

Общее выражение для вычисления вектора состояния системы при поиске экстремума функции Y (а) в момент времени п + 1 по вектору состояния в п-й момент имеет следующий вид (для памяти системы поиска, равной еди­ нице):

а( п+1) = а{п) + К* д- ^ -

( 6- 1)

а—а(п)

 

Здесь Y (а) — функционал вторичной

оптимизации;

а (п) —■вектор состояния системы (текущее значение ар­ гумента экстремальной функции); К* — [№ X А^° ] — мат­ рица коэффициентов; № — размерность вектора а.

Выбор коэффициентов матрицы К* определяет скорость

икачество сходимости итерационного метода.

Впроцедуру (6-1) вписываются известные методы по­ иска: сканирования, наискорейшего спуска, градиента, Гаусса—Зейделя, Розенброка, Пауэлла, Саусвелла и др.

Основной задачей является выбор ограничений на па­ раметры матрицы К* для обеспечения определенного ка­ чества системы поиска экстремума функции. Рассмотрим частный вид функции качества СР

Y (а) = агЛ

а +

Вга + С.

(6-1а)

Здесь А — матрица коэффициентов функционала

Y (а);

В — вектор коэффициентов;

С — коэффициент.

 

Отсюда

 

 

 

^ - ^ = 2 Л а+ В ;

' d2Y (а) ' = 2Л ,

(6-2)

 

 

daidcij

 

I, / = 1, . . . , №.

Из (6-1) и (6-2) следует рекуррентное выражение для вычисления вектора состояния системы поиска в (п + 1)-й момент времени через вектор состояния системы в п-й мо­ мент времени в следующем виде:

а ( п + 1) = а(/г) + /С* [2Лх(/г) + В],

 

или

(6-3)

a (n + 1) = К* ■В -f [У + 2/С*Л] а (п).

Здесь Y — единичная матрица.

Определим, при каких значениях коэффициентов мат­ рицы К* итерационный процесс сойдется за один шаг из

149

Соседние файлы в папке книги из ГПНТБ