книги из ГПНТБ / Галушкин, А. И. Синтез многослойных систем распознавания образов
.pdfВ случае применения описанного в предыдущем пункте преобразования Z сравнение a 2g, полученного по (5-14а), и R* (5-17) дает условие для их совпадения в следующем виде:
^ г О + Я )', ^22” |
^22 О — Я); |
2 ц = | / /ц(1 + Я,) ; |
Zal= V |
l» i( l - b ) . |
(5-21) |
Преобразование, необходимое для получения дискрет ной ошибки, первый момент распределения которой был бы равен левой части (5-16), имеет следующие параметры:
^I2= hr ^22 = ^22’ ^21 = ^21 • ^11 = hi' |
(5*22) |
в) Критерий минимума R при условии рхтг = а = const
Минимум R при условии равенства ругх — а, т. е. при условии
р1^цФ1 + Pi^i2 [1— — а = 0, |
(5-23) |
обеспечивается при минимизации функционала Лагранжа:
R* = Pi/ 12 (1 + Я) + р4%г^г Pi (^и — ^12) (1 + |
Я) Фх -f- |
-+-Р2 (^21 —^22 )^ 2 Ясс. |
(5-24) |
Сравнение (5-24) и (5-12а) дает выражения для коэффи циентов А, В, С данного преобразования, обеспечивающие равенство R* и a 2g:
С — ] / Рг^22 + 2pxlX2(1 + Я)—Pi/ц (1 + Я)— аЯ,;
А = — \ у Г(1 +Я) [Р2^11+ (Pi--Рг) ^I2l + P2^22---а Я +
+ У' P2^22+ 2pi/i2 (1 + Я)—р ^ и О + Я ) — а Я |; (5-25)
В = — l21—Pi^22 + (1 + Я) (2pi/18 —Pi/ц) —аЯ—
—Рг^22 + 2pi/i2 (1 + Я)—Pi/ц (1 + Я)— аЯ j .
Параметры Л j, Лх, Сх преобразования дискретной ошибки, делающие равными первый момент распределения (5-12) и левую часть (5-23), имеют следующий вид:
А г = /u ~ /l2 ■; Л2 = 0; С1^ р 1111- а . |
(5-26) |
140
В случае применения к дискретной ошибке СР преобра зования Z равенство (5-24) и второго момента распределе ния (5-14а) обеспечивается при условии:
|
- |
Y |
^12 |
оЛ |
% 2 1 — ^21 > ^ 2 2 — |
]/ ^22 > ^ 1 2 |
|
( + |
' |
|
|
|
|
Pi |
Z n= |
У h i(\ + b ) - — |
• |
(5-27) |
|
|
г |
Pi |
|
Определение градиента /?* по Я в данном случае произ водится в СР формированием дискретной ошибки xg (п),
первый момент распределения которой равен левой части (5-33). Параметры преобразования Z в этом случае полу чаются следующими:
7' —7' |
— О* |
Т - |
Z<21—Z-22 |
— |
А12‘ ■ K - j r r Zn = /1 . - 1 - (5-28) |
Континуальные модели СР
Для континуальных моделей СР рассмотрим процедуру формирования функционалов вторичной оптимизации, со ответствующих критерию минимума средней функции риска, так как обобщение на другие критерии первичной оптимизации не представляет принципиальных затрудне ний.
Так же как и в предыдущем параграфе, вопрос форми рования функционала оптимизации решается для СР с про извольной структурой и иллюстрируется на конкретных структурах.
а) СР с континуумом решений; два класса образов
Преобразование дискретной ошибки в данном случае имеет следующий вид:
7г lxg(га)Ь е (п) = 1,
х'(п) =
Zi[xg(n)], e(n) = —1.
Отсюда распределение преобразованной ошибки имеет следующий вид:
dzr> (4)
+
dx„
+ P-J2*. 7 - 1 dZo
dx„
141
а выражение для второго момента данного распределения (после соответствующей замены переменных и при условии монотонности функций Zj и Z2)
|
С О |
о о |
a 2g— |
J [Zi{xg)]2p1f1Xg(xg)dxs + |
J [Z2 (Хг)]2p2f2Xg (xs)dxg. |
При произвольной структуре разомкнутой СР имеют |
||
место |
соотношения xk = Р (х), xg — г — Р (х). Отсюда |
|
|
x N = p i { x g’ р > x i ’ • • • ’ x / / - i ) п р и 8 = — 1; |
|
|
XN = P 2 ( Xg ’ Р > ХГ |
XN - 1) П Р И e = = 1 - |
В данном случае распределение дискретной ошибки для образов k-ro класса имеет следующий вид:
|
|
N—1 |
|
|
|
|
|
ОО |
|
|
|
fkxe{Xg ) = |
I ' • ■ № * |
• • • ’ XN - 1» |
P &(Xg> Р ’ Xl> • • •> XW - l ) ] X |
||
*> |
|
—no |
|
|
|
|
X |
d ^ k [ x g ’ |
x l ’ • • •> |
X N — l ) |
dxN—t |
|
|
dxg |
|
||
|
|
|
|
|
Отсюда после соответствующих преобразований и за мены переменных можно получить следующее выражение для второго момента распределения дискретной ошибки:
N
ОО
a 2g— J • • • |
— P (x)])2pl/l(x)^X + |
|
N |
|
|
+J •••J {Z2[ l — P(x)]}2p2/2(x)dx. |
(5-29) |
В частности, для ЛПЭ с континуумом решений с исполь зованием (5-8а) можно получить следующее:
|
N |
|
N |
|
|
а.ч = |
J *- • |
I ^ |
|
pJi (*)dx + |
|
1 — F 2 |
Я Л — а 0 |
||||
|
—оо |
|
i=i |
|
|
|
N |
|
N |
|
|
|
|
|
|
|
|
+ |
J ‘ ‘ ‘ |
J Y “. |
1—F |
— а 0 |
Р2/2 (х) dx. |
|
|
|
j =i |
|
|
142
В общем случае
N
00
a2g= J • • • I (Za [*g(x)]}api/i(x)dx +
N
оо
+ J • • • J {Z2[xg(x)]}2p J 2{x)dx.
Сравнение данного выражения с выражением для сред ней функции риска
N
ОО
Я = 1 • ■■J P i/i( x ) /i[ ^ = /:>(x )l+ p 2/2(x)/2[ ^ = P(x)]) dx
дает соотношения для преобразования дискретной ошибки необходимые для равенства a 2g и R:
Zi {Xg) = V li (— 1 — xg) ; Z2 (xg) = \ f l2(1 — Xg). (5-30)
6)CP с континуумом решений; континуум классов образов
Вданном случае
б ; К ) = /« « [ * - 'К .)] ^
Отсюда при условии монотонности функции Z (xg) сле дует, что
|
|
a 2g= |
J |
[Z(Xg)]2fx |
(xk)dxg. |
(5-31) |
|
Здесь |
|
|
|
|
|
|
|
xft = P(x); |
xg = |
e— Р(х); xN = P '(xg, P, e, xv . . |
xN_ x) |
||||
N |
|
|
|
|
|
|
|
oo |
|
|
|
|
P, 8 , Xj,. . |
|
|
fx — J ' ' |
‘ J / |
[•Xp |
• |
• •> |
ХдГ_ 1, P |
X |
|
|
dP' (x |
, |
P, |
e, Яр |
dxN_ x dxx de. |
||
X / e |
(8 ) |
|
|
|
|
143
Отсюда и из (5-31) следует после соответствующей за мены переменных:
N
оооо
a 2g= I I • • • J (Z[e — Я(х)])2/(х | е)/е (е) de dx. (5-32)
—ОО — ОО
Вчастности, с учетом (5-7а) для ЛПЭ с континуумом решений
|
I |
N |
|
a'2g ■ |
J •••J \z 6—^ ( 2 « Л — a0 |
X |
|
|
|
X / (x | e) /e (e) cfc dx. |
|
Из сравнения (5-32) с выражением для средней функции |
|||
риска |
|
N |
|
|
|
|
|
я = J |
J |
• • • I /е (е) / (XI е) I [xk = Р (х), е] dx de |
|
—ОО |
—ОО |
|
следует соотношение для преобразования дискретной ошибки, необходимого для равенства a 2g и
Z (*g) = |
V П ( е — x g), е] . |
в) СР с К решениями-, |
К классов образов |
Из выражения (5-8а) следует выражение для распре деления преобразованной соответствующим образом ди скретной ошибки СР (ЛПЭ с К решениями) для образов
k-ro класса при xg= (& —k ) Ah
1k k
р
кр’ *р-м + аh |
ах |
aN—1 |
|
k k |
|
|
|
N |
|
|
a N |
(g p - l , k p Н а о |
a i |
aN- 1 |
'j |
- ф , |
|
|
|
aN |
|
“ AT |
/ ’ |
Отсюда
КК
а.'2g |
= 2 |
2 [(*- |
K ) \ |
k\ p fex |
|
|
*=1 ftp=x L4 |
|
|
|
|
X Ф„ |
' V |
tpl-l + а0 |
a i |
a N — l |
\ |
|
|
UN |
|
f l JV |
/ |
|
-Ф* |
- 1 , k r |
' °о |
ax ) |
|
|
|
|
|
|
° J V / .
144
Вслучае СР с произвольной структурой
кк
J fk (*)dx.
S ^p\x) >0
Из сравнения a 2g и R
кк
я =2 |
2 h k pk |
I |
/ft(x) dx |
|
ft=i* |
=1 |
v * |
S ' p'(x )> 0 |
|
|
p |
|
||
следует условие для |
их |
совпадения |
в следующем виде: |
Ak k - T ± r V T7k- kpk k — kp
г) СР с N*-выходными каналами-, K f) градаций сигнала по каждому классу
В этом случае функция распределения дискретной ошибки для совокупности образов класса (klt . . . , kN,):
|
|
|
|
N |
|
f { kl ..... kN>) (*!«’ |
" |
•’ |
XN*g) = |
J - - ' l |
X |
|
|
|
|
s ^ p.... kN*p)w >o |
|
|
X f (kl.... *„.)(*) dx |
|
|||
при (*lg, . . . . ** .,) |
= |
(*,, |
. . . . V |
M V . . . . |
kNtp). |
Применяем к вектору (x,g, . . . , xN, } следующее пре образование, необходимое для получения преобразованной дискретной ошибки xg (п). Умножаем вектор xg на скаляр
A [ k v . . . , kNt, klp, . . . , kNtp} и вычисляем сумму квад
ратов компонент данного результирующего вектора. Ре зультат будет преобразованной дискретной ошибкой x'g (п).
В этом случае для совокупности образов всех классов
. |
п |
|
9 |
1 |
^0 |
^0 |
^0 |
|
м |
*;' + ...+Х* |
= 2 ... |
2 |
2 |
|
|||
|
|
|
|
|
*,=1 |
k N * ~ l k l P ~ |
1 |
|
|
К о |
|
|
|
|
|||
|
|
[(*,—*.Р)2+-■+(*«•— |
|
X |
||||
|
S |
|
|
|||||
|
k..* |
- 1 |
|
|
|
|
|
|
|
N * р |
|
|
|
|
|
|
|
X A2 [kv . |
. |
kNt, k{p, . |
. kN,p) /e (^r |
• • •’ |
^n*) X |
|||
|
X |
„ |
I - |
•I |
f{kl..^*)Wdx- |
|
145
Сравнение данного выражения с R (гл. 2) дает соотно шение для параметров преобразования А в следующем виде:
|
|
|
A {kv .. |
kN„ |
k ip’ |
V |
p ) |
= |
|
|
|
|
|
|
kN*’ fel p ' |
' |
feAT*p) |
|
(5-33) |
||
|
|
|
|
klp Y + |
• • • + ( kN* — kN * p ) 2 |
|
||||
|
|
|
|
|
|
|||||
|
Это преобразование дискретной ошибки делает равными |
|||||||||
М [ * £ + .. • + % .*] и R. |
|
|
|
|
|
|
||||
д) |
СР с N*-выходными каналами-, |
континуум решений СР |
||||||||
|
В данном случае |
xg = |
е — Р (х) — вектор |
размерно |
||||||
сти N*. Распределение. суммы квадратов компонент век |
||||||||||
тора xg имеет вид: |
|
|
|
|
|
|
|
|||
ц |
е |
К ) - |
Г ^ Т |
х ' |
/ 1 * ......... **-!• |
о |
I•] |
х |
||
|
|
f |
|
|
|
|
|
|
||
|
|
|
х Ш |
dP' (* |
dxN—1 |
|
dxl de. |
|
|
|
|
|
|
dxl |
|
|
|
||||
|
|
|
|
|
|
|
|
|
|
|
|
Здесь |
|
|
|
|
|
|
|
|
|
vJV= P'(x>g, |
Plt |
|
|
' N* |
|
|
XW) = |
*'(*)• |
||
|
Распределение квадрата |
преобразованной |
дискретной |
|||||||
ошибки |
|
|
|
|
|
|
|
|
Отсюда первый Момент данного распределения
I |
IHWxV |
|
•dxl= J |
F K ) ] x |
|||
N* |
N—l |
|
|
|
|
P' (*) I e] fe(e) x |
|
E x |
|
[xv |
. |
. |
xN_ v |
||
|
’ |
|
|
|
|
|
|
|
X |
dP' (*) |
dx., |
, dx, ds dx2. |
|||
|
2 |
|
N—l |
1 |
g |
||
|
|
dxg |
|
|
|
|
|
146
После соответствующей замены переменных
{J , [в,. - Р , ( х ) ] 2} X
X f (х | е) /е (е) ds dx.
Из сравнения a lg с выражением для R в СР с N* выход ными каналами и континуумом решений следует уравнение для функций преобразования дискретной ошибки в сле дующем виде:
Z {Д [е<. - Рс* (х)]2} = I [Р (х), в]. |
(5-34) |
5-4. СР в режимах самообучения и при произвольной квалификации учителя
В случае решений выражение для средней функции риска в режиме самообучения имеет вид:
В случае СР с К ? решениями можно показать, что пре образование выходного сигнала СР xk, формирующее сиг нал x'k, первый момент распределения которого равен R,
определяется:
Xfe = p [x —b ( xft)], |
(5-35) |
а в случае с произвольной квалификацией учителя
xk = l {xk’ ® ) b + (l — Ь2) р [ Х — Ь ( Х *)]. |
(5-36) |
Выражения (5-35) и (5-36) справедливы также и для случая СР с континуумом решений.
Г л а в а ш е с т а я
РАЗРАБОТКА АЛГОРИТМОВ ПОИСКА ЭКСТРЕМУМА ФУНКЦИИ МНОГИХ ПЕРЕМЕННЫХ
6-1. Организация процедуры поиска экстремума функционала вторичной оптимизации в СР
В соответствии с принятой в работе методикой синтеза СР экстремум функционала вторичной оптимизации на ходится с помощью итерационных методов, с использова нием градиентной процедуры поиска в основном локального
147
экстремума. Рассматриваются вопросы анализа устойчи вости и сходимости градиентных процедур при отсутствии и наличии ограничений на переменные, а также возмож ность ускорения процессов поиска экстремума. В качестве ограничений на переменные настраиваемые коэффициенты рассматриваются ограничения типа равенств и неравенств, реально присутствующие как в случае реализации много слойных СР на аналоговых и цифровых вычислительных машинах, так и в случае рассмотрения нейронных ансамб лей.
Итерационные методы поиска экстремума функций мно гих переменных развиваются в основном в двух направ лениях. Первое направление включает поиск экстремума функций многих переменных на ЦВМ с построением стан дартных программ поиска. При этом вид функции и ее свойства задаются достаточно полно. В процессе исследо вания изучается в основном сходимость методов, иногда их точность в установившемся состоянии; динамике пере ходных процессов уделяется незначительное внимание.
Второе направление включает в себя построение алго ритмов настройки адаптивных систем. Здесь функция за дана в самом общем виде вследствие специфики задачи, заключающейся в необходимости работы системы в усло виях малой априорной информации о входном сигнале
[Л. 40, 41 ].
Система распознавания есть частный случай адаптив ной системы. Особенности построения адаптивных систем связаны с тем, что при неизвестных характеристиках вход ного сигнала [в случае СР — условной плотности /' (х/s) ] даже при фиксированной структуре разомкнутой СР ни чего нельзя сказать о виде функционала вторичной оптими зации, кроме того что он имеет несколько локальных экс тремумов, все или по крайней мере некоторые из которых должны быть найдены в процессе настройки по замкнутому циклу. Решить задачу оптимизации контура настройки многослойной СР в общем на этапе организации поиска экстремума функционала вторичной оптимизации нельзя. В процедуре поиска всегда остается степень субъективизма, это выражается, в частности, в выборе коэффициентов па раметрической матрицы системы поиска.
В связи с этим в гл. 8 основной упор делается на опти мизацию контура настройки многослойной СР при иссле довании замкнутой СР с оценкой качества по текущему зна чению функционала первичной оптимизации.
148
6-2. Анализ итерационного метода поиска экстремума функций многих переменных
Общее выражение для вычисления вектора состояния системы при поиске экстремума функции Y (а) в момент времени п + 1 по вектору состояния в п-й момент имеет следующий вид (для памяти системы поиска, равной еди нице):
а( п+1) = а{п) + К* д- ^ - |
( 6- 1) |
а—а(п) |
|
Здесь Y (а) — функционал вторичной |
оптимизации; |
а (п) —■вектор состояния системы (текущее значение ар гумента экстремальной функции); К* — [№ X А^° ] — мат рица коэффициентов; № — размерность вектора а.
Выбор коэффициентов матрицы К* определяет скорость
икачество сходимости итерационного метода.
Впроцедуру (6-1) вписываются известные методы по иска: сканирования, наискорейшего спуска, градиента, Гаусса—Зейделя, Розенброка, Пауэлла, Саусвелла и др.
Основной задачей является выбор ограничений на па раметры матрицы К* для обеспечения определенного ка чества системы поиска экстремума функции. Рассмотрим частный вид функции качества СР
Y (а) = агЛ |
а + |
Вга + С. |
(6-1а) |
Здесь А — матрица коэффициентов функционала |
Y (а); |
||
В — вектор коэффициентов; |
С — коэффициент. |
|
|
Отсюда |
|
|
|
^ - ^ = 2 Л а+ В ; |
' d2Y (а) ' = 2Л , |
(6-2) |
|
|
|
daidcij |
|
I, / = 1, . . . , №.
Из (6-1) и (6-2) следует рекуррентное выражение для вычисления вектора состояния системы поиска в (п + 1)-й момент времени через вектор состояния системы в п-й мо мент времени в следующем виде:
а ( п + 1) = а(/г) + /С* [2Лх(/г) + В], |
|
или |
(6-3) |
a (n + 1) = К* ■В -f [У + 2/С*Л] а (п). |
Здесь Y — единичная матрица.
Определим, при каких значениях коэффициентов мат рицы К* итерационный процесс сойдется за один шаг из
149