Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги из ГПНТБ / Галушкин, А. И. Синтез многослойных систем распознавания образов

.pdf
Скачиваний:
11
Добавлен:
22.10.2023
Размер:
12.65 Mб
Скачать

ные типы (всего система содержит 12 типов распределений) обра­ зуются на стыке диапазонов при К 0 = О, К 0 — 1, К 0 = оо с при­ влечением дополнительных критериев классификации. Решение уравнений (3-1) и (3-2) может быть получено в следующем виде:

 

(дс— а х — Лх)

А | — а

 

м л , - л 2)

/ (х) = const

 

 

(3-4)

 

(х— а! —Л2)

А 2 — а

 

Ьг‘(А i А2)

 

 

где A i и А 2 — корни полинома G (х).

Сравнение встречающихся на практике частных видов распре­ делений с типовыми распределениями Пирсона говорит о широте охвата системы.

Выражение для плотности (3-4) может быть использовано в про­ цессе реализации оптимальных моделей СР при настройке по ра­ зомкнутому циклу. Обучение в рассматриваемом случае происхо­ дит следующим образом:

а) по выборке из генеральной совокупности для распределе­ ния, охват которого системой Пирсона подразумевается, оцени­ ваются четыре первых момента;

 

б) в соответствии с (3-2) по четырем моментам определяются

коэффициенты распределения;

для

в) в соответствии с материалами гл. 2 определяется уравнение

разделяющей поверхности и, если необходимо, выражение

для

средней функции риска.

3-4. Метод допустимых преобразований

Метод допустимых преобразований [Л. 8, 34, 54 ] впервые был предложен в работе [Л. 34]. Ниже излагается некоторая его моди­ фикация. При этом показывается, что метод допустимых преобразо­ ваний приводит к СР, настраивающейся по разомкнутому циклу, причем априорная информация о виде допустимых преобразований эквивалентна априорной информации о виде типового распреде­ ления. При данном методе подобие Z (х, Х т) образа х и совокуп­ ности образов Х т (пг— I, , М), представляющих класс, оп­ ределяется следующим выражением:1

 

 

Z (х, Х т) — 1

М d (х, Х т),

 

 

 

М

т = 1

где d (х,

Х т) — метод измерения расстояния.

При рассмотрении классов независимо достигается

 

1

М

м

-т. р

mm

V

У d ( X p,

 

Х т) = min [d ( Х т, Х р)\

L м ( М — 1) m=i

 

 

В работе (Л. 18] рассматривается случай К = 2. Ниже рас­ смотрим частный класс метрик, а именно

d (а, Ь) =

K t i a - b i f .

70

Отсюда следует, что необходимо обеспечить минимум следую­ щего выражения:

j

 

М

м

N

 

m inDr = m in -----------------

1)

2

21

21 Wr, - (х

— х V =

М (М -

Р = 1

Д

Д

mi xpi) -

жжN

 

 

м

2

П ,

2 1 ( - i)r_v c ; ^

- v

 

 

 

м

М -

1 и

 

v=0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

где

2

xmi. причем Dr =

0 для

г =

2Л—1, А =

1,

2 . . .

Для

т =1

 

 

 

 

 

 

 

 

 

 

четного т

 

 

 

 

 

 

 

 

 

 

 

 

 

21

 

 

 

 

(3-5)

 

 

 

 

 

 

 

 

 

 

 

 

 

D2h ~~М — 1 “

 

 

 

 

 

 

 

 

2ft

 

i)2ft_v V . x f - v .

 

 

 

 

 

(2ft) =

^

( -

 

 

 

 

 

 

v=o

 

 

 

 

 

 

 

Достаточно просто показать, что

минимум

Д !Л

при условии

ЛГ

 

 

 

 

 

 

 

 

 

 

 

2 l F f i = l

обеспечивается

в случае

 

 

 

 

 

t=i

 

 

 

 

 

 

 

 

 

 

 

Wu =

 

 

1

 

 

 

, t = 1, . . . . N.

 

 

N

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(2ft-

 

 

 

 

 

 

 

 

 

 

 

 

N

/ = 1

 

 

'

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

При

условии

П

=

1 минимум обеспечивается,

если

 

 

 

t=i

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Л?

 

1

 

 

 

 

 

 

 

 

 

 

-1 2ft.1V

 

 

 

 

В^« =

 

 

п /?(2Л)

 

 

 

 

 

 

ут™ /=1

'

 

 

 

 

Отсюда следует, что с учетом (3-5)

 

 

 

 

 

 

 

 

 

N

 

1

 

JV

 

 

min Dj/j =

min

2.М

. у

 

(V

 

 

 

П

F?h)

=

min

П F f h)

= min р.

 

 

М - 1

н

/=i

/

 

 

/= 1

 

 

Дополнительная оптимизация здесь осуществляется поворотом

системы

координат, т. е. линейным преобразованием вида

 

 

 

 

 

 

N

 

 

 

 

(3-6)

 

 

 

 

xmj

2 j xmicji'

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i=l

 

 

 

 

 

71

Исходная ортогональная система координат преобразуется матрицей, на которую накладывается дополнительное требование ортогональности

С =

N

(3-7)

. где 2 4 = 1'

 

i=1

 

CN 1 ' ’ ' CN N .

Вслучае подобного преобразования объем области сохраняется.

Ввыбранной системе координат

2ft

Ff h)= 2 ( -

1)2ft_Vc2V/4ft-v

 

v=o

 

 

 

С учетом (3-6)

Г N

1VГ w

2ft—v

2ft

Jfft)= 2 ( - D (2ft- v)c2vft

L t=i

2

xmicpi

v=0

J Li=l

J

Отсюда

N

 

 

 

 

(3-8)

. . .

 

 

 

 

,=1

 

 

 

 

 

2ft

v С£Лх- . . .

х-

X.

 

 

. = У ( — l)2ft

 

(2ft

v^o

1

v

 

vil

 

 

Итак, минимизируемая величина имеет следующий вид:

N

N

 

N

 

 

 

P = n

2

■■

X

с п

■■■ с а

^

 

—|

/»j

/<2;г ij. . ... ‘2ft-

/= ' »!=!

 

l2h-1

 

 

 

Эту величину необходимо минимизировать при наложении со­ ответствующих ограничений (3-6) на коэффициенты линейного пре­ образования. Из (3-9) получаем:

 

N

/

N

N

 

N

 

 

 

 

 

f -

2

 

п

2

. . .

X

.

е» - - - с»

 

u i

 

 

 

,ll

,l2ft

‘l’ • ■•■‘2ft) X

dc!q

i0= 1

\Ж 0.*1= 1

 

2 -

1

 

 

 

 

 

 

 

 

 

 

‘ ft

 

 

 

 

 

 

з

 

*

 

W

 

 

 

 

 

 

О

 

V

 

• У

Cl

l

■■•

cl i

Ui

Х

л

 

^

'

V l

 

0!2ft

‘l......... ‘2ft"

 

dciq

;1 = 1

 

l2ft=1

 

 

 

 

 

Обозначая

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

N

N

 

 

N

C-- . .

. C„ 'u

л ,

=

п

2

. .

 

 

 

yij

;<2ft

 

<r .. • . ‘2ft

l2ft-1

и производя дальнейшие преобразования, получаем:

 

 

ЛГ

2ft 2ft

 

дск

- Л г Ъ

. . . 2

.... 2«v n

V

ф \

' a - 1

»*v

 

72

Можно показать, что симметричная перестановка индексов в группе индексов не меняет матрицу Ui , . . . , z'2fc> а несимметрич­

ная изменяет ее. Следовательно, выражение для полного дифферен­ циала имеет следующий вид:

N N N

N

= 22 2 2 •••

2 V A i, •••Чд-i Х

Х ( и «11....... 1*~1 +

......... + ‘ ‘

•••+ Uix.....гА-Л......гяЛ—l)*

Минимум при ограничениях типа (3-7) обеспечивается при удовлетворении коэффициентами с следующего соотношения:

N

 

 

 

 

. s

1

4 ■■ ■ 4

f t - 1 (

........ 1'гЛ-

.1 +

2k

1

 

 

o,

+

% . . . .

......... l2h—l)

+ V/<? =

 

 

/ , <7=1,

• • ■, N.

 

 

Отсюда следует, что параметры оптимального нелинейного пре­ образования исходного пространства признаков в данном случае непосредственно определяются через моменты распределения со­ вокупностей образов.

Рассмотрим связь метода допустимых преобразований с тео­ рией статистических решений. В случае г = 2 введенная мера по­ добия образа классу может быть представлена в преобразованном пространстве признаков в следующем виде:

--------------------------------------------------- — ----------- т

2(х , X m) = { x - x m) C W W TCT { x - l m) T .

Здесь / — единичная матрица, a W — диагональная матрица с диагональными элементами, которые в соответствии с (3-5) равны:

1 / » \ТГ

г“=Ч,Н ■

где о,- = / X, X — собственное значение ковариационной матрицы для совокупности образов, соответствующее z'-му собственному век­ тору, хт — вектор из множества Хт. Преобразуем выражение для меры подобия Z следующим образом:

 

 

N

N

 

.---------------------- т

Z (х, Xffl) =

2

2

[CWIWTCT]rs (xr - x mr)(xs - xW

=

 

 

Г — 1

S = 1

 

 

 

 

N

N

 

 

_

__

__

 

[C W

I W

{Xj-X& xrX$

XfXs -)-

■ xrx5

XfX$)

73

= 2 2 1 CWIW TCT]rs{xr - x r){xs -

Xs) +

г—1 S=1

 

+ 2 2 1 CW IW TCT]rsUrs,

(3-10)

/■=1 S=1

 

где Urs — элемент матрицы ковариаций. Далее рассмотрим мат­ рицу

[CWIWTCT] U = C ( W I W T) { C TU) = C ( WIWT) (CTU) (c c ~ l) =

= С (WIWT) (CTUC) C~l = C (WIWT) xc~ l =

 

 

2

 

_ 2_

N

\

N

/ N

\ N

= c ( п СГ/ )

i - h c - i

П (Т/

 

где К -т- диагональная матрица с собственными значениями мат­ рицы по диагонали. Отсюда следует, что

 

 

2

 

N

\

N

 

[CWIWTCT] = ^ п

CT/J

и ~ К

(3-11)

Подставляя (3-11) в (3-10), получаем следующее:

2

/ N

\ N

 

 

z(x>

°'

2

2

Г= 1

S—1

 

N

N

 

^ ’ { * г - хг) К - * * ) +

 

 

 

V

х'

 

 

 

 

 

2

 

 

ЛГ

IV

Г=1 S=1

 

 

 

 

 

 

Найдем 2

2

Urs'^rs-

Известно, что Ursl = —jp -,

где Л

r = i s = i

 

 

д

'

алгебраическое

 

дополнение

элемента Urs в матрице

ковариа­

ций U, а А — определитель матрицы U. Отсюда

 

N

 

N

 

N

/ N

 

/•=1 5=1

 

а Г=1

\S = 1

 

По теореме о разложении определителя по строке или столбцу

получим:

 

N

N

.

N

 

 

 

 

 

 

2 2 и» 1u rs= 4

2 Д = Л/-

 

Отсюда

 

г = 1 s = l

г = 1

 

 

 

2

 

 

 

 

 

N

 

 

 

Z х, Х_

 

N

 

 

 

,

н л

 

2 2

{хг - хг) К - х,) + n

 

r = l s = l

 

 

 

 

 

 

 

 

(3-12)

74

С другой стороны, многомерное нормальное распределение может быть представлено в следующем виде:

 

/(х) = —

лг— 1 7

х

 

 

 

 

 

 

(2л) 2 | U | 2

 

 

 

 

X ехр

' т 2

2

и7? [хг-

хт~ ) (*. -

*,)

(3-13)

 

 

Г— 1

S = 1

 

 

 

 

 

 

Отсюда легко получить преобразование S [/: (х) ],

которое де­

лает равными меру

 

подобия Z, рассмотренную выше

для г = 2

и введенную в |Л. 34], и плотность распределения (3-13):

 

 

 

2

 

 

 

 

 

 

 

 

S [/(х)] =

 

 

 

-1 п ((2 я )* | £/ I) — 2 In / (х)]

 

или, иначе,

 

 

 

 

 

2_

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

N

а,

\ N

X

 

 

 

 

 

Е/ (х) =

II

 

 

 

 

 

 

 

 

i

1

!

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

In

 

 

U N

\

N

2 In /

 

 

 

N —

(2n)N

П а /

 

(х)

 

 

 

 

 

 

\/-i

!

 

 

 

 

 

3-5. Построение СР нестационарных образов

Большинство существующих разработок в области теории и практики распознавания образов относится к стационарным об­ разам, т. е. к таким, когда сигнал х (п) представляет собой стацио­ нарный случайный процесс. Иными словами, картина образа, т. е. множество в М-мерном пространстве является неизменным во вре­ мени, а любой образ является представителем совокупности с рас­ пределением, не зависящим от времени. В действительности пред­ ставление человека об окружающем мире постоянно изменяется. Человек забывает старые факты и больший вес зачастую придает последним. Одним словом, некоторый обобщенный образ у человека как бы перемещается во времени в некотором пространстве призна­ ков, которые вырабатываются у человека в мозгу. Можно было бы назвать несколько практических задач распознавания образом, где образы в пространстве признаков подчиняются законам распре­ деления, переменным во времени.

На рис. 3-5 показаны линии равных значений условных плот­ ностей для первого и второго класса, а также девиация разделяю­ щей поверхности в нестационарном случае. В этом смысле задачу распознавания нестационарных на некотором интервале времени образов иногда можно трактовать как стационарную с более слож­ ной оптимальной разделяющей поверхностью. Рассмотрим простей­ ший случай распознавания двух совокупностей образов, распреде­

75

ленных в текущий момент времени по нормальным законам с рав­ ными ковариационными матрицами. В этом случае при одинаковых дисперсиях для различных признаков уравнение для оптимальной разделяющей поверхности будет иметь следующий вид:

хг [шх (я) — ш2 (я)] = - j - [m f (я) ГП| (я) — tnJ (я) гп2 (я) ], (3-14)

где rrij (я), ш2 (я) — векторы математических ожиданий совокуп­ ностей образов первого и второго класса в текущий момент вре­

мени я.

Таким образом, в данном случае задача синтеза систем распо­ знавания нестационарных образов заключается в оптимальном с не­ которой точки зрения определении оценок векторов математиче-

Рис. 3-5. К рассмотрению нестационарных образов (я — момент времени).

а — стационарный случай; б — нестационарный случай.

ских ожиданий совокупностей образов первого и второго класса (блок /, рис. 3-1) и вычислении параметров разделяющей поверх­ ности (параметров системы распознавания нестационарных обра­

зов) в текущий момент времени (блок II, рис.

3-1)

в соответствии

с формулой (3-14).

3-1

при получении

Необходимо отметить, что в блоке / на рис.

оптимальных оценок векторов математических ожиданий возможно применение ограниченного числа желаемых операторов воспроиз­ ведения полезного сигнала (упреждение на постоянный, убываю­ щий и нулевой интервалы времени) в зависимости от конкретной постановки задач распознавания. В отличие от систем распознава­ ния стационарных образов при нестационарных образах возможны следующие постановки задачи обучения распознаванию:

1. Определение оптимальных параметров системы распознава­ ния в текущий момент времени с целью принятия решения (распо­ знавания) с наименьшими ошибками в текущий момент времени.

2. Определение оптимальных в текущий момент времени па­ раметров системы распознавания нестационарных образов для упрежденного на постоянный интервал а = const момента времени с целью нахождения того, какое наиболее правильное решение нужно будет принимать через время а.

3. Определение в текущий момент времени оптимальных пара­ метров систем распознавания нестационарных образов для упреж­

денного на интервал а — Ь—п (b = const) момента времени с целью нахождения того, какое наиболее правильное решение нужно

будет принимать в некоторый

конкретный момент времени п = В

по текущей информации.

векторов математических ожиданий

При этом задача оценки

ш1 (ft), m2 (п) является классической задачей оптимальной много­ мерной фильтрации случайных процессов, приводимых к стацио­ нарным. Синтез оптимального многомерного фильтра для оценки векторов математических ожиданий приведен в [Л. 43].

3-6. Построение настраивающихся по разомкнутому циклу СР в режиме самообучения

Рассмотрим алгоритм самообучения СР по разомкнутому циклу в том случае, когда распределение f (х) входного сигнала СР яв­

ляется суммой произвольного числа многомерных нормальных за­ конов с соответствующими априорными вероятностями [Л. 55].

Двумодальное распределение

В качестве уравнения для разделяющей поверхности можно использовать любое из приведенных в § 3-2. Как видно из этих урав­ нений, искомыми при решении задачи самообучения в данном слу­ чае являются рх, р2, Шц ш2, Ux, U2, т. е. (N + 1) (N + 2) пара­

метров. Основной задачей в моментном (параметрическом) подходе к самообучению является нахождение зависимости между этими параметрами и моментами распределения входного сигнала. Введем некоторые обозначения

m® = J xf (х) dx;

k =

(kx,

k2,

. . . . kн) — вектор-строка

N

чисел;

kj — Q,

1,2

 

(/ =

1

 

 

N); | к | =

^

N

 

 

.........

 

 

kj порядок

/V-строч-

 

 

N

 

 

 

 

 

 

_ 1 "

 

J (х —

ки к;

хк =

П *■/ =

 

 

.

• • .

 

/ 0 (х) = f (х); !*к. =

/=1

( i =

 

 

2)

 

для | к |

 

2.

 

 

— m [) *f i ( x) dx,

0 ,

1,

 

,

 

 

Очевидны следующие соотношения:

 

 

 

 

 

 

Pi +

P2

= l ;

 

Pi™i +

ргт2= m0.

 

(3-15)

Получим общее выражение для центрального момента р,£ по­

рядка | к] >2 распределения входного сигнала СР через параметры распределений первого и второго класса:

И* = J — m0)k/ (х) dx = рх J (х— m0)kfx(х) dx +

+ P i J ( x m 0)k / 2 (x) d x.

(3-16)

77

В

первом слагаемом

 

 

 

 

 

 

 

 

 

J (х — m0)k fi (х) dx = J [(х — mi) +

(nii — ш0)]к fi

(х) dx -■

 

 

°о

 

 

 

 

 

( N

 

 

 

 

 

 

 

 

=

J

и (Х1...........x n )

П l(xi - тп) + («д - «/„)] I *х,-

 

 

— 00

 

 

 

 

 

1/=1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

оо

 

 

 

 

 

 

 

 

 

 

 

 

 

=

 

I f i (x v ■■x n ) *

 

 

 

 

 

 

N

 

 

 

 

 

 

 

 

dx. | =

 

 

 

X

П

 

 

 

 

 

 

 

 

 

 

 

 

I /=1

 

/.=1

 

 

 

 

 

 

 

 

 

 

I

h (x v

 

■■■> x n )

2 J (x -

ml)'

n

 

C lk4 m ] l - m

l0)kl

li

dx

 

 

 

 

 

 

l<k

 

L/=i

'

 

 

 

 

=

V

 

n

 

C-J (m

-

mj0)кГ 11

J

(x — m j)'

(x) d (x)

 

«3

 

«=1

J

 

 

 

 

 

 

 

 

 

 

 

/=i

V .. ,.k!

 

 

 

 

 

 

 

 

 

 

 

 

 

.Г (mi — m0)k 1fi,,.

 

 

 

 

 

 

 

 

 

l<k

И (к — 1!)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

где

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

к — 1 = (*i — k , ■■■,

kN 1ц);

 

 

 

 

 

 

 

 

 

k!

=

(AJ) (*,l), •

• •

(kN\).

 

 

 

 

Здесь

1

<

к обозначает,

что

одновременно

 

выполняются

< k lt

. . .

,

In < kN> а суммирование

проводится

во всем

1

< к.

Воспользоваться этой зависимостью трудно, так как внутри

суммы

могут

присутствовать

моменты |i/

(7 = 1, 2),

порядок ко­

торых | 1 |> 2 . Известно, что центральные моменты многомерного нормального распределения однозначно выражаются через цен­ тральные моменты второго порядка. Вывод такой зависимости пред­ ставлен в [Л. 49]. Здесь приведен окончательный результат

где К\

— множество

всех наборов

{к/} вектор-строк

к/ порядка

[ку | =

2 таких, что существуют натуральные числа S/,

удовлетво­

ряющие следующему

условию:

 

 

 

 

2 ^ =

1.

 

78

Подставив полученные результаты в (3-16), получаем соотно­ шение между центральными моментами распределения входного сигнала и распределениями первого и второго класса:

 

е». - 2

" I

^

и

<” >'- m*)w х

 

 

i=l

1<к

 

 

 

 

 

 

X

 

 

V-kji

\ Si

(3-17)

 

 

 

 

*/'

) .

 

 

{*/}£«'

 

 

 

 

 

 

 

 

Уравнение (3-16) и необходимое число уравнений (3-17) состав­

ляют

систему (N + 1 )

(N +

2) уравнений относительно

(N -+- 1)

(N +

2) искомых

параметров

 

некоторых

составляющих

функции

распределения p lt

р 2, nij, m2,

S lt S 2. В

[Л. 55] приведены неко­

торые соображения по выбору необходимого числа уравнений. Таким образом, структура рассматриваемой СР в режиме самообу­ чения будет состоять из следующих последовательно соединенных блоков: блока вычисления (N + 1) (N + 2) моментов распределе­ ния входного сигнала, блока вычисления параметров распределе­ ния первого и второго класса, блока построения разделяющих по­ верхностей.

Многомодальное распределение. Уравнения для разделяющих поверхностей в данном случае легко могут быть получены по мате­ риалам, посвященным К классам образов с использованием выра­ жения для многомерного нормального закона. Для построения данной разделяющей поверхности необходимо знать параметры рь,

0

^

(N +

1) (N + 2)

1щ , S* составляющих распределении

I всего К

----- 1

--------- па­

раметров). Система уравнений для определения этих параметров через центральные моменты распределения входного сигнала имеет следующий вид:

К

 

К

 

 

2

Pk =

1;

2

Pkmk =

 

k=\

 

k=\

 

 

 

 

 

k!

I) ! K

- mo)k 1x

k=l

l<k

(k -

 

 

 

\S;I

 

 

П —

Pkjk

*

2

k/1

(3- 18)

i

s,

 

Данная система

уравнений

служит основой для построения

второго из трех указанных блоков вычисления параметров распре­ деления образов первого и второго класса СР, самообучающейся по разомкнутому циклу.

Отметим, что реализация на ЦВМ систем распознавания, на­ страивающихся по разомкнутому циклу, представляет собой само­ стоятельную задачу. Так как реализация связана в основном с во-

79

Соседние файлы в папке книги из ГПНТБ