Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги из ГПНТБ / Галушкин, А. И. Синтез многослойных систем распознавания образов

.pdf
Скачиваний:
11
Добавлен:
22.10.2023
Размер:
12.65 Mб
Скачать

потери при отнесении образов к тому или иному классу. Матрица коэффициентов потерь имеет следующий вид:

Hi ^12> • • •>

^Кр

21>

• • •>

(2- 12)

^2КР_

где lik (г = 1 , 2 ; kp = 1 , .

. . , /Ср) — коэффициенты по­

терь при отнесении образов г'-го класса к &р-й области. Оче­ видно необходимо, чтобы

 

 

-<.IikP’

h\>>h2^> ■• • ^2КР*

 

Выражения для условных функций риска в данном слу­

чае имеют следующий

вид:

 

 

 

 

 

N

 

 

 

 

J

• • • J

likpfi (х) dx, г2

 

 

 

V- 1 5 р(х)>0

 

 

 

 

 

 

 

(2-13)

Здесь S р (х )> 0 — область многомерного простран­

ства признаков,

 

соответствующая &р-му решению. От­

сюда следует выражение для средней функции риска:

Кп

 

N

[hkpPifi (х) + hkpPJг (х)] dx.

J4 )

 

f ; - - J

*р= ‘

 

 

 

s

kn

 

 

 

 

p(x)>0

 

 

 

Найдем выражение для S p (x), минимизирующее сред­ нюю функцию риска. Введем дополнительное обозначение следующим образом:

8кр (Х ) =

[hkpPlfl (X) + likpPifi (*)].

тогда

Кг

 

N

 

 

R =

2

,

■ -j& p (х) dx.

 

p.=i

J

Sр(х)>0

Сиспользованием приведенного выше материала до­ статочно легко показать, что минимальное значение R до­ стигается при

5 (Йр)(х) = £." (х)—g k (х)>0, Г - 1 , ... , К

40

или

s (V (*) = l ikPfi w +

i ^ P M

- h k P J i w -

— UkpPJ 2(x )< 0 ;

k"p = 1

......... Kp.

Выражения для оптимальных моделей СР в случае дру­ гих рассмотренных выше критериев первичной оптимиза­ ции могут быть получены достаточно просто на основании изложенного выше метода.

Системы распознавания 4 и 9, Это — системы распозна­ вания К классов образов, имеющие (Кр1) разделяющую поверхность.

При использовании критерия минимума средней функ­ ции риска система неравенств, ограничивающая в много­ мерном пространстве признаков область kp-ro решения, имеет следующий вид:

Система распознавания 5. При наличии на входе двух классов образов система распознавания имеет на выходе непрерывный (по уровню) сигнал. Естественно, что данный сигнал, как и входной сигнал СР, является дискретным по времени.

В случае использования критерия первичной оптимизации СР по величине апостериорной вероятности необходимо иметь априори функцию d (хь) превышения апостериорной вероятности принад­ лежности текущих образов на входе к первому классу над апосте­ риорной вероятностью принадлежности этих образов ко второму классу при конкретном значении выходного сигнала х* ,т. е. для каждого значения х* в СР априори должна быть определена «уве­ ренность» СР в отнесении образов к тому или иному классу по апо­ стериорной вероятности. В этом случае уравнение для оптималь­ ной модели СР двух классов образов и континуумом решений имеет следующий вид:

/"(e = - l / x ) - d ( * ft) = / " ( e = 1/х).

Отсюда

 

 

 

_____P l b M ________ d (xk) =

______ ___________ ;

Pifi (х) + Ра/а (x)

Pih (x) + P2 / 2

(x)

(2-14a)

Pih (x) [1 — d {xk)\ — [1 +

d (xk)] P2f2(x) =

0.

 

Это окончательное выражение

для оптимальной

модели СР

в рассматриваемом случае. Это уравнение определяет связь между входным и выходным сигналом СР, которую в принципе необходимо реализовать, исходя из выбранного критерия первичной оптимиза­ ции и структуры СР.

41

Рассмотрим критерий минимума средней функции риска. Иллюстрация видоизменения функции ошибок при пере­ ходе от двух к Кр и континууму решений системы распоз­ навания двух классов образов представлена на рис. 2-5. Следовательно, в данном случае вводится в рассмотрение вместо матрицы (2 -12) коэффициентов ошибок для случая

Рис. 2-5. Иллюстрация видоизменения функции ошибок при переходе от двух к К р и континууму решений СР двух классов образов.

а — два решения; б — три решения; в — /Ср решений; г — конти­ нуум решений.

двух классов образов и Кр решений вектор функции оши­ бок

L = h (xk)

J i ( X k ) .

возникающих при приписывании различным образам пер­ вого и второго класса решения %.

В случае Кр решений СР двух классов образов выраже­ ние для условной функции риска для образов первого класса имеет следующий вид:

к г

N

Г1 = У IIk, j .

. - J* Л (x) rfx.

 

(x)>0

42

Здесь U S р(х) = Х ,где X — полное многомерное про-

странство признаков. Введем дополнительные обозначе­ ния:

G (х, kp) =

1 при х £ S kp ( х )> 0 ,

 

 

О при

x £ S * p (x )> 0 .

Тогда выражение для условной функции риска гх при­

мет следующий

вид:

 

 

 

к р

N

• J G (х, kp) /1 (х) dx.

О =

Ъ hkv Г■ •

*p= 1

х

 

В этом случае, как и в предыдущих, рассмотренных ра­ нее, функция G (х, kp) является предметом синтеза. Она определяет оптимальную модель СР, т. е. оптимальную связь (с точки зрения принятого критерия первичной оп­ тимизации) выходного и входного сигналов СР.

При переходе к континууму решений выражения для функций риска принимают следующий вид:

N

Гх=

I U ( ^ ) j - •

JG(x,

xk)fi(x)dxdxk]

 

Хь

X

 

 

 

 

 

 

N

R = РхГх+ РгО =

.f j' ■•~j' G (x, xk) X

 

 

 

xk

x,

X [pill (xk) /1 (x) -f p2/2 (xk) /я (x)] dx dxk.

Обозначая

 

 

 

 

g (x,

xk) =

[рЛ (xk) fx(x) + p2/2 (xk) /2 (x)],

получаем окончательное выражение для средней функции

риска:

N

R = I

Г- •

• fG (х, xk)g(x, xk)dxdxk.

(2-15)

V

х

J

 

Здесь функция g (х, xk) задана в общем виде. Функция G (х, xk), являющаяся предметом синтеза, должна быть выражена через функцию g (х, xk) таким образом, чтобы достигался минимум R. На рис. 2-6 представлена иллюстра­ ция данной функции для случая одномерного пространства признаков и конечного числа Кр решений СР. При переходе

43

к континууму решений СР данная функция вырождается

вфункцию G (х, xk), общий вид которой представлен на рис. 2-7. Это полоса с высотой, равной единице. Предметом

синтеза является форма данной полосы.

Рис. 2-6. Вид функции

G (х, хк)

Рис. 2-7. Вид функции G (х,

для дискретного множества ре-

для континуума решений и двух

шений и двух классов

образов.

классов образов.

Рис. 2-8. Вид функции G (х, х^ для континуума решений и двух классов образов.

На рис. 2-8 представлена геометрическая иллюстрация функции g (х, xk) в простейшем случае. Таким образом, задача минимизации средней функции риска сводится к за­ даче минимизации площади полосы G (х, хк) g (х, хк), по­ лученной модуляцией (профилированием) полосы G (х, xk), показанной на рис. 2-7, функцией g (х, xk).

44

В выражении для средней функции риска (2-15)

G(x. х*) = 1 1 при

1 0 при хк ф р (\),

где функция р (х) есть предмет синтеза — преобразование, осуществляемое СР над входным сигналом в режиме рас­ познавания. Отсюда выражение для R (х, хк) можно за­ писать в следующем виде:

N

R = j - •

[х. P ( x ) ] d x ,

(2-16)

х

где функция g [х, р (х) ] в данном случае имеет вид:

g [х, р (х)] = Pi/x (х) 1Х\р (х)] + р2/2 (х) /2 [р (х)].

Минимизация R является задачей вариационного ис­ числения. При этом минимум достигается при условии

dg[x,p(x)] _ q

dp (х)

или с учетом конкретного вида функции g [х, р (х)]:

р Л (*)

+ PJ. (X)

= о.

dp (х)

 

dp (х)

Иначе можно записать:

 

 

Pifi (х) dli (Ч)

+

Рг/2(х) d li (хк)

= 0. (2-17)

 

dxk

хк=р(х)

dxk хк=Р(х)

 

Это уравнение определяет оптимальную модель СР двух

классов образов с континуумом решений.

 

Рассмотрим частные случаи.

второго класса

1.

Функции

ошибок

для образов первого и

имеют вид, изображенный на рис. 2-9. Этот случай соответствует одинаковому значению функции ошибок на некотором интервале изменения хк. При этом

dli {Хк) dxk

dli {Хк)

=

= 2 Л/«а6 (**-*«*)1р(*) =

*ь=р(х)

сс=1

 

2 ^ « 1^ IP (х) %ак\>

а= 1

dxk

хк=РМ

2 А/а2б (хк~ хак) L x) =

 

а = 1

 

А

 

 

= 2 -

Л/а2б (х) — хак].

 

0=1

 

45

Уравнение для оптимальной модели СР будет иметь следующий

вид:

А

Plfl (X) а =1 A/“l6

_ Xak1 _

А

 

—P2/ 2 W 2

(х) — Xak) = 0.

а = 1

 

Здесь б (л-*) — б — функция с известными свойствами.

2.Функции ошибок для образов первого и второго класса

функции второго порядка /] (х*) = (1 + х*)2/, /2 (*ft) = (1—х*)2/.

'

11<х к }

{<

f n

{ .

J______ 1

0

- 1

1

j

| -Я/A-

,1 г (Х к)

j

<-

-

 

l -

1

L —

g -

 

1

 

X k

 

Хяк .1

I

*

r

j

 

^

I

1

 

1

1

 

 

1----

!

 

Х/к

Хяк

Хк

Рис. 2-9. Зависимости функции ошибок для СР с континуумом решений.

При этом

^ * l = 2/(l + *ft),

^ M = 2/(* ft-l).

dxk

dxk

Подставляя данные выражения в (2-17), получаем уравнение для оптимальной модели р (х) СР с континуумом решений в следую­ щем виде:

Plfl (X)2/[ 1+ р (х)] + p2f2(х) 21 [р (X) - 1] = 0.

Отсюда следует выражение для оптимальной модели СР с кон­ тинуумом решений в случае квадратичных функций потерь:

р (х) = Рг/g (х) — p j i (х)

Р2 / 2 (х) + Р1 / 1 (х)

Иллюстрация функции xk = р (х), реализуемой СР, представ­ лена на рис. 2-10.

3.Функции ошибок для образов первого и второго класса ес

функции первого порядка 1г (xk) = 1 ( 1 + xk), l2 (xk) =-■ l ( \ —xk).

46

В данном случае dl1 (x^/dx^ /; dl2 (x^/dx^ = l. Отсюда сле­ дует, что при линейных функциях ошибок возникают определен­ ные трудности в формировании оптимальной модели СР. Для ис­ следования данного вопроса рассмотрим функцию ошибки в сле­ дующем виде:

к (Ч) = / (1 + xk)e+l, к (Ч) = / (1 - * * ) е+1,

из которого при с — 1 следует случай 2, а при с = 0 — линейный случай. Тогда

■f- к {ч) =

ахь

[/(1 + ч ) с+'] = — J— I (1 + ч ) с\

ахь

с + 1

-?-к (**)=—

[/( 1 - ^ ) с+,] =

_1_ l ( \ - x kf.

dxk

dxk

 

с +

1

 

 

Общее выражение для опти­

 

 

 

 

 

мальной модели СР имеет следую­

 

 

 

 

 

щий вид:

 

 

 

 

 

 

 

Pifi (х) (1 +

xk)c — p j 2(х) (1 —

 

 

 

 

 

 

Ч ) с = о

 

 

 

 

 

или, иначе,

 

 

 

 

 

 

 

[Р2/ 3 (x)]'/g— [Pl/l (Х)]'/С ^

Рис. 2-10.

Иллюстрация к оп­

[p2M x)]’/C+[Pl/l(x)]1/C '

тимальной модели СР в случае

континуума

решений

и квад­

При с — 1 получаем уже из­

 

ратичных функций

потерь.

 

 

 

 

 

вестное

выражение

оптимальной

 

порядка.

Исследуем случай

модели

для

функций

потерь второго

с -* 0.

Тогда х^ ----- — 1 при любом

значении

х,

удовлетворяющем

неравенству p j x (х))> р 2/ 2 (х), х*=

1 при любом значении

х, удов­

летворяющем неравенству р2/г (х)

 

(х)-

 

 

 

Таким образом,

в случае линейных функций ошибок и конти­

нуума решений пространство решений вырождается в пространство двух решений.

При сравнении критериев первичной оптимизации СР по ве­ личине апостериорной вероятности (2-14а) и минимума средней функции риска (2-17) видно, что оптимальные модели СР совпадают,

если

 

 

1

~ d ( x k)

dk (Xk) .

dxk

 

 

1

-f- d (х^)

dk [Ч)

 

dxk

Эти выражения позволяют ввести дополнительную физическую интерпретацию функции d (х«)

47

Рассмотрим критерий минимума средней функции риска при ограничениях (2-7) и (2-8). Минимизация средней функ­ ции риска (2-15) при условии

N

J J-

■-jG (x, хк) gi (х, xk)dxdxk =

 

xk

x

 

 

N

 

 

= 1 ' ' ■|gri[xp(x)]dx = 0 ,

(2-18)

 

x

 

где

gi (x, xk) = p1f1(x) h {xk)— p2f2(x) l2 (xk),

приводит к уравнению для оптимальной модели СР следую­ щего вида:

(1 +A,)Pi/1 ( x ) - ^ M

+

dxk

xk =P(x)

+ ( 1 - Ц рМ * ) АЬг *1

=

0.

(2-19)

 

 

ахk

хк=Р(х)

 

 

Множитель

Лагранжа к определяется

подстановкой

(2-19) в (2-18).

 

 

 

 

Ограничение в виде заданного значения составляющей

средней функции риска имеет вид:

 

 

 

N

 

 

 

 

I J •

'

• I G (х, xk) [Pi/i (х)

\хк)\ dx dxk= а.

(2-20)

Х к

X

 

 

 

 

Обозначая

 

 

 

 

 

§2 (х, хк, к) g (х, хк) +

(х) li (хк) —

 

=

0

+ Pifi (х) h (хк) +

р2/2 (х) 12 (хк),

 

получаем выражение для оптимальной модели СР в сле­ дующем виде:

Ф?2 (х, xk, k)\Xk=PW

др (х)

или, иначе,

dxk

+

хк=р (х)

dlj (хк)

(2-21)

+ Р2/2 (х)

dxk

 

Множитель А, определяется подстановкой (2-15) в (2-20).

48

Система распознавания 6. Система распознавания К классов образов с континуумом решений имеет оптималь­ ную модель следующего вида в случае критерия минимума средней функции риска:

к

PkfAx)dlkM_

= 0,

2

 

 

 

xk=P(x)

где Р (х) = xk — оптимальная модель СР в данном случае. Система распознавания 7. Это система распознавания К классов образов с двумя решениями. В случае критерия минимума средней функции риска вместо матрицы коэффи­ циентов потерь, возникающих при отнесении образа г'-го

класса к /-му, которая для системы 1 имеет вид:

1 _

111 ^12

-

' и -

,

,

 

121 122_

 

необходимо ввести в рассмотрение

матрицу

 

I11

^12

 

 

^21

^22

 

L =

LkI l

Уl k2

У к 1 2_

Матрица L есть матрица коэффициентов потерь, воз­ никающих при отнесении образов, относящихся к k-му классу (& — 1 , . . . , К), к областям многомерного про­ странства признаков, соответствующим первому и второму решению. Выражение для условной функции риска имеет следующий вид:

N N

rk= h i ^

- ■ • J

/*(x)dx +

/A2 J • •

- ^ f k(x)dx.

 

S (x)< 0

 

 

S (x)> 0

Средняя функция риска получается усреднением ус­

ловной функции риска по всем классам:

 

к

 

к

 

N

 

 

Pki.ki

 

 

R 2

=

2

I • • • J

fk (X) dx +

РкГк~-

 

S(x)<0

 

k=i

 

fc=l

 

 

 

 

 

N

 

 

 

+ 2

P k l k 2 J • ‘

' J /fc(*)dx.

 

e = l

 

S(x)>0

 

49

Соседние файлы в папке книги из ГПНТБ