книги из ГПНТБ / Галушкин, А. И. Синтез многослойных систем распознавания образов
.pdfпотери при отнесении образов к тому или иному классу. Матрица коэффициентов потерь имеет следующий вид:
Hi ^12> • • •> |
^Кр |
|
21> |
• • •> |
(2- 12) |
^2КР_ |
||
где lik (г = 1 , 2 ; kp = 1 , . |
. . , /Ср) — коэффициенты по |
терь при отнесении образов г'-го класса к &р-й области. Оче видно необходимо, чтобы
|
|
• -<.IikP’ |
h\>>h2^> ■• • ^2КР* |
|
|
Выражения для условных функций риска в данном слу |
|||||
чае имеют следующий |
вид: |
|
|
||
|
|
|
N |
|
|
|
|
J |
• • • J |
likpfi (х) dx, г2 |
|
|
|
V- 1 5 р(х)>0 |
|
|
|
|
|
|
|
|
(2-13) |
Здесь S р (х )> 0 — область многомерного простран |
|||||
ства признаков, |
|
соответствующая &р-му решению. От |
|||
сюда следует выражение для средней функции риска: |
|||||
Кп |
|
N |
[hkpPifi (х) + hkpPJг (х)] dx. |
J4 ) |
|
|
f ; - - J |
||||
*р= ‘ |
|
|
|
||
s |
kn |
|
|
|
|
|
p(x)>0 |
|
|
|
Найдем выражение для S p (x), минимизирующее сред нюю функцию риска. Введем дополнительное обозначение следующим образом:
8кр (Х ) = |
[hkpPlfl (X) + likpPifi (*)]. |
||
тогда |
Кг |
|
N |
|
|
||
R = |
2 |
, |
■ -j& p (х) dx. |
|
p.=i |
J |
Sр(х)>0
Сиспользованием приведенного выше материала до статочно легко показать, что минимальное значение R до стигается при
5 (Йр)(х) = £." (х)—g k (х)>0, Г - 1 , ... , К
40
или
s (V (*) = l ikPfi w + |
i ^ P M |
- h k P J i w - |
— UkpPJ 2(x )< 0 ; |
k"p = 1 |
......... Kp. |
Выражения для оптимальных моделей СР в случае дру гих рассмотренных выше критериев первичной оптимиза ции могут быть получены достаточно просто на основании изложенного выше метода.
Системы распознавания 4 и 9, Это — системы распозна вания К классов образов, имеющие (Кр— 1) разделяющую поверхность.
При использовании критерия минимума средней функ ции риска система неравенств, ограничивающая в много мерном пространстве признаков область kp-ro решения, имеет следующий вид:
Система распознавания 5. При наличии на входе двух классов образов система распознавания имеет на выходе непрерывный (по уровню) сигнал. Естественно, что данный сигнал, как и входной сигнал СР, является дискретным по времени.
В случае использования критерия первичной оптимизации СР по величине апостериорной вероятности необходимо иметь априори функцию d (хь) превышения апостериорной вероятности принад лежности текущих образов на входе к первому классу над апосте риорной вероятностью принадлежности этих образов ко второму классу при конкретном значении выходного сигнала х* ,т. е. для каждого значения х* в СР априори должна быть определена «уве ренность» СР в отнесении образов к тому или иному классу по апо стериорной вероятности. В этом случае уравнение для оптималь ной модели СР двух классов образов и континуумом решений имеет следующий вид:
/"(e = - l / x ) - d ( * ft) = / " ( e = 1/х).
Отсюда |
|
|
|
_____P l b M ________ d (xk) = |
______ ___________ ; |
||
Pifi (х) + Ра/а (x) |
Pih (x) + P2 / 2 |
(x) |
(2-14a) |
Pih (x) [1 — d {xk)\ — [1 + |
d (xk)] P2f2(x) = |
0. |
|
Это окончательное выражение |
для оптимальной |
модели СР |
в рассматриваемом случае. Это уравнение определяет связь между входным и выходным сигналом СР, которую в принципе необходимо реализовать, исходя из выбранного критерия первичной оптимиза ции и структуры СР.
41
Рассмотрим критерий минимума средней функции риска. Иллюстрация видоизменения функции ошибок при пере ходе от двух к Кр и континууму решений системы распоз навания двух классов образов представлена на рис. 2-5. Следовательно, в данном случае вводится в рассмотрение вместо матрицы (2 -12) коэффициентов ошибок для случая
Рис. 2-5. Иллюстрация видоизменения функции ошибок при переходе от двух к К р и континууму решений СР двух классов образов.
а — два решения; б — три решения; в — /Ср решений; г — конти нуум решений.
двух классов образов и Кр решений вектор функции оши бок
L = h (xk)
J i ( X k ) .
возникающих при приписывании различным образам пер вого и второго класса решения %.
В случае Кр решений СР двух классов образов выраже ние для условной функции риска для образов первого класса имеет следующий вид:
к г |
N |
Г1 = У IIk, j . |
. - J* Л (x) rfx. |
|
(x)>0 |
42
Здесь U S р(х) = Х ,где X — полное многомерное про-
странство признаков. Введем дополнительные обозначе ния:
G (х, kp) = |
1 при х £ S kp ( х )> 0 , |
||
|
|
О при |
x £ S * p (x )> 0 . |
Тогда выражение для условной функции риска гх при |
|||
мет следующий |
вид: |
|
|
|
к р |
N |
• J G (х, kp) /1 (х) dx. |
О = |
Ъ hkv Г■ • |
||
*p= 1 |
х |
|
В этом случае, как и в предыдущих, рассмотренных ра нее, функция G (х, kp) является предметом синтеза. Она определяет оптимальную модель СР, т. е. оптимальную связь (с точки зрения принятого критерия первичной оп тимизации) выходного и входного сигналов СР.
При переходе к континууму решений выражения для функций риска принимают следующий вид:
N
Гх= |
I U ( ^ ) j - • |
JG(x, |
xk)fi(x)dxdxk] |
|
|
Хь |
X |
|
|
|
|
|
|
N |
R = РхГх+ РгО = |
.f j' ■•~j' G (x, xk) X |
|||
|
|
|
xk |
x, |
X [pill (xk) /1 (x) -f p2/2 (xk) /я (x)] dx dxk. |
||||
Обозначая |
|
|
|
|
g (x, |
xk) = |
[рЛ (xk) fx(x) + p2/2 (xk) /2 (x)], |
получаем окончательное выражение для средней функции
риска:
N
R = I |
Г- • |
• fG (х, xk)g(x, xk)dxdxk. |
(2-15) |
V |
х |
J |
|
Здесь функция g (х, xk) задана в общем виде. Функция G (х, xk), являющаяся предметом синтеза, должна быть выражена через функцию g (х, xk) таким образом, чтобы достигался минимум R. На рис. 2-6 представлена иллюстра ция данной функции для случая одномерного пространства признаков и конечного числа Кр решений СР. При переходе
43
к континууму решений СР данная функция вырождается
вфункцию G (х, xk), общий вид которой представлен на рис. 2-7. Это полоса с высотой, равной единице. Предметом
синтеза является форма данной полосы.
Рис. 2-6. Вид функции |
G (х, хк) |
Рис. 2-7. Вид функции G (х, |
для дискретного множества ре- |
для континуума решений и двух |
|
шений и двух классов |
образов. |
классов образов. |
Рис. 2-8. Вид функции G (х, х^ для континуума решений и двух классов образов.
На рис. 2-8 представлена геометрическая иллюстрация функции g (х, xk) в простейшем случае. Таким образом, задача минимизации средней функции риска сводится к за даче минимизации площади полосы G (х, хк) g (х, хк), по лученной модуляцией (профилированием) полосы G (х, xk), показанной на рис. 2-7, функцией g (х, xk).
44
В выражении для средней функции риска (2-15)
G(x. х*) = 1 1 при
1 0 при хк ф р (\),
где функция р (х) есть предмет синтеза — преобразование, осуществляемое СР над входным сигналом в режиме рас познавания. Отсюда выражение для R (х, хк) можно за писать в следующем виде:
N
R = j - • |
[х. P ( x ) ] d x , |
(2-16) |
х
где функция g [х, р (х) ] в данном случае имеет вид:
g [х, р (х)] = Pi/x (х) 1Х\р (х)] + р2/2 (х) /2 [р (х)].
Минимизация R является задачей вариационного ис числения. При этом минимум достигается при условии
dg[x,p(x)] _ q
dp (х)
или с учетом конкретного вида функции g [х, р (х)]:
р Л (*) |
+ PJ. (X) |
= о. |
dp (х) |
|
dp (х) |
Иначе можно записать: |
|
|
||
Pifi (х) dli (Ч) |
+ |
Рг/2(х) d li (хк) |
= 0. (2-17) |
|
|
dxk |
хк=р(х) |
dxk хк=Р(х) |
|
Это уравнение определяет оптимальную модель СР двух |
||||
классов образов с континуумом решений. |
|
|||
Рассмотрим частные случаи. |
второго класса |
|||
1. |
Функции |
ошибок |
для образов первого и |
имеют вид, изображенный на рис. 2-9. Этот случай соответствует одинаковому значению функции ошибок на некотором интервале изменения хк. При этом
dli {Хк) dxk
dli {Хк)
= |
= 2 Л/«а6 (**-*«*)1р(*) = |
*ь=р(х) |
сс=1 |
|
2 ^ « 1^ IP (х) %ак\>
а= 1
dxk |
хк=РМ |
2 А/а2б (хк~ хак) L x) = |
|
а = 1 |
|
|
А |
|
|
= 2 - |
Л/а2б [р (х) — хак]. |
|
0=1 |
|
45
Уравнение для оптимальной модели СР будет иметь следующий
вид:
А
Plfl (X) а =1 A/“l6 |
_ Xak1 _ |
А |
|
—P2/ 2 W 2 |
[Р (х) — Xak) = 0. |
а = 1 |
|
Здесь б (л-*) — б — функция с известными свойствами.
2.Функции ошибок для образов первого и второго класса
функции второго порядка /] (х*) = (1 + х*)2/, /2 (*ft) = (1—х*)2/.
' |
11<х к } |
{< |
f n |
{ . |
J______ 1 |
|
0 |
- 1 |
1 |
j |
| -Я/A- |
|
,1 г (Х к) |
j |
|
<- |
- |
|
l - |
1 |
L — |
g - |
|
1 |
|
X k |
|
Хяк .1 |
I |
* |
r |
j |
|
^ |
I |
1 |
||
|
1 |
1 |
|
|
1---- |
! |
|
Х/к |
Хяк |
Хк
Рис. 2-9. Зависимости функции ошибок для СР с континуумом решений.
При этом
^ * l = 2/(l + *ft), |
^ M = 2/(* ft-l). |
dxk |
dxk |
Подставляя данные выражения в (2-17), получаем уравнение для оптимальной модели р (х) СР с континуумом решений в следую щем виде:
Plfl (X)2/[ 1+ р (х)] + p2f2(х) 21 [р (X) - 1] = 0.
Отсюда следует выражение для оптимальной модели СР с кон тинуумом решений в случае квадратичных функций потерь:
р (х) = Рг/g (х) — p j i (х)
Р2 / 2 (х) + Р1 / 1 (х)
Иллюстрация функции xk = р (х), реализуемой СР, представ лена на рис. 2-10.
3.Функции ошибок для образов первого и второго класса ес
функции первого порядка 1г (xk) = 1 ( 1 + xk), l2 (xk) =-■ l ( \ —xk).
46
В данном случае dl1 (x^/dx^ — /; dl2 (x^/dx^ = — l. Отсюда сле дует, что при линейных функциях ошибок возникают определен ные трудности в формировании оптимальной модели СР. Для ис следования данного вопроса рассмотрим функцию ошибки в сле дующем виде:
к (Ч) = / (1 + xk)e+l, к (Ч) = / (1 - * * ) е+1,
из которого при с — 1 следует случай 2, а при с = 0 — линейный случай. Тогда
■f- к {ч) = |
ахь |
[/(1 + ч ) с+'] = — J— I (1 + ч ) с\ |
ахь |
с + 1 |
-?-к (**)=— |
[/( 1 - ^ ) с+,] = |
_1_ l ( \ - x kf. |
||||||
dxk |
dxk |
|
с + |
1 |
|
|
||
Общее выражение для опти |
|
|
|
|
|
|||
мальной модели СР имеет следую |
|
|
|
|
|
|||
щий вид: |
|
|
|
|
|
|
|
|
Pifi (х) (1 + |
xk)c — p j 2(х) (1 — |
|
|
|
|
|
||
|
— Ч ) с = о |
|
|
|
|
|
||
или, иначе, |
|
|
|
|
|
|
|
|
[Р2/ 3 (x)]'/g— [Pl/l (Х)]'/С ^ |
Рис. 2-10. |
Иллюстрация к оп |
||||||
[p2M x)]’/C+[Pl/l(x)]1/C ' |
тимальной модели СР в случае |
|||||||
континуума |
решений |
и квад |
||||||
При с — 1 получаем уже из |
|
ратичных функций |
потерь. |
|||||
|
|
|
|
|
||||
вестное |
выражение |
оптимальной |
|
порядка. |
Исследуем случай |
|||
модели |
для |
функций |
потерь второго |
|||||
с -* 0. |
Тогда х^ ----- — 1 при любом |
значении |
х, |
удовлетворяющем |
||||
неравенству p j x (х))> р 2/ 2 (х), х*= |
1 при любом значении |
х, удов |
||||||
летворяющем неравенству р2/г (х) |
|
(х)- |
|
|
|
|||
Таким образом, |
в случае линейных функций ошибок и конти |
нуума решений пространство решений вырождается в пространство двух решений.
При сравнении критериев первичной оптимизации СР по ве личине апостериорной вероятности (2-14а) и минимума средней функции риска (2-17) видно, что оптимальные модели СР совпадают,
если |
|
|
|
1 |
~ d ( x k) |
dk (Xk) . |
|
dxk |
|||
|
|
||
1 |
-f- d (х^) |
dk [Ч) |
|
|
dxk
Эти выражения позволяют ввести дополнительную физическую интерпретацию функции d (х«)
47
Рассмотрим критерий минимума средней функции риска при ограничениях (2-7) и (2-8). Минимизация средней функ ции риска (2-15) при условии
N
J J- |
■-jG (x, хк) gi (х, xk)dxdxk = |
|
xk |
x |
|
|
N |
|
|
= 1 ' ' ■|gri[xp(x)]dx = 0 , |
(2-18) |
|
x |
|
где
gi (x, xk) = p1f1(x) h {xk)— p2f2(x) l2 (xk),
приводит к уравнению для оптимальной модели СР следую щего вида:
(1 +A,)Pi/1 ( x ) - ^ M |
+ |
dxk |
xk =P(x) |
+ ( 1 - Ц рМ * ) АЬг *1 |
= |
0. |
(2-19) |
||
|
|
ахk |
хк=Р(х) |
|
|
Множитель |
Лагранжа к определяется |
подстановкой |
|||
(2-19) в (2-18). |
|
|
|
|
|
Ограничение в виде заданного значения составляющей |
|||||
средней функции риска имеет вид: |
|
|
|||
|
N |
|
|
|
|
I J • |
' |
• I G (х, xk) [Pi/i (х) |
\хк)\ dx dxk= а. |
(2-20) |
|
Х к |
X |
|
|
|
|
Обозначая |
|
|
|
|
|
§2 (х, хк, к) — g (х, хк) + |
(х) li (хк) — |
|
|||
= |
0 |
+ Pifi (х) h (хк) + |
р2/2 (х) 12 (хк), |
|
получаем выражение для оптимальной модели СР в сле дующем виде:
Ф?2 (х, xk, k)\Xk=PW
др (х)
или, иначе,
dxk |
+ |
хк=р (х) |
|
dlj (хк) |
(2-21) |
+ Р2/2 (х) |
|
dxk |
|
Множитель А, определяется подстановкой (2-15) в (2-20).
48
Система распознавания 6. Система распознавания К классов образов с континуумом решений имеет оптималь ную модель следующего вида в случае критерия минимума средней функции риска:
к |
PkfAx)dlkM_ |
= 0, |
2 |
|
|
|
|
xk=P(x) |
где Р (х) = xk — оптимальная модель СР в данном случае. Система распознавания 7. Это система распознавания К классов образов с двумя решениями. В случае критерия минимума средней функции риска вместо матрицы коэффи циентов потерь, возникающих при отнесении образа г'-го
класса к /-му, которая для системы 1 имеет вид:
1 _ |
111 ^12 |
- |
|
' и - |
, |
, |
|
|
121 122_ |
|
|
необходимо ввести в рассмотрение |
матрицу |
||
|
I11 |
^12 |
|
|
^21 |
^22 |
|
L = |
LkI l |
Уl k2 |
• |
У к 1 ^К2_
Матрица L есть матрица коэффициентов потерь, воз никающих при отнесении образов, относящихся к k-му классу (& — 1 , . . . , К), к областям многомерного про странства признаков, соответствующим первому и второму решению. Выражение для условной функции риска имеет следующий вид:
N N
rk= h i ^ |
- ■ • J |
/*(x)dx + |
/A2 J • • |
- ^ f k(x)dx. |
|
|
S (x)< 0 |
|
|
S (x)> 0 |
|
Средняя функция риска получается усреднением ус |
|||||
ловной функции риска по всем классам: |
|
||||
к |
|
к |
|
N |
|
|
Pki.ki |
|
|
||
R 2 |
= |
2 |
I • • • J |
fk (X) dx + |
|
■ |
РкГк~- |
|
S(x)<0 |
|
|
k=i |
|
fc=l |
|
|
|
|
|
|
N |
|
|
|
+ 2 |
P k l k 2 J • ‘ |
' J /fc(*)dx. |
||
|
e = l |
|
S(x)>0 |
|
49