Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ИДЗ_Дегилевич.docx
Скачиваний:
5
Добавлен:
04.09.2023
Размер:
954.53 Кб
Скачать

5 Метод классификации по критерию фишера для многоклассовой задачи

В случае когда классов больше 2-х (как в нашей задаче) матричное преобразование производится в пространство размерностью больше одного. Для случая 3-х классов необходимо найти 2 весовых вектора и проецирующих данные в двумерное пространство, где классы разделимы. Для этого необходимо найти две матрицы по формулам (9, 10):

(9)

(10)

где – матрица разброса для i–го класса (находится как выборочная матрица ковариации i-го класса)

Далее нахождение элементов векторов и сводится к задаче определения собственных значений матрицы . Собственные векторы с ненулевыми собственными значениями определяют то (c – 1)–мерное пространство, в котором могут быть построены дискриминантные функции и определены решающие правила.

На рисунке 5 приведены результаты отображения объектов на плоскость в пространстве собственных векторов , .

В таблице 26 представлены весовые вектора классификации для классификации многоклассовой задачи Фишера.

Рисунок 5 – Проекция объектов на плоскость в пространстве собственных векторов

Таблица 26 – Коэффициент W1 и W2

Коэффициент

Коэффициенты весового вектора

Порог классификации

W1

[0,006 ; 0,0003 ; 0,01; -0,1; -0,09; 0,15; 0,04; -0,36; -0,21; 0,63; 0,61]

5

W2

[-0,07; 0,27; 0,23; 0,1; -0,32; 0,35; 0,36; 0,13; -0,16; -0,04; 0,68]

28

Видно, что в полученном двумерном пространстве классы разделимы. Используя ранее рассмотренные методы можно обучить модель классификации, либо сформулировать разделяющее правило для классификации в пространстве полученных признаков, например:

1. Вычислить скалярное произведение векторов данных на W2

т.е. 0,006(x1) + 0,0003(x2) + 0,01(x3) – 0,1(x4) – 0,09(x5) + 0,15(x6) + 0,04(x7) – 0,36(x8) – 0,21(x9) + 0,63(x10) – 0,61(x11) – 28

2. Если , то данный объект принадлежит классу ЖТ, иначе переходим к пункту 3.

3. Вычислить скалярное произведение векторов данных на W1

т.е. -0,07(x1) + 0,27(x2) + 0,23(x3) + 0,1(x4) – 0,32(x5) + 0,35(x6) + 0,36(x7) + 0,13(x8) – 0,16(x9) – 0,04(x10) + 0,68(x11) – 5

4. Если , то данный объект принадлежит классу ФР, иначе ФЖ.

В таблице 27 представлены результаты классификации экспериментальных данных предложенным решающим правилом

Таблица 27 – Оценка ошибок классификации по распределению Гаусса

Истинный класс, i

Число объектов

Результат распознавания (класс), j

ФР

ЖТ

ФЖ

ФР

30

30

1

0

ЖТ

30

0

28

1

ФЖ

30

0

1

29

ОА = 0,97

6 Сравнение методов

На рисунке 6 представлены ROC кривые, построенные по данным выборки.

Рисунок 6 – ROC кривые

На рисунке 7 представлены ROC кривые, построенные по оценке распределения Гаусса.

Рисунок 7 – ROC кривые по распределению Гаусса

Видно, что алгоритм классификации по минимуму расстояний показал минимальные показатели точности на обоих этапах классификации.

Алгоритм линейного дискриминанта Фишера показал наибольшую точность. ROC кривая, построенная на основе этого метода, максимально приближена к кривой идеального классификатора.

В таблице 28 представлены значения площадей под ROC кривой для каждого из методов.

Таблица 28 – Сравнительная таблица точности методов

Минимум расстояний

Линейный дискриминант Фишера

Этап 1

Этап 2

Этап 1

Этап 2

Выборка

0,94

0,81

1

0,99

Гаусс

0,92

0,72

1

0,98

На основании численных значений можно сделать вывод, что лучшим методом для классификации особо опасных сердечных аритмий является критерий Фишера.

Соседние файлы в предмете Технологии и системы принятия решений