Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Дашин_ЛБ3

.docx
Скачиваний:
2
Добавлен:
26.01.2024
Размер:
1.28 Mб
Скачать

Лабораторная работа № 3

СРАВНИТЕЛЬНЫЙ АНАЛИЗ МЕТОДОВ КЛАССИФИКАЦИИ ДАННЫХ

  1. Провести снижение размерности методами МГК (PCA) и t-sne.

Доля от общей дисперсии: [0.84136038 0.11751808 0.03473561 0.00638592]

Компоненты PCA:

[[ 0.42494212 -0.15074824 0.61626702 0.64568888]

[ 0.42320271 0.90396711 -0.06038308 -0.00983925]]

[0.84136038 0.11751808]

0.9588784639918416

  1. Провести классификацию (с параметрами по умолчанию)

# 1 ДЕРЕВО РЕШЕНИЙ

precision recall f1-score support

0 1.00 1.00 1.00 40

1 0.89 0.92 0.91 37

2 0.93 0.91 0.92 43

accuracy 0.94 120

macro avg 0.94 0.94 0.94 120

weighted avg 0.94 0.94 0.94 120

#2 К-БЛИЖАЙШИХ СОСЕДЕЙ

precision recall f1-score support

0 1.00 1.00 1.00 40

1 0.89 0.92 0.91 37

2 0.93 0.91 0.92 43

accuracy 0.94 120

macro avg 0.94 0.94 0.94 120

weighted avg 0.94 0.94 0.94 120

#3 СЛУЧАЙНЫЙ ЛЕС

precision recall f1-score support

0 1.00 1.00 1.00 40

1 0.89 0.92 0.91 37

2 0.93 0.91 0.92 43

accuracy 0.94 120

macro avg 0.94 0.94 0.94 120

weighted avg 0.94 0.94 0.94 120

#4 ЛОГИСТИЧЕСКАЯ РЕГРЕССИЯ

precision recall f1-score support

0 1.00 1.00 1.00 40

1 0.95 0.95 0.95 37

2 0.95 0.95 0.95 43

accuracy 0.97 120

macro avg 0.97 0.97 0.97 120

weighted avg 0.97 0.97 0.97 120

  1. Провести настройку параметров лассификаторов с использованием gridsearchcv. Результаты настройки сохранить для следующего пункта. (При защите будет уделяться особое внимание параметрам классификации (обязательно знать, что каждый параметр обозначает) и принципу их обучения и работы)

# 1 ДЕРЕВО РЕШЕНИЙ

Лучшие подобранные параметры:

{'criterion': 'gini', 'max_depth': 9, 'splitter': 'random'}

#2 К-БЛИЖАЙШИХ СОСЕДЕЙ

Лучшие подобранные параметры:

{'leaf_size': 15, 'n_neighbors': 3, 'weights': 'uniform'}

#3 СЛУЧАЙНЫЙ ЛЕС

Лучшие подобранные параметры:

{'max_features': 'auto', 'n_estimators': 200}

#4 ЛОГИСТИЧЕСКАЯ РЕГРЕССИЯ

Лучшие подобранные параметры:

{'C': 1.0, 'max_iter': 500, 'penalty': 'l1', 'solver': 'liblinear'}

  1. Провести классификацию (с параметрами из предыдущего пункта). После обучения требуется визуализировать тестовую выборку:

  1. С исходными метками

  2. С метками полученными при классификации (пункт 2)

  3. С метками полученными при классификации

В отчёт включить все графики. Сделать выводы о качестве классификации. Сравнить с результатами 2 пункта.

# 1 ДЕРЕВО РЕШЕНИЙ

precision recall f1-score support

0 1.00 1.00 1.00 40

1 0.89 0.92 0.91 37

2 0.93 0.91 0.92 43

accuracy 0.94 120

macro avg 0.94 0.94 0.94 120

weighted avg 0.94 0.94 0.94 120

precision recall f1-score support

0 1.00 1.00 1.00 40

1 0.92 0.95 0.93 37

2 0.95 0.93 0.94 43

accuracy 0.96 120

macro avg 0.96 0.96 0.96 120

weighted avg 0.96 0.96 0.96 120

#2 К-БЛИЖАЙШИХ СОСЕДЕЙ

precision recall f1-score support

0 1.00 1.00 1.00 40

1 0.89 0.92 0.91 37

2 0.93 0.91 0.92 43

accuracy 0.94 120

macro avg 0.94 0.94 0.94 120

weighted avg 0.94 0.94 0.94 120

precision recall f1-score support

0 1.00 1.00 1.00 40

1 0.92 0.92 0.92 37

2 0.93 0.93 0.93 43

accuracy 0.95 120

macro avg 0.95 0.95 0.95 120

weighted avg 0.95 0.95 0.95 120

#3 СЛУЧАЙНЫЙ ЛЕС

precision recall f1-score support

0 1.00 1.00 1.00 40

1 0.89 0.92 0.91 37

2 0.93 0.91 0.92 43

accuracy 0.94 120

macro avg 0.94 0.94 0.94 120

weighted avg 0.94 0.94 0.94 120

precision recall f1-score support

0 1.00 1.00 1.00 40

1 0.94 0.92 0.93 37

2 0.93 0.95 0.94 43

accuracy 0.96 120

macro avg 0.96 0.96 0.96 120

weighted avg 0.96 0.96 0.96 120

#4 ЛОГИСТИЧЕСКАЯ РЕГРЕССИЯ

precision recall f1-score support

0 1.00 1.00 1.00 40

1 0.95 0.95 0.95 37

2 0.95 0.95 0.95 43

accuracy 0.97 120

macro avg 0.97 0.97 0.97 120

weighted avg 0.97 0.97 0.97 120

precision recall f1-score support

0 1.00 1.00 1.00 40

1 0.97 0.95 0.96 37

2 0.95 0.98 0.97 43

accuracy 0.97 120

macro avg 0.98 0.97 0.97 120

weighted avg 0.98 0.97 0.97 120

  1. Исследовать возможность проведения классификации данных, содержащихся в датасетах:

- Barotrop.sta;

Дерево решений

precision recall f1-score support

BARO 1.00 0.94 0.97 16

TROP 0.93 1.00 0.97 14

accuracy 0.97 30

macro avg 0.97 0.97 0.97 30

weighted avg 0.97 0.97 0.97 30

Случайный лес

precision recall f1-score support

BARO 0.86 0.75 0.80 16

TROP 0.75 0.86 0.80 14

accuracy 0.80 30

macro avg 0.80 0.80 0.80 30

weighted avg 0.81 0.80 0.80 30

Метод случайных соседей

precision recall f1-score support

BARO 1.00 0.62 0.77 16

TROP 0.70 1.00 0.82 14

accuracy 0.80 30

macro avg 0.85 0.81 0.80 30

weighted avg 0.86 0.80 0.79 30

Соседние файлы в предмете Интеллектуальный Анализ Данных