ml3_ibragimova
.docxГУАП
КАФЕДРА № 41
ОТЧЕТ ЗАЩИЩЕН С ОЦЕНКОЙ
ПРЕПОДАВАТЕЛЬ
Ассистент |
|
|
|
Боженко В. В. |
должность, уч. степень, звание |
|
подпись, дата |
|
инициалы, фамилия |
ОТЧЕТ О ЛАБОРАТОРНОЙ РАБОТЕ №3 |
СЕТЬ КОХОНЕНА |
по курсу: МАШИННОЕ ОБУЧЕНИЕ |
|
|
РАБОТУ ВЫПОЛНИЛ
СТУДЕНТ ГР. № |
4018k |
|
|
|
Р.М. Ибрагимова |
|
|
|
подпись, дата |
|
инициалы, фамилия |
Санкт-Петербург 2023
Цель работы:
Выполнить кластеризацию с помощью сети Кохонена.
Ход работы
Для начала необходимо импортировать все необходимые библиотеки.
Рисунок 1 - Импорт библиотек
Далее был прочитан файл, с которым в дальнейшем будет осуществляться работа. Так же получена информация по его столбцам, а именно, какой тип данных они имеют.
Рисунок 2 – Чтение файла
Было осуществлено форматирование имеющегося набора данных для дальнейшей работы с ним. Затем удалены дубликаты и целевой столбец «Класс», и содержимое файла, а именно первые 20 записей, выведено на экран.
Рисунок 3 – Форматирование набора данных
Рисунок 4 – Часть таблицы
Осуществлена нормализация данных с помощью MinMaxScaler, так как он дает большее значение метрики силуэта, чем стандартный скалер.
Рисунок 5 - Нормализация
Создан класс самоорганизующейся карты Кохонена для работы с сетью, работа которого заключается в произведении перерасчета весов и выдаче предположительного результата.
Рисунок 6 - Класс
Производится обучение сети и получение кластеров. Параметры количество нейронов, радиус, коэффициент обучения и количество эпох - определенны в ходе неоднократного ручного запуска.
Рисунок 7 - Обучение модели
После выведены средние значения для каждого кластера и распределение относительно их. А далее – рассчитана метрика силуэта.
Рисунок 8 - Кластеры
Рисунок 9 - Метрика силуэта
В прошлом семестре методом k-средних для двух кластеров метрика силуэта была равна: 0.522, что больше получившейся с помощью сети Кохонена. Это может указывать, на то, что кластеры сильнее с друг другом пересекаются, но это различие не существенно.
Вывод
В процессе выполнения работы была изучено, что такое самоорганизующаяся карта Кохонена, для чего она используется, принцип ее работы и обучения. Реализована сеть Кохонена с помощью Python, обработан набор данных для тренировки и обучения сети и проверена работоспособность сети. По результатам было выделено 4 кластера в данных.
Ссылка на google.colab https://colab.research.google.com/drive/1lYFAMX3gyC3316IoT_aE9E-xShvnPNp6?usp=sharing