Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

5304

.pdf
Скачиваний:
0
Добавлен:
21.11.2023
Размер:
585.74 Кб
Скачать

. 3.2 Примеры задач для практических занятий

Задача 1. (Задание по теме «Ассоциативные правила. Алгоритм A priori.»

Для заданной базы транзакций, приняв пороговое значение поддержки, равное 35%, найдите популярные трех-предметные наборы. Постройте два правила. Вычислите для них показатели зна-

чимости.

Задача 2 по теме «Деревья решений».

Используя предложенные данные, постройте несколько моделей деревьев решений по алго-

ритмам ID3 и CART. Опишите правила.

Задача 3 по теме «Алгоритм обратного распространения ошибок нейросетевого моделирова-

ния»:

Для НС типа 3-2-3 на вход подается вектор (1; 0,9; 0,9) для которого целевым выходным вектором является (0,1; 0,9; 0,1).

Пусть выходом элемента В является значение 0,6, а выходом элемента С – значение 0,8. Функцией активации является сигмоида.

1)Вычислите фактический выходной вектор

2)Вычислите значения ошибок для каждого выходного элемента

3)Вычислите значения ошибок для каждого скрытого элемента.

Задание 4. Построение модели отклика получателей рассылки на активных и неактивных при помощи алгоритма построения дерева решений.

Торговая компания, осуществляющая продажу товаров, располагает информацией о своих клиентах и их покупках. Компания провела рекламную рассылку 13 504 клиентам и получила от-

клик в 14,5 % случаев. Необходимо построить модели отклика и проанализировать результаты,

чтобы предложить способы минимизации издержек на новые почтовые рассылки.

Данные находятся в файлах responses1.txt (обучающее множество) и responses2.txt (тестовое множество). Они представлены таблицами со следующими полями:

Таблица 1 – Поля наборов данных «Отклики»

N

Поле

Описание

Тип

1

Код клиента

Уникальный идентификатор

целый

2

Пол

Пол клиента

строковый

3

Сколько лет клиенту

Число лет с момента первой покупки. Если

целый

 

 

менее года, то в поле стоит 0

 

4

Кол-во позиций товаров

Сколько уникальных товаров приобретал клиент

целый

11

5

Доход с клиента, тыс. ед.

Суммарная стоимость всех заказов клиента

вещест.

6

Число покупок в тек. году

Сколько раз клиент делал заказ в текущем году

целый

7

Обращений в службу

Сколько раз клиент обращался в службу поддержки

целый

 

поддержки

 

 

8

Задержки платежей

Задержки клиента фиксируются, когда длительное

целый

 

 

время после заказа оплата не поступает

 

9

Дисконтная карта

Является ли клиент участником дисконтных про-

целый

 

 

грамм, дающих право на скидки

 

10

Возраст

Возраст клиента

целый

11

Отклик

Отклик клиента на последнюю рассылку.

целый

 

 

Значение «1» означает, что клиент совершил покуп-

 

 

 

ку после прямой адресной рассылки.

 

12

Дата отклика

Информационное поле (пустое, если отклика не было)

дата

1. Построить и изучить Матрицу корреляции для оценки влияния входных переменных на выход-

ную.

2.Для получения правил классификации запустить обработчик Дерево решений.

3.Изучите визуализаторы «Дерево решения», «Правила», «Значимость атрибутов», «Матрица классификации».

4.Изменяя порог отсечения построить новые модели, выбрать модель, лучшую с точки зрения точности и интерпретации. Выписать наиболее значимые правила.

5.Построить дерево решений на сбалансированном обучающем множестве и посмотреть те же ви-

зуализаторы и сделать вывод о качестве моделей.

6. Построить интерактивное дерево решений на сбалансированной выборке, приняв во внимание

пожелания экспертов:

Первым атрибутом должен быть «Сколько лет клиент».

Вторым атрибутом – «Доход с клиента». Всех клиентов нужно разбить на 3 категории:

малоприбыльные (до 20 тыс. ед.), дающие умеренный (от 20 тыс. до 50 тыс. ед.) и высокий доход (свыше 50 тыс.ед.).

7. Изучить визуализаторы для интерактивного дерева. Выписать наиболее значимые и инте-

ресные правила.

8. Прогнать через лучшую модель тестовое множество и сделать выводы о качестве классифи-

кации.

9. Проведенное исследование оформить в виде отчета.

 

Задача 5.

 

Дана небольшая база:

Т01

Сливы, салат, помидоры

12

Т02

Сельдерей, конфеты,

Т03

Конфеты

Т04

Яблоки, морковь, помидоры, картофель, конфеты

Т05

Яблоки, апельсины, салат, конфеты, помидоры

Т06

Персики, апельсины, сельдерей, помидоры

Т07

Фасоль, салат, помидоры

Т08

Апельсины, салат, морковь, помидоры, конфеты

Т09

Яблоки, бананы, сливы, морковь, помидоры, лук, конфеты

Т010

Яблоки, картофель

1)Приняв пороговое значение поддержки, равное 35%, найдите популярные трех-предметные наборы.

2)Для данных таблицы 1 нужно рассчитать показатели: Поддержка (S), Достоверность (С),

Лифт (L), Леверидж (Рычаг) (T), Улучшение (I) для наборов: а) салат -> помидоры; б) кон-

феты -> помидоры.

Задача 6.

Для транзакций (см. таблицу) найти ассоциативные правила, используя метод apriori (По-

рог=4). Выявить значимые правила (Поддержка ≥ 20%, достоверность ≥ 80%)

Таблица транзакций:

1

a, b, c, d, e

2

a, b, c

3

a, c, d, e

4

b, c, d, e

5

b, c

6

b, d, e

7

c, d, e

Задача 7.

1)Для данных таблицы рассчитать показатели: Поддержка (S), Достоверность (С), Лифт (L),

Леверидж (Рычаг) (T), Улучшение (I) для всех наборов. Количество наборов можно рассчи-

тать по формуле:

2)Перечислить правила, у которых поддержка ≥ 20%, достоверность ≥ 80%

3)Найти ассоциативные правила, используя метод a-priori (Порог=4). Выявить значимые пра-

вила (Поддержка ≥ 20%, достоверность ≥ 80%)

4)Построить FP - дерево

Т01

Капуста, перец, кукуруза

Т02

Спаржа, кабачки, кукуруза

 

13

Т03

Конфеты

Т04

Кукуруза, помидоры, фасоль, кабачки

Т05

Перец, кукуруза, помидоры, фасоль

Т06

Кабачки, спаржа, фасоль, помидоры

Т07

Помидоры, кукуруза

Т08

Капуста, помидоры, перец

Т09

Кабачки, спаржа, фасоль

Т010

Фасоль, кукуруза

Т011

Перец, капуста, фасоль, кабачки

Т012

Спаржа, фасоль, кабачки

Т013

Кабачки, кукуруза, спаржа, фасоль

Т014

Кукуруза, перец, помидоры, фасоль, капуста

.4. Методические указания по организации самостоятельной работы

. 4.1 Общие рекомендации для самостоятельной работы

Самостоятельная работа студентов является основным способом овладения учебным мате-

риалом в свободное от обязательных учебных занятий время.

Целями самостоятельной работы студентов являются:

-систематизация и закрепление полученных теоретических знаний и умений студентов;

-углубление и расширение теоретических знаний;

-формирование умений использовать нормативную, правовую, справочную документацию

испециальную литературу;

-развитие познавательных способностей и активности студентов:

-формирования самостоятельности мышления, способностей к саморазвитию, самосовер-

шенствованию и самореализации.

Запланированная в учебном плане самостоятельная работа студента рассматривается как связанная либо с конкретной темой изучаемой дисциплины, либо с подготовкой к расчетной рабо-

те. В данном разделе рассматривается только самостоятельная работа первого вида.

Самостоятельная работа выполняется в два этапа: планирование и реализация.

Планирование самостоятельной работы включает:

-уяснение задания на самостоятельную работу;

-подбор рекомендованной литературы;

-составление плана работы, в котором определяются основные пункты предстоящей подго-

товки.

Составление плана дисциплинирует и повышает организованность в работе.

На втором этапе реализуется составленный план. Реализация включает в себя:

- изучение рекомендованной литературы;

14

-составление плана (конспекта) по изучаемому материалу (вопросу);

-взаимное обсуждение материала.

Необходимо помнить, что на лекции обычно рассматривается не весь материал. Оставшаяся восполняется в процессе самостоятельной работы. В связи с этим работа с рекомендованной лите-

ратурой обязательна.

Работа с литературой и иными источниками информации включает в себя две группы при-

емов: техническую, имеющую библиографическую направленность, и содержательную. Первая группа – уяснение потребностей в литературе; получение литературы; просмотр литературы на уровне общей, первичной оценки; анализ надежности публикаций как источника информации, их относимости и степени полезности. Вторая – подробное изучение и извлечение необходимой ин-

формации.

Для поиска необходимой литературы можно использовать следующие способы:

-поиск через систематический каталог в библиотеке;

-просмотр специальных периодических изданий;

-использование материалов, размещенных в сети Интернет.

В процессе взаимного обсуждения материала закрепляются знания, а также приобретается практика в изложении и разъяснении полученных знаний, развивается речь.

При необходимости студенту следует обращаться за консультацией к преподавателю.

Составление записей или конспектов позволяет составить сжатое представление по изучае-

мым вопросам. Записи имеют первостепенное значение для самостоятельной работы студентов.

Они помогают понять построение изучаемого материала, выделить основные положения, просле-

дить их логику.

Ведение записей способствует превращению чтения в активный процесс. У студента, си-

стематически ведущего записи, создается свой индивидуальный фонд подсобных материалов для быстрого повторения прочитанного. Особенно важны и полезны записи тогда, когда в них находят отражение мысли, возникшие при самостоятельной работе.

Можно рекомендовать следующие основные формы записи: план, конспект, тезисы, пре-

зентация.

План – это схема прочитанного материала, краткий (или подробный) перечень вопросов,

отражающих структуру и последовательность материала. Подробно составленный план вполне заменяет конспект.

Конспект – это систематизированное, логичное изложение материала источника. Объем

15

конспекта не должен превышать 10 страниц. Шрифт Times New Roman, кегль 14, интервал 1,5.

Список литературы должен состоять из 5-8 источников, по возможности следует использовать по-

следние издания учебных пособий и исследований.

Тезисы – это последовательность ключевых положений из некоторой темы без доказа-

тельств или с неполными доказательствами. По объему тезисы занимают одну страницу формата А4 или одну – две страницы в ученической тетради. В конце тезисов студент должен сделать соб-

ственные выводы.

Презентации по предложенной теме составляются в программе Power Point или Impress.

Количество слайдов должно быть не менее 15 и не превышать 20 слайдов. Кроме текста на слай-

дах можно создавать схемы и таблицы. Шрифт должен быть читаемым, например, шрифт черного цвета на светлом фоне или светлый шрифт на темном фоне. Также шрифт не должен быть слиш-

ком мелким. В слайдах указываются только основные тезисы, понятия и нормы.

. 4.2 Темы для самостоятельного изучения

1.Технологии анализа данных. Data Mining, Visual Mining, Text Mining.

2.Типы многомерных OLAP-систем. Задачи и содержание оперативного (OLAP) анализа.

3.Data Mining: Data Mining: задача кластеризации. Методы кластерного анализа.

4.Data Mining: Искусственные нейронные сети для решения задач прогнозирования.

5.Data Mining: логистическая регрессия.

6.Data Mining: задача кластеризации. Карты Кохонена.

7.Современные методы анализа данных. Обнаружение логических закономерностей в дан-

ных.

8.Оперативная аналитическая обработка данных. OLAP-технологии. Примеры применения.

9.Интеллектуальный анализ данных средствами MS SQL Server.

10.Современные пакеты прикладных программ анализа, включающие методы Data Mining.

11.Интеллектуальные анализ данных и прогнозирование в «1С:Предприятии».

5. Методические указания по выполнению расчетно-графической работы (Общие рекомендации)

. 5.1 Общие требования к оформлению расчетно-графической работы

Расчетно-графическая работа оформляется на листах формата А4 в печатном виде в форма-

16

те Word (шрифт 12-14, поля: слева 2,5 см, остальные – по 2 см). Страницы работы следует прону-

меровать. Работа сдаётся на кафедру «Прикладной информатики и статистики». Работа, признан-

ная не отвечающей предъявляемым требованиям, возвращается студенту для доработки. При этом указываются недостатки работы и даются рекомендации по их устранению.

Содержание отчета:

1.Цель работы и требования задания.

2.Для каждого задания нужно дать краткое описание метода решения на основании мате-

риала лекционного курса.

3.Привести подробные расчеты с комментариями и пояснениями.

4.Сделать выводы по работе.

Оценка «зачтено» выставляется студенту, являющемуся автором расчетно-графической ра-

боты, соответствующей всем предъявляемым требованиям, в том числе формальным.

Оценка «не зачтено» выставляется студенту, являющемуся автором расчетно-графической работы, не соответствующей предъявляемым требованиям. Оценка «не зачтено» выставляется также, если студент неправильно решил более 50% задач, не ориентируется в тексте работы; не может дать ответы на уточняющие вопросы, касающиеся методов искусственного интеллекта, ис-

пользованных при выполнении заданий и т.д.).

. 5.2 Примерные варианты расчетно-графической работы

Вариант 1. (Ассоциативные правила)

Для своих фрагментов данных, приняв пороговое значение поддержки, равное 20%,

1)По алгоритму a priory найдите популярные (частые) наборы. Найти значимые правила.

2)По алгоритму FPG найдите популярные (частые) наборы. Найти значимые правила.

Требования:

1.Число транзакций >=15

2.Число объектов >=10

3.Для каждого алгоритма краткое описание

4.Для построения дерева используйте сервис Draw.io (ссылка: https://draw.io )

5.В выводе сравните популярные частые наборы, найденные по двум алгоритмам.

Вариант 2. (Деревья решений)

1.Выберите предметную область для построения дерева решений (по вариантам).

2.Подготовьте таблицу с данными (не менее 10 строк, не менее трех категорийных факто-

17

ров, 1 числовой фактор, выходное поле – метка класса).

3.Постройте полное дерево решений, используя алгоритм ID3 для данных, представленных

ввашей таблице.

4.Постройте полное дерево решений, используя алгоритм CART для данных, представлен-

ных в вашей таблице.

5. Сформулируйте правила, по которым можно определить каждый класс.

Вариант 3. (Нейронные сети). Выполнить полностью 5 циклов прямого и обратного прохо-

да ИНС, используя алгоритм обратного распространения ошибок для ИНС со своей архитектурой

(архитектура ИНС имеет не менее трех внутренних слоев).

Нужно привести расчеты одного цикла в виде формул, остальные таблицы в Excel.

Постройте график изменения ошибки обучения.

Вариант 4. (Модели машинного обучения)

Для данных, взятых с сайтов (см. ссылку): https://neurohive.io/ru/datasety/7-sajtov-s-obshhedostupnymi-datasetami/

применить любой алгоритм ML, используя возможности АП Deductor или АП Loginom. В отчёте описать какие настройки были использованы и описать полученные результаты.

18

Прокопенко Н.Ю.

МЕТОДЫ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА

Учебно-методическое пособие по подготовке к лекциям, практическим занятиям

(включая рекомендации по организации самостоятельной работы),

по выполнению расчетно-графической работы для обучающихся по дисциплине «Методы искусственного интеллекта»

по направлению подготовки 09.03.04 Программная инженерия,

профиль Разработка программно-информационных систем

Федеральное государственное бюджетное образовательное учреждение высшего образования

«Нижегородский государственный архитектурно-строительный университет»

603950, Нижний Новгород, ул. Ильинская, 65.

http://www. nngasu.ru, srec@nngasu.ru

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]