Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги2 / 196

.pdf
Скачиваний:
0
Добавлен:
24.02.2024
Размер:
3.51 Mб
Скачать

3.2. Пример изменения дискриминантного анализа

ляя на каждом шаге лишь по одному объекту и возвращая его обратно в обучающие выборки.

Процедура исключения наблюдений продолжается до тех пор, пока общий коэффициент корректности в классификационной матрице достигнет 100%, т.е. все наблюдения обучающих выборок будут правильно отнесены к соответствующим группам.

Результаты полученных обучающих выборок представлены в окне

Discriminant Function Analisis Results (Результаты анализа дискриминант-

ных функций). В результате проведенного анализа общий коэффициент корректности обучающих выборок должен быть равен 100%.

На основе полученных обучающих выборок можно проводить повторную классификацию тех объектов, которые не попали в обучающие выборки, и любых других объектов, подлежащих группировке. Для решения данной задачи существуют два варианта:

1)на основе дискриминантных функций;

2)на основе классификационных функций.

Впервом случае необходимо, не закрывая диалогового окна

Discriminant Function Analisis Results, добавить в таблицу исходных скорректированных данных новые случаи.

Для того чтобы понять, к какому классу относится этот объект, необходимо нажать кнопку Posterior probabilities (Апостериорные вероятности). В системе имеется три способа задания априорной вероятности:

Proportional to group sizes (Пропорциональные размерам групп);

Same for all groups (Одинаковые для всех групп);

User defined (Заданные пользователем).

На основании таблицы Posterior probabilities (Апостериорные вероятности) к тем группам (классам), которые будут иметь максимальные вероятности, можно отнести новые случаи.

Во втором варианте необходимо в окне диалогового окна

Discriminant Function Analisis Results нажать кнопку Classification functions (Классификационные функции) для получения окна, в котором представлены классификационные функции для каждого класса (рис. 3.9).

91

Глава 3. Дискриминантный анализ в пакете STATISTICA

Рис. 3.9. Классификационные функции для каждого класса

Class 1 = 0,0019×(вес нетто) – 0,0010 × (вес брутто) + 0,0002× (таможенная стоимость) – 12,6604

Class 2 = 0,00019 × (вес нетто) + 0,00003 × (таможенная стоимость) –

1,12094

Class 3 = 0,0006 × (вес нетто) + 0,0011 × (вес брутто) + 0,0002 × (таможенная стоимость) – 26,9923

С помощью этих функций можно будет в дальнейшем классифицировать новые случаи. Новые случаи будут относиться к тому классу, для которого классифицированное значение будет максимальное. Выбор метода окончательной классификации зависит от количества новых объектов, подлежащих классификации. Если количество новых случав невелико, можно применить метод, основанный на статистических критериях. Если же количество новых случаев велико, то рациональнее по обучающим выборкам получить классификационные функции и затем настроить формулы и провести окончательную классификацию.

Дополнительно можно просмотреть результаты канонического анализа, нажав кнопку Perform canonical analysis (выполнить канонический анализ) (рис. 3.10), если для анализа были выбраны, по крайней мере, три группы и есть хотя бы две переменные в модели.

92

3.2. Пример изменения дискриминантного анализа

Рис. 3.10. Выбор выполнения канонического анализа

Рис. 3.11. Окно канонического анализа

Программа STATISTICA выводит на экран окно Canonical analysis (Канонический анализ) (рис. 3.11). При нажатии на кнопку Scatterplot of canonical scores (Диаграмма рассеяния для значений) будет построен график рассеяния исследуемых наблюдений на пространстве дискриминант-

93

Глава 3. Дискриминантный анализ в пакете STATISTICA

ных функций (рис. 3.12). С его помощью можно определить вклад, который вносит каждая дискриминантная функция в разделение между группами.

 

 

 

Root 1 vs. Root 2

 

 

 

 

4

 

 

 

 

 

 

2

 

 

 

 

 

2

 

 

 

 

 

 

Root

0

 

 

 

 

 

 

 

 

 

 

 

 

-2

 

 

 

 

 

 

-4

 

 

 

 

 

 

 

 

 

 

 

G_1:1

 

-10

-5

0

5

10

G_2:2

 

G_3:3

 

 

 

 

 

 

 

 

 

Root 1

 

 

 

Рис. 3.12. График рассеяния исследуемых наблюдений на пространстве дискриминантных функций

Наглядно видно, что все исследуемые поставки формируют три изолированных облака на пространстве полученных дискриминантных функций, что демонстрирует адекватность построенных моделей и возможность их практического применения.

Контрольные вопросы и задания по главе 3

1.В чем заключается сущность дискриминантного анализа и его отличие от других методов многомерной классификации?

2.Как определяется количество дискриминантных функций?

94

3.2.Пример изменения дискриминантного анализа

3.Сформулируйте правило дискриминации.

4.В чем состоит сложность отбора дискриминантных переменных?

5.Поясните, в каких случаях затруднена правильная классификация новых объектов.

95

ЗАКЛЮЧЕНИЕ

Каждому должностному лицу таможенных органов приходится в той или иной мере заниматься аналитической деятельностью. Данный вид дея-

тельности связан с принятием решения в условиях определенности, риска и неопределенности.

Известная изменчивость, многомерность, разнородность совокупно-

сти показателей внешнеэкономической деятельности, составляющих про-

блемную область таможенного дела, потребность составления прогноза развития ситуации с высокой достоверностью, практически мгновенно,

определяет необходимость применения комплекса статистических методов анализа с применением современных программных средств, иначе называ-

емого как Data Mining технологии.

Программное обеспечение STATISTICA позволяет проводить ана-

лиз, визуализацию и документирование результатов анализ практически любого типа данных показателей, характеризующих таможенные бизнес-

процессы.

Простота и удобство STATISTICA определяет легкость встраивания операций по его использованию в имеющуюся технологическую схему действий должностного лица таможенных органов, работающего в рамках семантического профиля своего структурного подразделения.

Данное учебное пособие следует рассматривать как практическое руководство к решению задач анализа и управления таможенными риска-

ми, а также к выполнению аналитической работы, связанной с оптимиза-

цией организационного, кадрового и технического обеспечений деятельно-

сти Федеральной таможенной службы России.

96

СПИСОК ЛИТЕРАТУРЫ

1.Аббакумов В.Л., Лезина Т.А. Бизнес-анализ информации. Статистические методы. М.: Экономика, 2009. – 376 с.

2.Афонин Д.Н., Афонин П.Н., Книжник С.В. Вычислительные методы анализа таможенных рисков // Ученые записки Санкт-

Петербургского им. В.Б. Бобкова филиала РТА, №1 (30), 2008. СПб.: РИО СПб филиала РТА. 2008. – С. 177–187.

3. Афонин П.Н. Системный анализ, управление и обработка информации в таможенном деле (учебное пособие) СПб.: СПб филиала РТА,

2010. – 204 с.

4. Афонин П.Н., Андреев К.А. Проблемы использования информации в электронной форме при проведении административного расследования в таможенных органах // Сборник материалов молодежной межвузовской научно-практической конференции «Таможенные чтения 2010» «Актуальные проблемы таможенного дела: информационное обеспечение».

СПб филиал РТА. 2010. С. 77–81.

5.Афонин П.Н., Гамидуллаев С.Н. DataMining в управлении таможенными рисками. СПб: Изд-во Политехн. ун-та, 2008. – 243 с.

6.Афонин П.Н., Гамидуллаев С.Н. Системный анализ таможенных рисков. СПб: Изд-во Политехн. ун-та, 2006. – 201 с.

7.Афонин П.Н., Гамидуллаев С.Н. Таможенные риски: интеллектуальный анализ и управление. СПб: Изд-во Политехн. ун-та, 2007. – 266 с.

8.Боровиков В.П. Statistica: искусство анализа данных на компьютере. Для профессионалов. СПб.: Питер, 2003. – 688 с.

9.Боровиков В.П., Ивченко Г.И. Прогнозирование в системе Statistica в среде Windows. Основы теории и интенсивная практика на компьютере. М., 2006. – 368 с.

97

10. Вуколов Э.А. Основы статистического анализа. Практикум по статистическим методам и исследованию операций с использованием па-

кетов Statistica и Excel. М.: Форум, 2010. – 464 с.

11. Глинский В.В., Ионин В.Г. Статистический анализ. Учебное по-

собие. Новосибирск: Инфра-М, 2002. – 240 с.

12.Куликов Е.И. Прикладной статистический анализ. М.: Горячая Линия – Телеком, 2008.- 464 с.

13.Симчера В.М. Методы многомерного анализа статистических данных. М.: Финансы и статистика. – 2008. – 400 с.

14.Тихомиров Н.П., Тихомирова Т.М., Ушмаев О.С. Методы эконо-

метрики и многомерного статистического анализа. М.: Экономика, 2011. – 640 с.

15. Халафян А.А. Statistica 6. Статистический анализ данных. СПб.:

Бином-Пресс, 2010. – 528 с.

98

ДЛЯ ЗАМЕТОК

99

Учебное издание

Петр Николаевич Афонин, Дмитрий Николаевич Афонин

СТАТИСТИЧЕСКИЙ АНАЛИЗ С ПРИМЕНЕНИЕМ СОВРЕМЕННЫХ ПРОГРАММНЫХ СРЕДСТВ

Главный редактор: Т.С. Кулакова Техническая подготовка: В.Ю. Антипова Дизайн обложки: В.С. Кулаков

Подписано в печать 26.09.2017. Формат 60 × 88 1/16. Печать цифровая Усл. печ. 6,11 л. Тираж 100 экз. Заказ №

ООО «Издательский центр “Интермедия”». Адрес: 198334, Санкт-Петербург, ул. Партизана Германа, 41-218. Отпечатано с готового оригинал-макета в ООО «Арт-экспресс».

Адрес: 199155, СПб., В.О., ул. Уральская, д. 17.

Соседние файлы в папке книги2