- •П.Я. Бушин
- •Статистические методы принятия решений
- •Учебное пособие
- •Хабаровск 2002
- •П.Я. Бушин
- •Статистические методы принятия решений
- •Учебное пособие
- •Введение
- •Рис. 1. Распределение интервалов по числу автомобилей
- •Рис. 6. Описательные статистики и гистограмма для примера
- •Рис. 7 Диаграмма “ящик-с-усами”
- •Выполнить следующие задания
- •ГЛАВА 2. Оценка параметров генеральной совокупности
- •Оценка стандартной ошибки рассчитывается по формуле
- •Контрольные вопросы
- •Рис. 16. Область принятия гипотезы при использовании F – критерия
- •Рис. 17. Отчет о решении задачи сравнения двух дисперсий в Statgraphics
- •Контрольные вопросы и упражнения
- •Рис. 18. Сравнение частот в ППП Statistica
- •Таблица наблюдаемых частот
- •Таблица ожидаемых частот
- •Контрольные вопросы и упражнения
- •Контрольные вопросы и упражнения
- •Таблица дисперсионного анализа регрессии
- •Рис. 34. Таблица исходных данных
- •Рис. 35. Выборочные статистики для рассматриваемого примера
- •Рис. 36. Матрица парных коэффициентов корреляции
- •Рис. 37. Матрица частных коэффициентов корреляции
- •Рис. 38. Оценки точности уравнения регрессии
- •Рис. 41. Отчет о последовательном исключении переменных
- •Рис. 42. Показатели точности уравнений регрессии
- •Контрольные вопросы и упражнения
- •Холта линейное экспоненциальное сглаживание предполагает, что среднее прогнозируемого показателя yt изменяется линейно по времени:
- •Таблица 7.3.2.1
- •Поквартальные данные продажи учебников
- •Рис. 44. График исходных данных и тренда
- •Рис. 45. График сезонной компоненты
- •Таблица 7.2
- •Расчет прогноза с учетом сезонной компоненты
- •Контрольные вопросы и упражнения
- •БИБЛИОГРАФИЧЕСКИЙ СПИСОК
- •ОГЛАВЛЕНИЕ
Результаты опроса отражены в следующей таблице сопряженности (частоты исходной таблицы, как и раньше, будем обозначать через f0):
|
|
|
|
|
|
|
|
Таблица 4.2.1 |
|
|
Таблица наблюдаемых частот |
|
|
|
|||||
Предпочитают продукт |
|
Район города |
|
Итого |
|
||||
|
|
A |
|
B |
|
C |
( |
r ) |
|
|
|
|
|
|
|
|
|
|
|
Только этой фирмы |
|
107 |
|
66 |
|
36 |
209 |
|
|
Все равно |
|
88 |
|
108 |
|
81 |
277 |
|
|
Других фирм |
|
38 |
|
65 |
|
11 |
114 |
|
|
Итого ( С ) |
|
233 |
|
239 |
|
128 |
600 ( |
f ) |
|
|
|
|
|
|
|
|
|
|
|
Для проверки гипотезы о независимости предпочтений от места жительства составим таблицу ожидаемых частот в предположении верности нулевой гипотезы о том, что в зависимости от места жительства предпочтений в товарах нет. Как известно,
такие частоты определяются из соотношения: |
r |
C / |
f , где |
r - сумма |
|
частот по строке, C - по столбцу, |
f - общая сумма частот. |
|
|
Например, если бы предпочтения отсутствовали, то из 233 опрошенных жителей района А предпочли бы товары только этой фирмы (233 . 209) / 600 = 81,2 (если округлять, то 81) житель, а тех, которым все равно, было бы (233 . 277) / 600 = 107,5 и т.д. Итак, таблица ожидаемых частот (fe) следующая (см. табл. 4.2.2):
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Таблица 4.2.2. |
||
|
|
|
|
|
|
|
|
|
|
|
Таблица ожидаемых частот |
|
|
|
|
|
|||||||||||
|
|
|
Предпочитают продукт |
|
|
|
|
|
Район города |
|
Итого |
|
|||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
A |
|
|
|
B |
|
|
C |
|
( |
r ) |
|
||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||
|
|
|
Только этой фирмы |
|
|
81,2 |
|
|
83,2 |
|
44,6 |
|
209 |
|
|
||||||||||||
|
|
|
|
Все равно |
|
|
|
|
|
|
107,5 |
|
|
110,4 |
|
59,1 |
|
277 |
|
|
|||||||
|
|
|
Других фирм |
|
|
|
|
|
|
44,3 |
|
|
45,4 |
|
24,3 |
|
114 |
|
|
||||||||
|
|
|
Итого ( |
С ) |
|
|
|
|
|
|
233 |
|
|
|
239 |
|
128 |
|
600 ( |
f ) |
|
||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
Тогда |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
χ |
2 |
|
|
|
( f0 |
fe )2 |
|
|
|
(107 -81,2)2 |
|
|
(66 |
83,2)2 |
|
(36 44,6)2 |
|
|
|||||||||
|
|
|
|
fe |
|
|
|
|
|
|
81,2 |
|
83,2 |
|
|
44,6 |
|
|
|
||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||
|
(88 |
107,5)2 |
..... |
(11 |
24,3)2 |
|
41,75 |
|
|
|
|
|
|
|
|
||||||||||||
|
|
|
107,5 |
|
|
|
24,3 |
|
|
|
|
|
|
|
|
|
|||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||
|
|
|
Число степеней свободы для таблиц сопряженности определяется из соотношения: |
||||||||||||||||||||||||
|
= |
(r – |
1)(C – |
1) , |
|
|
где |
|
r – число строк таблицы, |
|
С – столбцов. У нас |
||||||||||||||||
|
= ( 3 - 1) ( 3 - 1) = 4 . Для |
= 4 и |
= 0,05 из таблицы значений критерия находим, |
||||||||||||||||||||||||
что |
2 |
= 9,49. Т.к. |
2 |
= 41,75 > |
2 |
|
= 9,49, то гипотеза об отсутствии зависимости |
||||||||||||||||||||
0,05 |
|
0,05 |
отклоняется, т. е. связь между предпочтениями в товарах и местом жительства значима.
Другой вопрос: какова эта связь? – тесная или слабая? В данном случае на основе критерия 2 этот вопрос не решается.
Рассмотрим реализацию этого алгоритма на основе ППП Statgraphics (рис.20).
Рис. 20. Отчет о проверке гипотезы о независимости в ППП Statgraphics
Р-величина, равная нулю, подтверждает сделанный ранее вывод.
В заключении этой темы отметим, что, как следует из формулы для 2, каждый интервал или клетка таблицы вносят в 2 вклад, равный (fo – fe)/fe. При малых fe роль такого вклада неоправданно увеличивается. Чтобы ее снизить, рекомендуется провести группировку так, чтобы все fe были достаточно большими. На практике это сводится к требованию, чтобы в каждом интервале или клетке было не менее пяти наблюдений. Если это не так, то рекомендуется объединять соседние интервалы.
Эта рекомендация заложена и в компьютерные программы вычисления критерия 2: в одних ППП (например, в Statgraphics), в автоматическом режиме происходит объединение интервалов с малыми частотами, в других - указывается наименьшая встречающаяся частота, с тем, чтобы можно было принять решение, нужно ли
объединять интервалы.
Одним из недостатков критерия 2 является то, что его значение зависит от объема выборки и не нормировано. Разработано несколько модификаций критерия 2, направленных на преодоление этих недостатков.
Например, для минимизации влияния размера выборки и ограничения диапазона изменения критерия разработаны: коэффициент сопряженности Пирсона, определяемый из соотношения:
CC = |
22 |
(n |
22 ) |
|
и критерий V –Крамера: |
|
|
|
|
|
|
|
|
|
|
2 |
|
|
|
V = |
2 |
N (k |
1) , |
где N = rc, a k = min(r,c).
Оба эти критерия равны нулю при полной независимости качественных переменных, но чем теснее связь между переменными, тем больше значения этих