- •Введение
- •Основные задачи математической статистики
- •2. Генеральная совокупность, выборка
- •3. Статистический ряд. Гистограмма
- •Коэффициенты соотношений заемных и собственных средств предприятий
- •Сгруппированный ряд наблюдений
- •Числовые характеристики статистического распределения. Обработка опытов
- •5. Доверительный интервал. Доверительная вероятность
- •Методы расчета сводных характеристик выборки
- •7. Проверка статистических гипотез
- •8. Сравнение двух дисперсий нормальных генеральных совокупностей
- •9. Сравнение исправленной выборочной дисперсии с гипотетической генеральной дисперсией нормальной совокупности
- •10. Выравнивание статистических рядов
- •11. Критерии согласия
- •12. Методика вычисления теоретических частот нормального распределения
- •13. Система двух случайных величин
- •13.1. Понятие о системе нескольких случайных величин
- •13.2. Закон распределения вероятностей дискретной двумерной случайной величины
- •13.3. Вероятность попадания случайной точки в полуполосу
- •13.4. Вероятность попадания случайной точки в прямоугольник
- •13.5. Плотность совместного распределения вероятностей непрерывной двумерной случайной величины (двумерная плотность вероятности)
- •13.6. Условные законы распределения составляющих системы дискретных случайных величин
- •13.7. Условное математическое ожидание
- •13.8. Числовые характеристики системы двух случайных величин. Корреляционный момент. Коэффициент корреляции
- •13.9. Линейная регрессия. Прямые линии среднеквадратической регрессии
- •14. Элементы теории корреляции
- •14.1. Отыскание параметров выборочного уравнения прямой линии среднеквадратической регрессии по несгруппированным данным
- •Вопросы для самопроверки
- •Задачи для самостоятельного решения
- •Критические точки распределения
- •Библиографический список
- •Подписано к изданию 20.11.2007 .
- •394026 Воронеж, Московский просп., 14
11. Критерии согласия
Пусть статистическое распределение выровнено с помощью некоторой теоретической кривой f(x) (рис.). Между теоретическим и статистическим распределениями неизбежны некоторые расхождения, как бы хорошо ни была подобрана кривая. Спрашивается: объясняются ли эти расхождения только лишь случайными обстоятельствами, связанными с ограниченным числом наблюдений, или они существенны и связаны с тем, что данная кривая плохо выравнивает данное статистическое распределение. Таким образом, возникает вопрос, связанный с согласованием теоретического и статистического распределений, а именно вопрос проверки гипотез.
Для ответа на этот вопрос служат так называемые «критерии согласия».
Критерием согласия называют критерий проверки гипотезы о предполагаемом законе неизвестного распределения.
Имеется несколько критериев согласия: («хи-квадрат») К. Пирсона, Колмогорова, Смирнова и др.
Рассмотрим один из наиболее часто применяемых критериев согласия – так называемый «критерий » Пирсона. Критерий не доказывает справедливость гипотезы - генеральная совокупность распределена по закону А, а лишь устанавливает на принятом уровне значимости ее согласие или несогласие с данными наблюдений.
Пусть произведено n независимых опытов, в каждом из которых величина Х приняла определенное значение. Результаты опытов сведены в k разрядов в виде статистического ряда:
Таблица 10
Ii |
x1;x2 |
x2;x3 |
. . . |
xi;xi+1 |
. . . |
xk;xk+1 |
pi* |
p1* |
p2* |
. . . |
pi* |
. . . |
pk* |
Требуется проверить, согласуются ли экспериментальные данные с гипотезой о том, что случайная величина Х имеет данный закон распределения (заданный функцией распределения F(x) или плотностью f(x)), который назовем «теоретическим».
Зная теоретический закон распределения, можно найти теоретические вероятности попадания случайной величины в каждый из разрядов: p1, p2, ..., pk.
Проверяя согласованность теоретического и статистического распределений, исходят из расхождений U между теоретическими вероятностями pi и наблюдаемыми частотами (за счет чисто случайных причин). В качестве меры расхождения между теоретическим и статистическим распределениями выбирается сумма квадратов отклонений (pi*- pi), взятая с некоторыми «весами» сi:
.
Коэффициенты сi вводят потому, что в общем случае отклонения, относящиеся к различным разрядам, нельзя считать равноправными по значимости. Одно и то же по абсолютной величине отклонение (pi*- pi) может быть мало значительным, если сама вероятность pi велика, и очень заметным, если она мала. Поэтому в качестве сi Пирсон предложил отношение
,
тогда мера расхождения обозначается :
.
Для удобства вычислений применяется формула
или
( 2 )
где - эмпирические частоты, - теоретические частоты.
Распределение зависит от параметра k, называемого числом «степеней свободы» распределения. Число степеней свободы k равно числу разрядов r (число групп выборки или число вариант) минус число s независимых условий («связей»), наложенных на частоты pi* . Например, сумма всех частот равна единице, это требование (условие) накладывается во всех случаях; совпадение теоретических и статистических средних, дисперсий (накладываемые условия для нормального распределения) и так далее. Итак, если предполагаемое распределение нормальное, то число степеней свободы .
Для распределения составлены специальные таблицы. Пользуясь ими можно для каждого значения и числа степеней свободы k , найти вероятность того, что величина, распределенная по закону , превзойдет это значение.
Распределение дает возможность оценить степень согласованности теоретического и статистического распределений. Пусть величина Х действительно распределена по закону F(x). Тогда вероятность р, определенная по таблице 4 приложения, есть вероятность того, что за счет чисто случайных причин мера расхождения теоретического и статистического распределений будет не меньше, чем фактически наблюдаемое в данной серии опытов значение . Если эта вероятность мала (настолько, что событие с такой вероятностью можно считать практически невозможным), то результат опыта следует считать противоречащим гипотезе Н о том, что закон распределения величины Х есть F(x). Эту гипотезу следует отбросить как неправдоподобную. Однако, если вероятность р сравнительно велика, можно признать расхождения между теоретическим и практическим распределениями несущественными и отнести их за счет случайных причин. Гипотезу Н о том, что величина Х распределена по закону F(x), можно считать правдоподобной или, по крайней мере, не противоречащей опытным данным.
Итак, схема применения критерия к оценке согласованности теоретического и статистического распределений:
1. Определяется мера расхождения по формуле (2).
2. Определяется число степеней свободы k, как число разрядов r минус число наложенных связей s:
k = r - s.
3. По k и с помощью таблицы определяется вероятность того, что величина, имеющая распределение превзойдет данное значение .
Если эта вероятность весьма мала, то гипотеза отбрасывается как неправдоподобная. Если же эта вероятность относительно велика, гипотезу можно признать не противоречащей опытным данным. На практике, если р оказывается меньшим, чем 0,1, рекомендуется проверить эксперимент, если возможно – повторить его и в случае, если заметные расхождения появятся снова, пытаться искать более подходящий для описания статистических данных закон распределения.
Подчеркнем, что с помощью любого критерия согласия можно только в некоторых случаях опровергнуть выбранную гипотезу Н и отбросить ее как явно несогласную с опытными данными. Если же вероятность р велика, то этот факт сам по себе не считается доказательством справедливости гипотезы Н, а указывает только на то, что гипотеза не противоречит опытным данным.
Для проверки нулевой гипотезы: генеральная совокупность распределена нормально, используют следующее правило. Обозначим значение критерия, вычисленное по данным наблюдений, через .
Правило. Для того чтобы при заданном уровне значимости проверить нулевую гипотезу: генеральная совокупность распределена нормально, надо сначала вычислить теоретические частоты, а затем наблюдаемое значение критерия
(3)
и по таблице критических точек распределения , по заданному уровню значимости и числу степеней свободы найти критическую точку , .
Если < - нет оснований отвергнуть нулевую гипотезу.
Если > - нулевую гипотезу отвергают.
Для контроля вычислений формулу (3) преобразуют к виду
. (4)
Пример. При уровне значимости 0,05 проверить гипотезу о нормальном распределении генеральной совокупности, если известны эмпирические и теоретические частоты:
Эмп. частоты….. .6 13 38 74 106 85 30 14
Теорет. частоты…3 14 42 82 99 76 37 13
Решение. Вычислим , для чего составим расчетную таблицу 11.
Таблица 11
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
i |
|
|
- |
( - ) |
( - ) / |
|
/ |
1 2 3 4 5 6 7 8 |
6 13 38 74 106 85 30 14 |
3 14 42 82 99 76 37 13 |
3 -1 -4 -8 7 9 -7 1 |
9 1 16 64 49 81 49 1 |
3 0,07 0,38 0,78 0,49 1,07 1,32 0,08 |
36 169 1444 5476 11236 7225 900 196 |
12 12,07 34,38 66,78 113,49 95,07 24,32 15,08 |
|
366 |
366 |
|
|
=7,19 |
|
373,19 |
Контроль: =7,19 (по формуле (4)). Вычисления произведены правильно.
Найдем число степеней свободы, учитывая, что число групп выборки (число различных вариант) r = 8, k = 8 – 3 = 5.
По таблице критических точек распределения , по уровню значимости и числу степеней свободы k = 5 находим .
Так как < - нет оснований отвергнуть нулевую гипотезу. Другими словами расхождение эмпирических и теоретических частот незначимое. Следовательно, данные наблюдений согласуются с гипотезой о нормальном распределении генеральной совокупности.