Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лабораторная работа SPSS 3.doc
Скачиваний:
87
Добавлен:
20.03.2015
Размер:
3.53 Mб
Скачать

Критерий хи-квадрат по формуле Пирсона

В формуле Пирсона вычисляется сумма квадратов стандартизованных (нормированных) остатков по всем полям таблицы сопряженности. Поэтому поля с более высоким стандартизованным остатком вносят более весомый вклад в численное значение критерияи, следовательно, в значимый результат.

Правило: Считается, что существует значимое различие между наблюдаемой и ожидаемой частотой, если нормированный остаток больше или равен 2. Другие предельные значения принимаются в соответствии со следующей таблицей.

Таблица 1

Предельные значения

Нормированный остаток

Уровень значимости

>=2,0

>=2,6

>=3,3

p<0,05 (*)

p<0,01 (**)

p<0,001 (***)

Однако эти правила применимы только в случае, если ожидаемая частота не меньше 5.

Корректность проведения теста хи-квадрат определятся двумя условиями:

  1. во-первых, ожидаемые частоты <5 должны встречаться не более чем в 20 % полей таблицы;

  2. во-вторых, суммы по строкам и столбцам всегда должны быть больше нуля.

В рассматриваемом нами примере формула Пирсона не дает даже минимально значимую величину критерия хи-квадрат (p>0,05). Кроме того, как указывает примечание после таблицы теста ,92,3 % полей имеют ожидаемую частоту менее 5. Так как допустимый предел в 20 % намного превышен, то расхождение между наблюдаемыми и ожидаемыми частотами считаем значительным.

Критерий хи-квадрат с поправкой на правдоподобие

Альтернативой формуле Пирсона для вычисления является поправка на правдоподобие:

При большом объеме выборки формула Пирсона и подправленная формула дают очень близкие результаты. В нашем примере критерий хи-квадрат с поправкой на правдоподобие составляет 36,237.

4.2. Коэффициенты корреляции

Тест позволяет лишь выяснить сам факт существования статистической зависимости между двумя признаками. Далее будем определять силу этой зависимости, её вид и направленность.Критерии количественной оценки зависимости между переменными называются коэффициентами корреляции или мерами связанности.

В качестве коэффициента корреляции между переменными, принадлежащими порядковой шкале, применяется коэффициент Спирмена, а для переменных с интервальной шкалой – коэффициент корреляции Пирсона, называемый также линейной корреляцией. При этом следует учесть, что каждую дихотомическую переменную, т.е. переменную, принадлежащую к номинальной шкале и имеющую две категории, можно рассматривать как порядковую.

Проверим, существует ли корреляция между переменными «ширина» и «вес» из файла данных «изучение крабов».

Для определения коэффициентов корреляции в диалоговом окне Таблицы сопряженности сбросьте все возможные настройки и перенесите соответствующие переменные в список строк и список столбцов. Щелкните на кнопкеСтатистики. Установите флажокКорреляции. ЩелкнитеПродолжить. В диалогеТаблицы сопряженностиоткажитесь от вывода таблиц. НажмитеOK.

Будут вычислены коэффициенты корреляции Спирмена и Пирсона, а также проведена проверка их значимости.

В данном случае обе переменные «ширина» и «вес» принадлежат к интервальной шкале. Проделав вышеуказанные действия, получим следующую таблицу (рис.12).

Рис.12. Симметричные меры переменных «ширина*вес»

Для интервальных переменных следует рассматривать коэффициент Пирсона (для порядковых - Спирмена). Он является максимально значимым (p<0,001) и составляет 0,838. Значит, между шириной и весом крабов изучаемой совокупности существует сильная корреляция (взаимосвязь). Переменные коррелируют положительно. Следовательно, большие по весу особи имеют больший размер тела, и наоборот.