Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Практикум по медицинской статистике_2012.docx
Скачиваний:
84
Добавлен:
10.11.2019
Размер:
2.38 Mб
Скачать

Корреляционный анализ

Вычислим корреляции между переменными Var4 – Var7.

43

Корреляции Пирсона

Запустим модуль Основные статистики и таблицы. В появившемся окне выберем пункт Парные и частные корреляции.

Нажмём на кнопку Квадратная матрица и укажем переменные.

После нажатия на кнопку OK в диалоге Парные и Частные корреляции в рабочую книгу добавится таблица с коэффициентами корреляции между указанными переменными. Итак, почти все переменные попарно зависимы; исключение составляет пара Эритроциты – Тромбоциты.

44

Корреляции Спирмена и Кендалла

Запустим модуль Непараметрическая статистика. Выберем пункт Корреляции Спирмена, тау Кендалла, гамма.

В появившемся диалоге Ранговые корреляции перейдём на вкладку Дополнительно.

  • Зададим переменные.

  • Нажмём на кнопку Спирмена R в диалоге Ранговая корреляция. Теперь вернёмся в окно Ранговая корреляция и нажмём на кнопку Тау Кендалла.

45

Обратите внимание: коэффициент корреляции Спирмена между переменными Эритроциты и Тромбоциты оказался статистически значимым, в то время как коэффициенты корреляции Кендалла – нет. Это объясняется тем, что коэффициент корреляции Спирмена сильнее реагирует на несогласие ранжировок.

В заключении визуально проанализируем зависимость между переменными.

С этой целью построим Матричный график.

Нажмём на кнопку Матричный график в диалоге Ранговые корреляции.

! Другой способ построения подобного графика можно выбрать из меню пункт Графика/Матричные графики.

Исследование эффективности лечения: введение новой переменной

Введем новую переменную, характеризующую эффективность лечения.

В качестве меры эффективности лечения выберем величину

,

где - состояние пациента до лечения (девятая переменная в таблице), - состояние пациента после лечения (десятая переменная в таблице).

46

Эта величина обладает следующими свойствами:

1) Чем ближе значение к 1, тем эффективнее лечение. В крайнем случае, когда пациент поступил в предсмертном состоянии (10), а после лечения оказался абсолютно здоров (100), значение величины равно 0.9.

2) Чем ближе значение к -1, тем менее эффективно лечение. В крайнем случае, когда пациент поступил абсолютно здоровым (100), а послелечения оказался в предсмертном состоянии (10), то значение величины равно -0.9.

3) Значение = 0 означает, что состояние пациента не изменилось.

Добавим в таблицу новую переменную, назовём её Эффективностью, укажем формат отображения, зададим формулу для её вычисления.

В итоге в таблице появится новый столбец.

Цель дальнейшего исследования

Целью исследования, которого мы сейчас проведём, является получение ответов на следующие вопросы:

1) Какой метод лечения более эффективен?

2) Есть ли существенное различие состояний пациентов до и после лечения?

47

Проверка гипотезы о нормальности для переменной Эффективность

Для ответа на поставленные вопросы можно использовать T-критерий переменной Эффективность. Этот критерий требует нормальность распределения переменной, поэтому перед использованием проверим гипотезу о нормальности.

Сначала проверим визуальными методами.

Построим гистограмму по переменной Эффективность. Для этого выберем из меню пункт Графика / Гистограммы.

На вкладке Дополнительно укажем: Распределение = Нормальное, количество категорий – 7 (приблизительное значение двоичного логарифма от 150, то есть от количества наблюдений), выберем переменную – Эффективность.

48

Гипотеза о нормальности кажется очень неправдоподобной (особенно «плохо» выглядят крайние столбцы).

Тот же вывод следует сделать по нормальному вероятностному графику.

Если наблюдаемые значения (откладываемые по оси X) были бы распределены нормально, то все значения на графике должны были попасть на прямую линию. Однако этого не наблюдается.

49

Теперь вычислим некоторые описательным статистики для переменной Эффективность.

На вкладке Дополнительно диалога Описательные статистики поставим галочки в полях Асимметрия, стандартная ошибка асимметрии, Эксцесс, Стандартная ошибка эксцесса. Нажмём OK.

Судя по значению Асимметрии, распределение переменной Эффективность можно считать нормальным (0 «почти что» содержится в интервале Ассиметрия ± Стандартная ошибка Асимметрии).

Но судя по значению Эксцесса, гипотезу о нормальности следует отклонить. Как правило, если найдена хотя бы одна существенная «нестыковка», гипотезу смело отклоняют, в то время как соответствие даже всем известным критериям ещё не влечёт справедливость гипотезы.

В заключении обратимся к модулю Подгонка распределения.

Выберем пункт Нормальное в левом столбце, нажмём OK. В появившемся окне укажем в качестве переменную (Эффективность).

50

Нажмём OK.

Обратите внимание: значение p = 0,00031, то есть значительно меньше 5%. Это значит, что гипотезу о нормальности следует отклонить.

Итак, окончательный вывод: Распределение переменной Эффективность существенно отличается от нормального распределения.