Добавил:
kiopkiopkiop18@yandex.ru Вовсе не секретарь, но почту проверяю Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

5 курс / ОЗИЗО Общественное здоровье и здравоохранение / Статистический_анализ_данных_в_медицинских_исследованиях_в_2_ч_Красько

.pdf
Скачиваний:
3
Добавлен:
24.03.2024
Размер:
5.96 Mб
Скачать

0,140

0,120

0,1000,0800,060 0,040

0,020

0,000 0 10 20 30 40 50 60 70 80

Возраст

Рис. 17–4. График зависимости параметра от возраста после объединения двух категорий

Каждый раз, анализируя конкретную переменную, надо учитывать ее медикобиологический смысл, ее релевантность конкретному исследованию, целесообразность ее трансформации или разбиения.

Есть и более сложные алгоритмы анализа линейности связи бинарного исхода и количественной переменной, но они выходят за рамки данного пособия.

17.10. Вычислительные проблемы

Источник вычислительных проблем в логистической регрессии – наличие пустых (нулевых) ячеек в таблице, связанных предиктором, коллинеарность переменных, или так называемое полное разделение (complete or quasi-complete separation). Внешнее проявление этого – огромная оценка параметра и огромная стандартная ошибка. Причем предиктор остается значимым в исследовании, т.е. вносит вклад в снижение изменчивости исхода.

Есть несколько советов, которые дают известные статистические центры (например, SAS).

В случае полного разделения, убедитесь, что мы не используем бинарное представление переменной исхода, которая изначально является количественной. В этом случае лучше попытаться использовать другие виды регрессии.

Если это квази-полное разделение, самая простая стратегия “ничего не делать”. Максимальное правдоподобие для других предикторов остается в силе. Недостатком является то, что мы не получаем никакой разумной оценки для переменной, которая фактически эффективно предсказывает исход. Эта стратегия не работает в ситуации полного разделения.

Еще одна простая стратегия – исключить проблемный предиктор из модели. Однако это приводит к смещенным оценкам для других предикторов в модели. Таким образом, это не рекомендуемая стратегия.

Возможно, мы могли бы объединить некоторые категории проблемного предиктора, если он мультиноминальная переменная и если есть основания для такого объединения.

Точные методы расчета являются хорошей стратегией, когда набор данных невелик и модель не очень большая. Расчет таких моделей осуществляется специальными пакетами программ, и может занимать от нескольких минут, до нескольких часов и даже дней, в зависимости от размеров выборки и количества предикторов.

191

Логистичекая регрессия с использованием штрафной функции, чаще всего используется смещение Ферта (Firth's bias reduction), – еще одна хорошая стратегия. Использование смещения Ферта считается одним из идеальных решений при полном разделении в логистической регрессии.

Последний подход, если в модели используются только биноминальные предикторы и только один из них представляет интерес, а остальные выступают в роли конфаундеров – считать отношение шансов по Кокрейну-Мантелю-Хензелю, переводя все остальные переменные в страты.

17.11. Замечания по использованию логистической регрессии

Логистическая регрессия может использоваться для классификации на два класса (состояния), соответственно, может определяться чувствительность и специфичность. В этом случае анализируется таблица 2 2 наблюдаемых и ожидаемых (предсказанных по модели) исходов.

 

На основе результатов моделирования (оценки параметров уравнения

регрессии)

 

рассчитывается

значение правой

части

модельного

уравнения

 

π x

 

 

βˆ

x

βˆ

x

,

откуда

πˆ x

exp βˆ

βˆ

x

 

βˆ x

 

 

,

log

 

βˆ

0

1

 

1

2

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1 π x

 

 

 

 

 

 

 

 

 

1 exp βˆ0 βˆ1x1 βˆ2x2

 

 

 

 

0

1

1

2

2

 

 

 

 

 

 

 

 

 

 

 

0 πˆ x 1. Наблюдения должны быть отнесены к одной из двух групп 0 или 1. Ожидаемое (предсказанное) значение πˆ x для конкретного наблюдения будет либо πˆ x 0,5 (ожидаемая группа классификации соответствует коду 0) либо πˆ x 0,5

(ожидаемая группа классификации соответствует коду 1). Таким образом, можно сравнить имеющуюся классификацию групп и ожидаемую, т.е. полученную на основе модельного уравнения.

Таблица 2 2 может быть составлена на основе наблюдаемых и ожидаемых классификаций (Tабл. 17–13).

 

Таблица 17–13. Таблица 2 2 для классификационной модели

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Ожидаемая группа (классификация по

 

 

 

 

 

 

 

 

 

 

 

 

модели)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

0

 

 

 

 

 

 

 

 

 

 

 

Наблюдаемая

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

A

 

B

 

 

 

 

 

A+B

 

 

 

группа

0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

C

 

D

 

 

 

 

 

C+D

 

 

 

(классификация

 

 

 

 

 

 

 

 

 

 

в выборке)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

A+C

B+D

 

 

 

 

 

 

 

N

 

 

По такой таблице можно рассчитать чувствительность и специфичность

построенной модели (см. раздел 11).

 

 

 

 

 

 

 

 

 

 

 

В случае одной количественной переменной логистическая регрессия может

работать как ROC-анализ, и определять оптимальную точку разбиения xˆ

значений

 

 

 

 

 

 

 

exp βˆ

βˆ

1

x

 

 

 

 

 

 

 

 

Из уравнения 0,5

0

 

 

 

 

 

 

 

 

количественной переменной.

1 exp βˆ

 

βˆ

x

 

, можно найти

 

 

 

 

 

 

 

 

0

 

 

1

 

1

 

 

xˆ

βˆ0

как точку разбиения количественной переменной в ROC-анализе.

 

 

 

 

ˆ

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

β1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Если предикторы представлены только бинарными переменными, то в правой части уравнения получится конечный набор состояний вектора предикторов (комбинаций 0 и 1). Такой представление ведет ко многовходовым таблицам 2 2,

192

которые анализируются с помощью анализа категорий не менее эффективно, чем регрессионный подход с использованием логистической регрессии.

Различные статистические пакеты определяют различные характеристики модели, поэтому лучше консультироваться со специалистом по использованию конкретного пакета для построения и использования логистической регрессии. Также внимательно читайте разделы помощи, там описаны те характеристики данных и модели, которые может рассчитывать пакет.

Не увлекайтесь логистической регрессией, она достаточно сложна в обращении, иногда требует дополнительной коррекции (penalty function), не всегда обладает хорошей чувствительностью и специфичностью, хотя модель может быть значима и т.п.

Есть еще одно правило, касающееся количества предикторов и количества оцениваемых параметров. Каждый оцениваемый параметр “весит” 8–10 наблюдений с интересующим исследователя исходом. Это означает, что если у вас есть 100 наблюдений, но исследуемый исход наблюдался только в 10 случаях, вы можете использовать только одну переменную. Если это количественный предиктор, то вы можете его использовать; но использовать мультиноминальную переменную с 5 категориями в качестве предиктора – неправильно. В терминах двухвходовых таблиц 2 c вы получите много пустых ячеек (empty cells). В случае 60 наблюдений, из которых 30 наблюдений имеют исследуемый исход, вы можете использовать до 3–4 количественных предикторов, или 3–4 биноминальных, или один мультиноминальный с 3–4 категориями. Если же количество интересующих исходов составляют большую половину от всех наблюдений, то ориентироваться надо на количество N n1 – объем выборки за минусом интересующих исходов. Иными

словами, выбирается наименьшая пропорция из двух (исход в логистической регрессии либо 0, либо 1, соответственно, можно рассчитать пропорцию количества 0 и количества 1 в выборке), и количество наблюдений в числителе этой пропорции определяет количество возможных предикторов модели.

Основные аспекты

Прежде чем строить модель логистической регрессии, убедитесь, что она действительно необходима.

Анализ таблиц сопряженности для исхода и номинальных предикторов полностью аналогичен логистической регрессии.

Логистическая регрессия с одним количественным предиктором – это аналог ROC-анализа.

Логистическая регрессия с одним бинарным предиктором – это аналог анализа таблиц 2 2 .

Логистическая регрессия с одним мультиноминальным предиктором – это аналог анализа таблиц 2 c .

Логистическая регрессия специфично исследует исход при различных типах дизайна исследования.

Количество оцениваемых параметров сопоставляется с количеством наблюдений не всей выборки, а количеством наблюдений в наименьшей из пропорций исходов.

193

18.Анализ выживаемости

Анализ выживаемости – это отдельный раздел статистических исследований, главной особенностью которых является исход, наблюдаемый во времени (time-to- event).

Данные выживаемости – это расширение данных о событиях, которое учитывают время до наступления события или время до окончания наблюдения, даже если событие не произошло к окончанию наблюдения. В рамках конкретного исследования событие может наступить через период времени t , а может и не наступить до конца наблюдения.

Поэтому особенность анализа выживаемости – наличие так называемых “цензурированных данных”.

Поскольку в данных о времени до наступления события присутствуют цензурированные данные, мы не можем анализировать количественный исход, как это делалось в линейной регрессии. Данные также содержат сведения о событиях, но мы не можем анализировать их с помощью логистической регрессии, поскольку время наблюдения для каждого случая различно. В качестве исхода в анализе выживаемости рассматривается время до наступления события или время наблюдения и исход, который наступил или не наступил к указанному времени.

18.1. Понятие цензурированных данных, событий и времен наблюдения

Основное отличие данных выживаемости – это наличие времени наблюдения связанное с наступлением некоторого события (событие не наступило к указанному времени/ follow-up time или событие наступило в определенное время/ time-to- event).

Хотя в исследовании время начала наблюдения фактически может быть разным (рис. 18–1), формально все данные корректируются к одному моменту начала наблюдения, как показано на рис. 18–2. Обратите внимание, что у пациента 4 на рис. 18–1 имелось событие, но оно выходило за рамки продолжительности исследования, и он “потерян из под наблюдения” (lost follow-up) на рис. 18–2.

Согласно базовым понятиям анализа выживаемости теоретически интересующее исследователя событие рано или поздно наступит у каждого наблюдаемого.

Данные, в которых событие произошло за время наблюдения, называются полными наблюдениями (complete observations); данные в которых событие не наступило, называются цензурированными наблюдениями (censored observations).

Что считается событием (event, failure)? Изменение состояния, связанное с изучаемым заболеванием: смерть от изучаемого заболевания, инвалидизация вследствие изучаемого заболевания, ремиссия изучаемого заболевания, рецидив изучаемого заболевания, наступление сопутствующего заболевания и др.

194

Н6

Н5

 

 

Н4

С

 

 

 

 

Н3

 

С

 

 

 

Н2

 

 

С

 

 

 

 

Н1

 

 

Начало

время, t

Конец

исследования

 

исследования

 

 

 

Н Начало наблюдения, номер пациента

С Наступление события Выбытие из под наблюдения без события

Рис.18–1. Наблюдения в исследовании с течением времени

Н6

 

Н5

 

Н4

 

Н3

С

 

Н2

С

 

Н1

 

Начало время, t наблюдения

Рис.18–2. Наблюдения в исследовании, приведенные к единому началу наблюдений

195

Цензурирование может произойти в нескольких случаях:

пациент потерян из-под наблюдения в силу некоторых обстоятельств: переехал, отказался участвовать в исследовании и пр. В этом случае конечным временем выставляется дата последнего контакта с пациентом;

пациент выбыл из исследования в связи с наступлением другого события, которое делает невозможным его дальнейшее участие в исследовании, например, смерть от заболевания, которое не изучается в исследовании (гибель в автомобильной аварии пациента, который принимал участие в исследовании возникновения сопутствующих заболеваний сахарного диабета);

пациент выбыл по причине окончания сроков исследования. Обычно, дизайн таких исследований – когортное исследование.

Необходимо очень внимательно подходить к определению момента начала наблюдения и момента окончания наблюдения, поскольку они могут не совпадать со сроками начала и конца исследования.

Также очень точно нужно определять, что именно является событием в вашем исследовании и от какого момента исследования начинает отсчет времени наблюдения.

Пример: изучается когорта пациентов, у которых установлен диагноз – лимфобластный лейкоз. Изучаемые исходы – рецидивы , причинно-специфическая и общая выживаемость. Расчет времен наблюдений будет различен. Для общей выживаемости время до наступления события будет определяться с момента постановки диагноза до момента летального исхода по любой причине. Для причинно-специфической выживаемости время будет отсчитываться от момента постановки диагноза до момента смерти по причине (или вследствие) лейкоза. Для рецидивов началом отсчета будет считаться момент наступления ремиссии пациента, окончание – момент обнаружения рецидива заболевания. И вероятность наступления рецидива в такой когорте будет рассчитываться с учетом того, что у некоторой части наблюдаемых ремиссия не была зафиксирована. Если бы изучалось лечение солидной опухоли с оперативным вмешательством, момент начала отсчета времени для безрецидивной выживаемости совпадал бы с моментом оперативного вмешательства.

18.2.Функция выживаемости

Формально, время наблюдения называется цензурированным справа к моменту времени t , если известно только, что оно больше, чем t . Т.е. если пациент включен в исследование и последний контакт состоялся спустя 1 месяц после начала исследования, при этом было выяснено, что для этого пациента изучаемое событие не состоялось, то мы точно знаем, что пациент наблюдался не менее 1 месяца без наступления события. Для пациента однако сохраняется вероятность наступления события в следующие моменты времени. В анализе выживаемости эта вероятность зависит от времени и называется кумулятивной инцидентной функцией (cumulative incidence function) в момент времени t , обозначается F t – вероятность того, что

событие случится в момент времени t , или, что эквивалентно, что время дожития до события меньше или равно t .

Функция инцидентности напрямую не изучается, изучается функция выживаемости или дожития (survival function) в момент времени t , S t , которая

связана с F(t) как F t 1 S t .

S t – это вероятность того, что событие не

 

196

наступило до момента времени t , иначе говоря, вероятность того, что время наступления события больше чем t .

Понятно, что со временем F(t) не убывает, а S(t) – не возрастает.

Как рассчитать вероятность S(t)? Есть несколько методик расчета. Одна из наиболее распространенных – таблицы дожития (Life table).

Принимается, что в момент начала наблюдений S 0 1.

Пример расчета приведен в табл.18–1. Единицей измерений интервала могут выступать час, сутки, неделя, год и т.п. Шаг интервала постоянен и может быть кратен единице измерения. В примере – это 5 месяцев. График зависимости S(t) от

времени приведен на рис. 18–3.

Таблица 18–1. Пример расчета таблицы дожития

Номер интервала

Начало интервала, мес

Конец интервала, мес

Количество наблюдений на начало периода

Количество выбывших из под наблюдения без события

Количество событий в течение периода

Среднее число наблюдаемых за период

Пропорция

выживших за S(t) на начало интервала период

 

 

 

 

 

 

n*

 

pi

 

ˆ

ˆ

pi 1

 

ti

ti 1 ni

mi

di

i

 

 

 

 

n m 2

1 d

n*

S ti S ti 1

 

 

 

 

 

 

i

i

 

i i

 

 

 

1

0

5

395

4

5

393

 

0,9873

 

ˆ

0 1

 

 

 

S

 

 

 

 

 

 

 

 

 

 

 

ˆ

5 1 0,9873

2

5

10

386

12

11

380

 

0,9711

 

S

 

 

0,9873

 

 

 

 

 

 

 

 

 

 

 

 

3

10

15

363

23

12

351,5

 

0,9659

 

S 10 0,9873 0,9711

 

 

0,9873

 

 

 

 

 

 

 

 

 

 

 

 

4

15

20

328

16

19

320

 

0,9406

 

0,9260

 

5

20

25

293

8

14

289

 

0,9516

 

0,8710

 

6

25

30

271

14

10

264

 

0,9621

 

0,8288

 

7

30

35

247

7

10

243,5

 

0,9589

 

0,7974

 

8

35

40

230

12

22

224

 

0,9018

 

0,7647

 

9

40

45

196

13

9

189,5

 

0,9525

 

0,6896

 

10

45

50

174

15

12

166,5

 

0,9279

 

0,6568

 

11

50

55

147

18

3

138

 

0,9783

 

0,6095

 

12

55

60

126

6

6

123

 

0,9512

 

0,5962

 

13

60

65

114

6

4

111,0

 

0,9640

 

0,5671

 

197

Рис.18–3. График зависимости S t от времени на основе таблицы дожития

Каплан и Майер предложили рассчитывать оценку функции выживаемости

как Sˆ t

n ti di

, где ti – момент наступления события в наблюдаемой выборке,

 

ti t

n t

 

 

i

 

 

n ti – количество наблюдаемых на момент времени ti (т.е. исключают выбывших

до момента ti ) ,

 

di – количество событий в момент времени ti , S t 1, если t t1 .

Т.е. функция рассчитывается в моменты времени, когда наступает событие, считается, что она не изменяется, когда событий не происходит, в начале наблюдений, когда t 0 , S t 1. Пример графика функции выживаемости с оценкой

Каплана-Майера (Kaplan–Meier estimator) приведен на рис. 18–4.

Рис.18–4. График зависимости S t от времени на основе оценки Каплан-Майера

Вариацию оценки Каплан-Майера рассчитывают по формуле Гринвуда:

2

 

di

 

 

 

 

Vˆar Sˆ t Sˆ t

 

 

 

 

 

;

n t

n t

d

 

ti t

 

i

i

i

 

 

 

стандартную ошибку рассчитывают как

 

 

 

 

 

di

 

 

 

 

SE Vˆar Sˆ t Sˆ t

 

 

 

 

 

.

n t

n t

d

 

 

 

 

ti t

 

 

 

 

i

i

i

 

 

 

Формула Гринвуда не единственная, есть и другие приблизительные формулы расчета вариации.

Доверительные интервалы приблизительно рассчитывают по формуле:

198

Sˆ t L Sˆ t zγ Vˆar Sˆ t ,

Sˆ t U Sˆ t zγ Vˆar Sˆ t

где zγ – значение γ -квантиля нормального распределения, γ 1 α 2 для двустороннего интервала, т.е. для α 0,05 γ 0,975.

Необходимо заметить, что и оценку Каплан-Майера и доверительные интервалы для такой оценки рассчитывают только в момент наступления события.

Ремарка: Если ранее в наших статистических исследованиях мы исследовали случайные величины, то в анализе выживаемости мы исследуем случайный процесс, который зависит от времени.

Также одной из базовых характеристик выживаемости является медиана

выживаемости – момент времени, в котором Sˆ t 0,5. Поскольку

S t

рассчитывается только для моментов времени, в которых происходит событие, оценка медианной выживаемости основывается на интервале, который включает в

себя значение Sˆ t 0,5.

В каком случае используются оценка выживаемости, а в каком – медиана выживаемости? Оценка выживаемости приводится на определенный срок, например, год, три года, пять лет и т.п. Перед тем, как оценить выживаемость, нужно убедится, что к этому сроку (год, три года, пять лет и т.п.) бóльшая половина наблюдений состоялась, т.е. более 50% пациентов наблюдалось не менее этого срока. Иначе информация о выживаемости на данный срок будет искаженной, т.е. мы еще не знаем, что произойдет с большинством пациентов в будущем. С другой стороны, если события происходят очень интенсивно, то к выбранному сроку выживаемость может составить очень малую величину по причине событий у большинства наблюдаемых. В последнем случае имеет смысл рассчитать медиану выживаемости – срок, к которому оценка выживаемости составит 0,5.

18.3.Сравнение групп по выживаемости

В анализе выживаемости между собой сравниваются функции выживаемости, т.е. если брать графическое представление, это сравнение двух или нескольких кривых. Нулевая гипотеза гласит, что распределение выживаемости в группах одинаково для всех времен наблюдений. Альтернативная гипотеза утверждает, что оно различно.

Существует несколько тестов, которые основаны на разности наблюдаемых и ожидаемых событий в моменты времени, которая потом суммируется. Все эти тесты принадлежат классу логранговых, все они используют разность ожидаемых и наблюдаемых частот (как в критерии Пирсона), но отличаются способом определения весов при суммировании разностей. Принцип построения таких тестов

приведен в разделе 12 при анализе биноминальных выборок.

Статистика рассчитывается как χk2 1 w d e , где d – количество событий

e

 

в определенной категории (интервале) для каждой

из групп, e – ожидаемое

количество событий в интервале для каждой из групп,

w – весовой коэффициент

(табл.18–2), N – количество наблюдений в интервале, k – количество групп1.

Таблица 18–2. Весовые коэффициенты для различных тестов

1 Фактически тестовая статистика рассчитывается на основе функции риска (см. раздел 18.4.).

199

Тест

 

 

весовой коэффициент

 

 

 

 

 

 

 

 

Логранговый

 

 

w 1

 

 

 

 

 

 

 

 

 

 

 

 

Gehan-Breslow

 

 

w N

(обобщенный

 

тест

 

 

 

 

 

Wilcoxon)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Tarone-Ware

 

 

w

 

 

 

 

 

 

N

 

 

 

 

 

Peto-Peto

(Peto-Peto-

w Sˆ t

Prentice)

 

 

 

 

 

 

 

 

 

 

 

 

Модифицированный

 

w Sˆ

t N

 

 

 

 

 

 

Peto-Peto

 

 

 

 

 

 

 

 

 

 

 

 

N 1

 

 

 

 

 

 

 

 

Если бы не было времен наблюдений, то эти тесты были бы аналогичны тестам Манна-Уитни (для двух выборок), тесту Краскела-Уоллиса (для нескольких выборок), тесту Мантеля-Хензеля и т.п. Но если мы сравним пропорции выживших только в один момент времени, можем получить результат, который свидетельствует об отсутствии различий (см. рис. 18–5). На рисунке можно увидеть различия в двух группах в 20, 40, 60 месяцев, однако после 80 месяцев различия исчезают. Логранговый тест, благодаря суммированию различий в моменты наступления событий, “накапливает” суммарное различие на протяжении всего времени наблюдения.

Рис.18–5. Кривые дожития в двух группах

Часто в публикациях упоминается логранговый тест без уточнения метода расчета весовых коэффициентов при разностях ожидаемых и наблюдаемых частот. В любом случае, если вы сравниваете группы, то лучше иметь не только расчетные значения тестов, но и графическое представление кривых выживаемости. Безусловно, не надо использовать все тесты в каждом исследовании, равно как и не стоит останавливаться только на одном. Выбор диктуется гипотезой, которая сделана до изучения кривых выживаемости. В частности, если нет предположений о распределении, лежащем в основе функции выживаемости, лучше использовать классический расчет логрангового теста без модификаций, особенно, если количество цензурированных наблюдений велико.

18.4.Понятие функции риска

Функция риска (hazard function или hazard rate) связана с понятиями функции выживаемости S t и кумулятивной инцидентной функцией F(t). Обозначается как

200

Соседние файлы в папке ОЗИЗО Общественное здоровье и здравоохранение