Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Зайцев_книга2[1].doc
Скачиваний:
649
Добавлен:
15.03.2015
Размер:
8.87 Mб
Скачать
      1. Коэффициент вариации

Недостатков, свойственных дисперсии и среднеквадратическому отклонению, лишен коэффициент вариации Cv (Kurtosis). Этот коэффициент представляет процентное отношение среднеквадратического отклонения к среднему арифметическому Cv=. Арифметически отношениеМ и нивелирует влияние абсолютной величины этих характеристик, а процентное соотношение делает коэффициент вариации величиной не именованной. Кроме того, этот коэффициент позволяет оценивать вариабельность (разброс) признака в нормированных границах. Если его значение не превышает 10% , то можно говорить о слабом разбросе. Если коэффициент вариации находится в пределах 10-20% , разброс средний, если превышает 20%, то разброс вариант считают большим. Отличие коэффициента вариации от других критериев разброса наглядно демонстрирует пример:

Таблица 86

Состав работников промышленного предприятия n

Учетный признак

Среднее арифметическое

М

Средне- квадратическое отклонение

Коэффициент вариации

Cv

Стаж работы (лет)

8,7

2,8

32,1

Возраст (лет)

37,2

4,1

11,0

Образование (классов)

9,2

1,1

11,9

На основании приведенных в примере статистических характеристик можно сделать вывод об относительной однородности возрастного состава и образовательного уровня работников предприятия, при низкой профессиональной устойчивости обследованного контингента. Нетрудно заметить, что попытка судить об этих социальных тенденциях по среднеквадратическому отклонению, привела бы к ошибочному заключению, а попытка сравнения учетных признаков «стаж работы» и «возраст» с учетным признаком образование вообще была бы некорректной из-за разнородности этих признаков.

      1. Квантили

В некоторых видах распределений среднеквадратическое отклонение и дисперсия ( и D) отсутствуют или не могут служить характеристиками рассеяния вариант по другим причинам. В частности, указанное обстоятельство может быть связано с тем, что D и вычисляются по отклонениям от среднего арифметического, которое не вычисляется в открытых вариационных рядах и в рядах распределений качественных признаков. Поэтому для сжатого описания такого рода распределений используется другой параметр разброса – квантиль (синонимы «перцентиль», «персентиль»), пригодный для статистического описания качественных и количественных признаков при любой форме их распределения. Этот параметр может использоваться и для перевода количественных признаков в качественные. В этом случае качественные оценки присваиваются в зависимости от того, какому по порядку квантилю соответствует та или иная конкретная варианта. Особым свойством квантилей является их полная независимость от конкретных значений каждой, отдельно взятой единицы наблюдения. Значение имеет только порядковый номер, место расположение этой единицы в ряду распределения.

Например, чтобы разбить исследуемую группу четыре равные подгруппы, выделяют точки, делящие исходные ряд по 25% наблюдений в каждой подгруппе. Для этого необходимо использовать три значения, которые называются квартилями (quartile), поскольку в результате деления получаем 4 группы – кварты. Средняя точка деления из них называется медианой. Если использовать два тертиля (tertile), можно разбить данные на три группы, четыре квинтиля (quintile), -пять групп, и так далее. Так получают децили (decile), которые делят данные на 10 частей, и центили (centile), которые делят данные на 100 частей (их также называют процентилями). Конкретные значения квартилей могут быть выражены через центили: самый левый квартиль равен 25-ому центилю (V0.25), медиана – 50-ому центилю (V0.50).

Рисунок 85 Распределение квартилей

В медико-биологических исследованиях нередко используют центили следующих размерностей: 3-й (V0.03), 10-й (V0.10), 25-й (V0.25), 50-й (V0.50), 75-й (V0.75), 90-й (V0.90) и 97-й (V0.97). В этом случае - 3-й (V0.03) центиль равен варианте, чьё значение не превышает значения у 3 %- всех вариант данного ряда. Например, масса тела не более 47 кг встречалась у 3% работников. Варианты меньше 10-го (V0.10) центиля встречаются у 10% всех вариант ряда и т.д. Например, масса тела не более 59 кг встречалась у 10% работников.

Как уже отмечалось, значения центильных границ могут быть основой качественной оценки количественных данных. Например: показатели физического развития, значения которых у конкретного пациента меньше 3-го центиля, оцениваются как резко пониженные. Находящиеся по своему значению между 3 и 10 центилем, - как пониженные, между 10 и 25 центилем, - ниже среднего, между 25 и 75 средние, между 75 и 90 - выше среднего, между 90 и 97 - повышенные, выше 97 - резко повышенные.

В практике статистического анализа наиболее часто используются следующие квантили:

V0.5 - медиана

V0.25 V0.5 V0.75. . квартили (четверти), где V0.25 нижняя квартиль, V0.75 верхняя квартиль

V0.1 V0.2 V0.3 . . . . .V0.9 – децили (десятые);

V0.01 V0.02 V0.03 . . . . .V0.99 - процентили или центили (сотые).

Квантили делят область возможных изменений вариант в вариационном ряду на определенные интервалы. Медиана (квантиль V0.5)- это варианта, которая находится в середине вариационного ряда и делит этот ряд пополам, на две равные части (0,5 и 0,5). Квартиль делит ряд на четыре части: первая часть (нижняя квартиль V0.25) - это варианта, отделяющая варианты, числовые значения которых не превышают 25% максимально возможного в данном ряду, квартиль V0.5 отделяет варианты с числовым значением до 50% от максимально возможного. Верхняя квантиль (V0.75) отделяет варианты величиной до 75% от максимально возможных значений.

Понять статистическую суть квантилей помогает графический метод, т.е. построение диаграммы распределения числовых значений признака в квантилях, которые могут выражаться в процентах или долях единицы (Рисунок 85).

Вычисление центилей и других квантилей требует специальной подготовки исходной информации. В частности, исходные данные должны быть ранжированы (упорядочены) от 1-го до конечного (n), в порядке возрастания. Значения конкретного центиля получается вычислением величины q=k*(n+1)/100 и ее последующей интерполяцией между двумя ближайшими (большим и меньшим) к q значениями данных. Рассмотрим пример (J. M. Bland, D. G. Altman, 1994). Для 5-го центиля выборки из 145 наблюдений мы имеем q=5*146/100=7,3. Таким образом, 5-ый центиль находится на 3/10 расстояния от 7-го к 8-му наблюдению ранжированного ряда. Если значения этих данных равны 11.4 и 14.9 соответственно, искомый центиль равен 12.45. Доверительные интервалы могут быть построены для любого квантиля.