- •Введение в теорию измерений
- •Статистические гипотезы
- •Компьютеры в медико-биологической статистике
- •Особенности в использовании пакета spss
- •View (Вид, просмотр),
- •Особенности использования пакета statistica for windows
- •Определение переменных
- •Приемы описательной статистики
- •Методы, основанные на критериях согласия распределений
- •4. Применим второй способ проверки на нормальность по оценке коэффициентов асимметрии и эксцесса:
- •Проверка на нормальность (опровержение гипотезы нормальности для малой выборки, пакеты spss и Statistica).
Определение переменных
Переменные в пакете Statistica for Windows изначально имеют звания VAR1, VAR2, VAR3 и т.д. Эти обозначения можно менять по своему усмотрению, щелкнув по названию переменно. Откроется окно, в котором вы сможете произвести перенастройку. Напоминаем: название переменной не может содержать более 8 символов, и лучше — английское написание. Дело в том, что и данный пакет, как и предыдущий, дает сбои, если исследователем используется в названиях случаев и переменных русский алфавит.
Гораздо лучше уже после обработки данных перед выводом на печать русифицировать название таблиц, графиков. Так как наши данные имеют числовой тип и представляют двузначные числа в поле Width (Общая ширина), надо ввести значение 2.
Будьте готовы к тому, что столбец может автоматически сузиться и не будет соразмерен названию переменной. Для этого полю переменной надо задать адекватную ширину. В поле Decimal (Количество десятичных знаков после запятой) для обеих переменных зададим 0. В поле Data (Дата) зададим формат вводимых значений.
В поле Long Name (Полное — длинное — имя) можно ввести Label (Метку) переменной, в этом варианте ее «длинное» название будет выводиться при подытоживании результатов. Введем те же самые метки, что и в предыдущем примере. Кстати, сюда же можно вводить и формулы.
В пакете Statistica можно оперировать метками отдельных значений переменной, задавать текстовые названия для числовых результатов измерений. Введем (для тренировки) новую переменную с именем SUM, присвоим ей метку «Груп-пирующая переменная», тип — числовой с длиной 1 и количеством знаков после запятой 0. Для этой цели в диалоговом окне нажмем кнопку Text Values (Текстовые значения) и введем текстовые названия, числовые значения и их метки.
По условиям разработчиков текстовые названия не должны выходить за пределы восьми символов, а длина меток числовых значений — 40 символов. Новая строка вводится клавишей Insert. Потренируемся, вводя несколько значений 1 и 2. В таблице показываются сами значения, а чтобы перейти к их текстовым названиям, нажмем на панели инструментов кнопку Text Value (Текстовые названия). Автоматически появляются не числовые значения, а их названия. Повторное нажатие кнопки возвращает нас к числовым значениям.
И вновь, как и в предыдущем примере, на этом определение используемых переменных нами закончено. Сохраним введенные данные в файле для дальнейшей работы с ним. Приемы редактирования данных в пакете аналогичны соответствующим для пакета SPSS.
Приемы описательной статистики
Это первый достаточно простой, однако самый ответственный этап статистического анализа эмпирических данных. И начинается работа, как вы понимаете, с проверки полученных данных на «нормальность» .
И это не догма: от данной процедуры зависят корректность и однозначность выводов практически всех и главным образом сложных, многомерных методов анализа данных (например, дискриминантного или факторного анализа, которые будут рассмотрены ниже).
Традиционно используются:
дескриптивная статистика и визуализация,
критерии согласия распределений. Дескриптивные методы дают обобщенное описание как
эмпирической выборки, так и генеральной совокупности: среднее арифметическое, минимум, максимум, мода, медиана, дисперсия, стандартное отклонение, асимметрия, эксцесс и др.
Визуальный метод (гистограмма, линейные графики эмпирического распределения) реализован во всех популярных статистических пакетах, он помогает сопоставить опытные данные с теоретической кривой нормального распределения.
Оценки показателей асимметрии и эксцесса сопряжены с одновременным получением их стандартных ошибок.
Асимметрия (Skewness), коэффициент скошенности эмпирического распределения частот, — отклонение вправо или влево относительно максимальной ординаты:
Для симметричных распределений показатель асимметрии равен нулю. Отрицательный показатель асимметрии означает, что кривая распределения от теоретической симметричной кривой распределения скошена влево, положительный — вправо.
Стандартная ошибка асимметрии (Standard error of Skewness) — отклонение показателя асимметрии от нуля:
Показатель эксцесса (Kurtosis), или коэффициент островершинности выборочной совокупности, рассчитывается так:
Стандартная ошибка эксцесса (Standard error of Kurtosis):
Для нормального распределения показатели асимметрии и эксцесса равны нулю:
Для проверки на нормальность применяют оценки выборочных коэффициентов асимметрии и эксцесса:
• распределение считается симметричным в случае , асимметричным, если ;
• распределение близко к нормальному, если , и значительно отклоняется от него, если