- •Санкт-Петербургский Государственный Институт Психологии и Социальной Работы
- •Математические методы в психологии Учебно-методическое пособие
- •Аннотация
- •Глава 1. Описательная статистика 18
- •Глава 2. Индуктивная статистика 84
- •Оглавление
- •Глава 1. Описательная статистика 12
- •Глава 2. Индуктивная статистика 78
- •Введение Цели и задачи изучения дисциплины «Математические методы в психологии» и сфера профессионального использования
- •Методические указания для студентов
- •Контрольные вопросы для самостоятельной подготовки и самопроверки
- •Глава 1. Описательная статистика
- •1. 1. Математическая статистика и психология. Измерения в психологии и виды шкал
- •Материалы лекции.
- •Типы измерений и измерительные шкалы
- •Генеральная совокупность и выборочное исследование. Статистическая достоверность
- •Этапы обработки результатов психологического исследования
- •1. 2. Описание результатов исследования
- •Материалы лекции.
- •Результаты исследования экстраверсии
- •Алгоритм построения сгруппированного (или табулированного) ряда
- •Общий обзор параметров распределений
- •1. 3. Параметры статистических совокупностей
- •Материалы лекции.
- •Результаты исследования экстраверсии
- •Исключение выскакивающих значений
- •Нормальный закон распределения и другие виды распределений
- •Проверка «нормальности» эмпирического распределения
- •Стандартизация данных и стандартизованные шкалы в психологии
- •Процентильные нормы для детей 5;5 – 11 лет
- •1. 4. Характеристики взаимосвязи признаков
- •Материалы лекции. Понятие статистической зависимости
- •Общий обзор мер связи
- •Коэффициент контингенции
- •Критерий «хи-квадрат» Пирсона
- •Ранжирование
- •Правила ранжирования
- •Бисериальные коэффициенты корреляции
- •Коэффициент взаимной сопряженности Чупрова
- •Коэффициент взаимной сопряженности Пирсона
- •Ранговой коэффициент корреляции Спирмена
- •Коэффициент линейной корреляции Пирсона
- •Глава 2. Индуктивная статистика
- •2. 1. Решение задачи сравнения выборок. Понятие статистических критериев и их виды
- •Материалы лекции. Статистические гипотезы
- •Уровень статистической значимости
- •Этапы принятия статистического решения
- •Классификация исследовательских задач, решаемых с помощью статистических методов
- •Решение задачи сравнения выборок
- •4. Каковы ограничения в применении критерия?
- •Обзор наиболее часто применяемых параметрических критериев
- •Общий обзор непараметрических критериев
- •2. 2. Выявление различий в уровне исследуемого признака
- •Материалы лекции. Параметрический критерий Стьюдента для сравнения независимых выборок
- •Поправка Снедекора
- •Правило принятия решения описано выше. Непараметрический критерий Розенбаума (критерий «хвостов»)
- •Непараметрический критерий Манна-Уитни
- •2. 3. Оценка достоверности сдвига в значениях исследуемого признака
- •Материалы лекции.
- •Параметрический критерий Стьюдента для сравнения зависимых выборок
- •Непараметрический критерий знаков
- •6. Правило принятия решения:
- •Непараметрический критерий Вилкоксона
- •2. 4. Выявление различий в распределении признака
- •Материалы лекции. Критерий «хи-квадрат» Пирсона
- •Критерий Колмогорова-Смирнова
- •2. 5. Многофункциональные статистические критерии
- •Материалы лекции.
- •Критерий φ* — «Угловое преобразование» Фишера
- •Алгоритм расчета критерия φ*
- •Критерий Макнамары
- •Алгоритм расчет критерия
- •2. 6. Дисперсионный анализ
- •Материалы лекции. Введение в дисперсионный анализ anova
- •Однофакторный дисперсионный анализ
- •2. 7. Многомерные методы обработки данных
- •Материалы лекции.
- •I. Классификация методов по назначению:
- •II. Классификация методов по исходным предположениям о структуре данных:
- •III. Классификация методов по виду исходных данных:
- •Множественный регрессионный анализ
- •Матрица корреляций пяти показателей интеллекта
- •Факторные нагрузки после варимакс-вращения
- •1. Эксплораторный-разведочный.
- •2. Конфирматорный.
- •1. Выбор исходных данных.
- •2. Предварительное решение проблемы числа факторов.
- •3. Факторизация матрицы интеркорреляций.
- •4. Вращение и предварительная интерпретация факторов (ротация факторов).
- •5. Принятие решения о качестве факторной структуры.
- •6. Вычисление факторных коэффициентов и оценок.
- •Компьютерные пакеты прикладных статистических программ
- •Список литературы
- •Приложение 1. Статистические таблицы с критическими значениями
- •1.1. Критические значения отношения для исключения выскакивающих значений
- •1.2. Критические значения коэффициента ранговой корреляции Спирмена
- •1.3. Критические значения коэффициента линейной корреляции Пирсона
- •1.4. Критические значения критерия хи-квадрат Пирсона
- •1.5. Критические значения критерия Стьюдента
- •1.6. Критические значения критерия Фишера
- •1.7. Критические значения непараметрического критерия Манна-Уитни
- •1.8. Критические значения непараметрического критерия Вилкоксона
- •1.9. Таблицы для перевода процентных долей в величины центрального угла для расчета критерия «угловое преобразование» Фишера
- •Приложение 2. Глоссарий
- •Приложение 3. Англо-русский словарь статистических терминов
Генеральная совокупность и выборочное исследование. Статистическая достоверность
Исследование обычно начинается с некоторого предположения, требующего проверки с привлечением фактов. Это предположение — гипотеза — формулируется в отношении связи явлений или свойств в некоторой совокупности объектов.
Для проверки подобных предположений на фактах необходимо измерить соответствующие свойства у их носителей. Но невозможно измерить тревожность у всех женщин и мужчин, как невозможно измерить агрессивность у всех подростков. Поэтому при проведении исследования ограничиваются лишь относительно небольшой группой представителей соответствующих совокупностей людей.
Генеральная совокупность — это все множество объектов, в отношении которого формулируется исследовательская гипотеза.
Например, все мужчины; или все женщины; или все жители какого-либо города. Генеральные совокупности, в отношении которых исследователь собирается сделать выводы по результатам исследования, могут быть по численности и более скромными, например, все первоклассники данной школы.
Таким образом, генеральная совокупность — это хотя и не бесконечное по численности, но, как правило, недоступное для сплошного исследования множество потенциальных испытуемых.
Выборка или выборочная совокупность — это ограниченная по численности группа объектов (в психологии — испытуемых, респондентов), специально отбираемая из генеральной совокупности для изучения ее свойств. Соответственно, изучение на выборке свойств генеральной совокупности называется выборочным исследованием. Практически все психологические исследования являются выборочными, а их выводы распространяются на генеральные совокупности.
Таким образом, после того, как сформулирована гипотеза и определены соответствующие генеральные совокупности, перед исследователем возникает проблема организации выборки. Выборка должна быть такой, чтобы была обоснована генерализация выводов выборочного исследования — обобщение, распространение их на генеральную совокупность. Основные критерии обоснованности выводов исследования — это репрезентативность выборки и статистическая достоверность (эмпирических) результатов.
Репрезентативность выборки — иными словами, ее представительность — это способность выборки представлять изучаемые явления достаточно полно — с точки зрения их изменчивости в генеральной совокупности.
Конечно, полное представление об изучаемом явлении, во всем его диапазоне и нюансах изменчивости, может дать только генеральная совокупность. Поэтому репрезентативность всегда ограничена в той мере, в какой ограничена выборка. И именно репрезентативность выборки является основным критерием при определении границ генерализации выводов исследования. Тем не менее, существуют приемы, позволяющие получить достаточную для исследователя репрезентативность выборки (Эти приемы изучаются в курсе «Экспериментальная психология»).
Первый и основной прием — это простой случайный (рандомизированный) отбор. Он предполагает обеспечение таких условий, чтобы каждый член генеральной совокупности имел равные с другими шансы попасть в выборку. Случайный отбор обеспечивает возможность попадания в выборку самых разных представителей генеральной совокупности. При этом принимаются специальные меры, исключающие появление какой-либо закономерности при отборе. И это позволяет надеяться на то, что в конечном итоге в выборке изучаемое свойство будет представлено если и не во всем, то в максимально возможном его многообразии.
Второй способ обеспечения репрезентативности — это стратифицированный случайный отбор, или отбор по свойствам генеральной совокупности. Он предполагает предварительное определение тех качеств, которые могут влиять на изменчивость изучаемого свойства (это может быть пол, уровень дохода или образования и т. д.). Затем определяется процентное соотношение численности различающихся по этих качествам групп (страт) в генеральной совокупности и обеспечивается идентичное процентное соотношение соответствующих групп в выборке. Далее в каждую подгруппу выборки испытуемые подбираются по принципу простого случайного отбора.
Статистическая достоверность, или статистическая значимость, результатов исследования определяется при помощи методов статистического вывода.
Застрахованы ли мы от принятия ошибок при принятии решений, при тех или иных выводах из результатов исследования? Конечно, нет. Ведь наши решения опираются на результаты исследования выборочной совокупности, а также на уровень наших психологических знаний. Полностью мы не застрахованы от ошибок. В статистике такие ошибки считаются допустимыми, если они имеют место не чаще чем в одном случае из 1000 (вероятность ошибки α=0,001 или сопряженная с этим величина доверительная вероятность правильного вывода р=0,999); в одном случае из 100 (вероятность ошибки α=0,01 или сопряженная с этим величина доверительная вероятность правильного вывода р=0,99) или в пяти случаях из 100 (вероятность ошибки α=0,05 или сопряженная с этим величина доверительная вероятность правильного вывода р=0,95). Именно на двух последних уровнях и принято принимать решения в психологии.
Иногда, говоря о статистической достоверности, используют понятие «уровень значимости» (обозначается как α). Численные значения р и α дополняют друг друга до 1,000 — полный набор событий: либо мы сделали правильный вывод, либо мы ошиблись. Эти уровни не рассчитываются, они заданы. Уровень значимости можно понимать как некую «красную» линию», пересечение которой позволит говорить о данном событии как о неслучайном. В каждом грамотном научном отчете или публикации сделанные выводы должны сопровождаться указанием значений р или α, при которых сделаны выводы.
Методы статистического вывода подробно рассматриваются в курсе «Математической статистики». Сейчас лишь отметим, что они предъявляют определенные требования к численности, или объему выборки.
К сожалению, строгих рекомендаций по предварительному определению требуемого объема выборки не существует. Более того, ответ на вопрос о необходимой и достаточной ее численности исследователь обычно получает слишком поздно — только после анализа данных уже обследованной выборки. Тем не менее, можно сформулировать наиболее общие рекомендации:
1. Наибольший объем выборки необходим при разработке диагностической методики — от 200 до 1000-2500 человек.
2. Если необходимо сравнивать 2 выборки, их общая численность должна быть не менее 50 человек; численность сравниваемых выборок должна быть приблизительно одинаковой.
3. Если изучается взаимосвязь между какими-либо свойствами, то объем выборки должен быть не меньше 30-35 человек.
4. Чем больше изменчивость изучаемого свойства, тем больше должен быть объем выборки. Поэтому изменчивость можно уменьшить, увеличивая однородность выборки, например, по полу, возрасту и т. д. При этом, естественно, уменьшаются возможности генерализации выводов.
Зависимые и независимые выборки. Обычна ситуация исследования, когда интересующее исследователя свойство изучается на двух или более выборках с целью их дальнейшего сравнения. Эти выборки могут находиться в различных соотношениях — в зависимости от процедуры их организации. Независимые выборки характеризуются тем, что вероятность отбора любого испытуемого одной выборки не зависит от отбора любого из испытуемых другой выборки. Напротив, зависимые выборки характеризуются тем, что каждому испытуемому одной выборки поставлен в соответствие по определенному критерию испытуемый из другой выборки.
В общем случае зависимые выборки предполагают попарный подбор испытуемых в сравниваемые выборки, а независимые выборки — независимый отбор испытуемых.
Следует отметить, что случаи «частично зависимых» (или «частично независимых») выборок недопустимы: это непредсказуемым образом нарушает их репрезентативность.
В заключение отметим, что можно выделить две парадигмы психологического исследования. Так называемая R-методология предполагает изучение изменчивости некоторого свойства (психологического) под влиянием некоторого воздействия, фактора либо другого свойства. Выборкой является множество испытуемых. Другой подход, Q-методология, предполагает исследование изменчивости субъекта (единичного) под влиянием различных стимулов (условий, ситуаций и т. д.). Ей соответствует ситуация, когда выборкой является множество стимулов.