- •Москва "наука" 1993
- •Глава первая
- •1. Становление основных подходов к измерению установок (1920-е - 1930-е годы)
- •3. Психологическая ориентация: ф.Олпорт, л.Л.Терстоун, р.Ликерт
- •4. Традиция Гутмана-Лазарсфельда
- •2. Надежность и валидность эмпирическх моделей
- •3. Множественные индикаторы в оценке качества измерения
- •1. Концептуализация и косвенное измерение
- •2. Взаимозависимость концептуализации и измерения:
- •1. Обобщение моделей структурных уравнений с латентной переменной и "общеизвестные истины" измерения
- •2. Г£гяао-методология и процедуры автоматического поиска моделей
- •4. Реалистская стратегия измерения
- •Вместо заключения: о радикальной критике "количественных" процедур в социологии 1
- •Литература
1. Обобщение моделей структурных уравнений с латентной переменной и "общеизвестные истины" измерения
В недавней фундаментальной работе К.Боллена [96 ] представления о самостоятельном значении теоретически обоснованных моделей измерения были использованы для успешной попытки синтеза и обобщения подходов и методов, применяемых в психометрике, эконометрике и социальных науках при описании и анализе отношений между теоретическими и эмпирическими переменными. К моделям структурных уравнений (structural equation models, т.е.. моделям, состоящим из структурных уравнений) относятся и регрессионные, и эконометрические, и факторно-аналитические процедуры. Таким образом, и модели со множественными индикаторами, и модели путевого анализа, и факторные модели с латентными переменными могут быть включены в общий класс структурных моделей с латентными (или ненаблюдаемыми) переменными. Система структурных уравнений, задающих модель, в этом общем случае состоит из двух подсистем: модели латентных переменных, описывающей отношения ненаблюдаемых (неизмеряемых) одномерных конструктов, и модели измерения [96. Р. 11]. Таким образом, предложенное обобщение понятия структурной модели в явной, эксплицитной форме включает модель измерения в проверяемую теоретическую модель. Полная теоретическая модель описывает отношения между зависимыми и независимыми переменными и допускает наличие ошибок измерения и в первых, и во вторых.
Демонстрацией продуктивности этого подхода стал систематический критический пересмотр ряда "общеизвестных истин" классической теории тестов, результаты которого изложены, в частности, в работе К.Боллена и Р.Леннокса [97 ]. Так как к теме эффективности моделирующего подхода к измерению для пересмотра ряда некритически принимаемых положений традиционной психометрики мы уже неоднократно обращались (например, при описании многоиндикаторного подхода к конструктной валидности), мы ограничимся лишь описанием некоторых новых результатов, полученных Болленом и Ленноксом. Эти результаты интересны для нас, прежде всего, как еще одна иллюстрация тех радикальных изменений, которые были инициированы возникновением моделирующего подхода к измерению. Боллен и Леннокс поставили своей целью проверить, насколько обоснованны обычные рекомендации, касающиеся отбора индикаторов (чаще всего - тестов или анкетных вопросов) и используемые исследователями в повседневной практике. Эту проверку они осуществили для двух общих моделей измерения. Первая из них - классическая модель теории тестов и факторного анализа, где индикаторы
117
(пункты теста, вопросы) зависят от латентной переменной. Эту модель, вслед за Х.Блейлоком, часто называют моделью измерения с эффект-индикаторами, т.е. индикаторами-следствиями латентной переменной. Для этой модели принимаются все обычные предположения теории тестов, в том числе и предположение о том, что истинные значения латентной переменной определяют значения ее индикаторов. Так как латентная переменная - это чаще всего некоторый теоретический конструкт, то примерами этой общей модели могут служить и многочисленные "черты личности" (от тревожности до макиавеллизма), и способности (например, невербальный интеллект), и диспозиции (политическая активность).
Вторая рассматривавшаяся Болленом и Ленноксом общая модель - это модель с причинными индикаторами. Мы уже обращались к примерам причинных индикаторов латентных переменных. В качестве причинных индикаторов используются, например, многие категориальные переменные, описывающие "жизненный путь" респондентов, например, образование или доход родителей (другие примеры можно найти на с.104-110 данной работы). Разумеется, причинными индикаторами они становятся лишь в том случае, если исследователь предполагает, что эти переменные детерминируют значение латентной переменной. Например, социолог может считать, что продолжительность обучения и доход определяют социальный статус (не вкладывая при этом в понятия "определяют" или "служит причиной" буквального физического смысла). Другими примерами могут служить "лишение пищи" как причинный индикатор "голода", "психологическая травма" как причинный индикатор "стресса" и т.п. Не входя в технические подробности (многие из которых, к тому же, обсуждались нами раньше), отметим, что даже простейшая модель латентной переменной с несколькими причинными индикаторами (последние еще называют "формативными") будет очевидным образом отличаться от предыдущей. Например, возрастание значения латентной переменной не обязательно будет сопряжено с возрастанием значений всех ее индикаторов.
Одним из фундаментальных понятий теории тестов является понятие внутренней согласованности пунктов теста или батареи вопросов, предназначенных для измерения одной латентной переменной. Это понятие составляет основу для оценки надежности-согласованности, или одномоментной надежности (см., в частности, с.61-64 данной работы), и для применения факторного анализа. Внутренняя согласованность подразумевает положительную корреляцию индикаторов одной переменной (разумеется, при условии, что все пункты-индикаторы сформулированы в одном направлении). Обычно рекомендуется исключать индикаторы, имеющие нулевую или отрицательную корреляцию с остальными. Обоснованность критерия внутренней согласованности для первой модели - с эффект-индикаторами латентной переменной - не вызывает никаких сомнений. При условии стандартизации латентной и наблюдаемых переменных, корреляция между индикаторами будет равна произведению их корреляций с истинным баллом. Если корреляция индика-
торов с истинным баллом положительна, то и их корреляции друг с другом также должны быть положительны.
Совсем иной будет ситуация для второй модели с причинными индикаторами латентной переменной, так как сама модель не налагает никаких ограничений на попарные корреляции между индикаторами: они могут быть положительными, отрицательными или нулевыми. Скажем, связь между образованием и доходом как индикаторами статуса в некоторых обществах может быть нулевой или отрицательной. Столь же трудно определить заранее направление и величину связи между различными причинными индикаторами стресса, например, потерей работы, смертью супруга и болезнью. Исследователь, использующий рутинные процедуры поиска максимальных значений в матрице корреляций, рискует пропустить самые информативные индикаторы. Таким образом, некритичное использование критерия внутренней согласованности может вести к совершенно ошибочным выводам.
Другим распространенным методологическим "рецептом" (не всегда, кстати, согласующимся с критерием внутренней согласованности) является оптимальная корреляция индикаторов. Аргументом в этом случае обычно является необходимость обеспечить гене-рализуемость и валидность выводов, что невозможно для чрезмерно, специфичного и узкого набора высококоррелированных индикаторов.
Однако анализ двух вышеописанных элементарных моделей ставит под сомнение и эту рекомендацию. Для модели с эффект-индикаторами латентной переменной предпочтительной все же является высокая корреляция индикаторов. Если же у исследователя есть основания предположить наличие скоррелированных ошибок измерения между индикаторами, то он не имеет никаких оснований предпочитать индикаторы с умеренной корреляцией, так как единственный способ справиться с этой проблемой - это специфицировать предполагаемую модель измерения и внести следующие из нее поправки в процедуру отбора индикаторов.
В случае же модели с причинными индикаторами, как уже говорилось, величины корреляций между индикаторами никак не ограничиваются самой моделью и определяются лежащими вне модели (экзогенными) факторами. Конечно, высокие корреляции между причинными индикаторами затрудняют оценку воздействия каждого из них на латентную переменную (проблема мультиколли-неарности), и в этой ситуации низкие корреляции предпочтительнее. Однако никаких общих рекомендаций для причинных индикаторов сделать нельзя, так как оптимальное значение корреляций между индикаторами будет определяться лишь конкретной моделью измерения.
При выборе индикаторов одномерного теоретического конструкта часто рекомендуется выбирать индикаторы, представляющие все аспекты ("фасеты") этого конструкта, т.е. латентной переменной (ср. с.37). Боллен и Леннокс, рассмотрев две описанные элементарные модели, пришли к следующему выводу: "В общем итоге, рекомендация делать выборку индикаторов для всех граней конструкта
118
119
может вводить в заблуждение. Для эффект-индикаторов одномерного конструкта равно надежные индикаторы в сущности взаимозаменяемы. Если же многогранность означает многомерность, то каждое измерение (dimension) должно рассматриваться отдельно, на основании своего собственного множества эффект-индикаторов. В случае же причинных индикаторов, исключение какого-то индикатора меняет саму латентную переменную, ее состав (и интерпретацию), и, за несколькими исключениями, важно включить каждый причинный индикатор" [97. Р.308 ]. Таким образом, стремление к максимальной представленности всех аспектов одномерного конструкта обоснованно лишь при выборе причинных индикаторов и не имеет никакого смысла в случае эффект-индикаторов. Другие интересные результаты, полученные Болленом и Ленноксом при анализе общих моделей измерения с латентной переменной, мы лишь кратко суммируем, так как их изложение здесь потребовало бы привлечения достаточно специальных деталей. Первый из этих результатов относится к часто используемому правилу сравнения внутриконструктной и межкон-структной корреляции индикаторов. Суть этого правила кажется интуитивно ясной: корреляция между индикаторами одной латентной переменной-конструкта (например, между пунктами одного теста) должна быть выше, чем корреляция между индикаторами разных конструктов. В действительности, данное правило может вести к ошибкам независимо от типа индикаторов. Этот вывод может быть получен приблизительно тем же способом, который был использован при критике "М-М"-матриц Кэмпбелла-Фиске с позиций моделирующего подхода (см. с.82-86 данной работы).
Другой распространенной практикой является использование суммарного балла в качестве латентной переменной. Арифметическая сумма значений индикаторов (или линейный сводный показатель) часто подставляется в качестве латентной переменной в регрессионном, дисперсионном анализе и т.п. И в этом случае обоснованность такой практики зависит от того, какого типа индикаторы используются и какова модель измерения. Так, при использовании суммарного балла в качестве независимой переменной в регрессионной модели получаемые оценки коэффициентов могут оказываться смещенными [97. Р.309-310] (см. также: [96. Ch.5]). Использование процедуры взвешивания может несколько улучшить ситуацию.
Таким образом, уже только учет направления связи между латентным конструктом и индикатором в самых общих моделях измерения позволяет критически отнестись ко многим правилам отбора индикаторов и оценки шкал и тестов.
Разумеется, рассмотренные Болленом и Ленноксом модели измерения существенно упрощены: ошибки измерения в них не скорре-лированы, а между латентными переменными и индикаторами существует взаимнооднозначное соответствие. Кроме того, элементарная модель с причинными индикаторами латентной переменной слишком проблематична и с содержательной - как интерпретировать, не вводя дополнительных факторов, латентную переменную, явля-
120
ющуюся следствием наблюдаемых показателей? - и со статистической точек зрения. В уже упомянутой фундаментальной работе Боллена [96 ] доказывается, что способом интерпретации и статистической идентификации модели измерения с причинными индикаторами является ее включение в более широкую теоретическую модель, где присутствуют и эффекты самой латентной переменной.
Мы можем лишь согласиться с выводом, к которому приходят Боллен и Леннокс: использование самих по себе структурных моделей измерения еще не ведет к правильному выбору индикаторов, однако формальная спецификация модели измерения - единственное средство понять, какие из общепринятых правил измерения подходят в данном случае [97. Р.312].