Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
книги / Человек и его работа в СССР и после..pdf
Скачиваний:
5
Добавлен:
20.11.2023
Размер:
21.25 Mб
Скачать

 

Низкая

Средняя

Выше средней

Высокая

Итого

Низкая

42

194

36

 

54

 

326

Средняя

15

125

37

 

60

 

237

Высокая

61

591

367

1

081

2

1 0 0

Итого

118

910

440

1

195

2 663

Табл. 4. Р — показатель ответственности в работе и Д — показатель дисциплины.

В какой из таблиц более устойчивое сочетание признаков? Рассчитаем энтропию по формуле (8)

E= -Y JP.,1OZP,’ где Р,Г

(Например, для табл. 3 Р,} = ZOOJ = 0,041.)

В табл. 3 Е = 0,926; в табл. 4 Е = 0,764, т. е. в табл. 4 более устойчивые сочетания признаков, или признаки Ри Ддают более устойчивые сочета­ ния, нежели признаки Р и И.

Как было показано в третьей главе, корреляционный анализ сопря­ женности признаков РИ говорит о том, что И является ведущей характе­ ристикой, от колебаний которой зависят колебания Р, но не наоборот. Однако между Р и Д корреляционной зависимости почти но наблюдается.

Расчет энтропии имеет смысл, в частности, для того, чтобы более надежно оперировать значениями средних распределений. К сожалению, социологи очень редко применяют этот показатель.

Рассуждения, которые проводятся для характеристики качественных признаков, могут быть отнесены и к количественным, но критерии, при­ меняемые к количественным признакам, только иногда (после достаточ­ ного обоснования) могут быть отнесены к качественным.

2. Оценки характеристик генеральной совокупности по выборочным характеристикам и проверка гипотез

Сказанное выше относилось к описательной статистике. Собственно статистические проблемы возникают тогда, когда мы хотим распростра­ нить наши выводы о распределениях, средних, дисперсиях и т. д. в выбор­ ке на генеральную совокупность (проблема репрезентативности данных выборочного анализа) и когда мы начнем изучать зависимости между признаками, т. с. выявлять закономерные связи.

Рассмотрим прежде всего группу задач, связанную с оценкой репре­ зентативности выборки и статистической обоснованности вывода.

Оценка с помощью доверительных интервалов

Постановка задачи. Из выборочных данных мы получаем среднее зна­ чение некоторого признака х. Но генеральную совокупность характеризу­ ет (или ей присуще) некоторое неизвестное нам среднее значение при-

знака а. Считан, а равным х мы не имеем права, поскольку выборочные характеристики рассеиваются около генеральных, значит, Jr будет более или менее близко по значению к а. Но такая точечная (единичная) оцен­ ка мало определенна. Мы должны указать степень точности и надежности этой оценки, что можно сделать с помощью доверительного интервала: указываем интервал с, х + с), для которого вероятность (она называ­ ется доверительной вероятностью) т. ни. что он покроет неизвестный пара­ метр, равна заданной величине 1 -q.

Решение. 1) Доверительный интервал для оценки генеральной сред­

ней

 

 

 

x - t н

S

<a<x+t<7 л-1,

(9)

■Jn- 1

 

 

 

где tqn_! находится из таблицы «Распределение Стьюдента» для довери­ тельной вероятности Р = \—q и числа степеней свободы / = л-1. Число степеней свободы определяется объемом выборки без числа ограничений, имеющих место в данной формуле. В данном случае/ = л-1. Понимать это неравенство надо так: вероятность того, что а будет содержаться в этом интервале, равна 1—q, например 0,95, т. е. в 95% выборок интервалы будут содержать а, вероятность ошибки такого неравенства равна уровню значи­

мости q =

1

0,95 = 0,05'.

Если л достаточно большое (л > 30), то

( . = /

=

1,98 для q = 0,05 или / . = 2,56 для q = 0,01.

qfft-\

я

 

Я*~1

Пример. Доверительный интервал для средней по зарплате таков: для Р= 0,95

91,6-1,0 < а < 91,6 + 1,0

90,6 < а < 92,6

Значит, по нашему выборочному распределению заработной платы мы можем ожидать, что средняя зарплата для рабочей молодежи находит­ ся в этом интервале с вероятностью 95%.

2) Доверительный интервал для генеральной доли Н

(|0)

Пример. В группе ручного неквалифицированного труда 254 человека, доля женщин — 0,366. Этот интервал для генеральной доли будет равен:

0,366-1,98V 254

<0,336+1,98 V 254

0,366-0,028<Я<0,366+0,028

0,338<Я<0,394

1 3 социальных исследованиях обычно принимают уровень значимости, рав­

ный 0,05. Значимость на уровне 0,01 излишне строга.

Отсюда, если группа ручного неквалифицированного труда будет со­ стоять, например, из 2000 человек, то число женщин в генеральной со­ вокупности будет равно некоторой величине в интервале

(0,338

2000; 0,394

2000), т.е. (676; 788) человек.

Большой круг задач требует сравнения двух характеристик. Например, нужно выяснить, можно ли считать, что природа различий в значениях характеристик случайна или различие между значениями настолько вели­ ко, что не может быть объяснено случайностью.

Сравниваем две вероятности

 

 

 

Постановка задачи. Пусть найденные частности равны

1 —hi.

и

п *т.е.

г'~п 9

 

какой-то признак в группе из я, человек встретился к,

раз, а в другой

группе из п2 человек он встретился к2раз. На самом же дело генеральным совокупностям присущи некоторые неизвестные вероятности ру и р2соот­ ветственно. Предположим, что оказалось А, > hT. Какова должна быть раз­ ность ht - h2, чтобы, исходя из выборочных данных, можно было счи­ тать, что р, >р2, т. е., что вероятность встретить признак в совокупности 1 больше, чем в совокупности 2?

Решение. Одним из способов проверки подобных предложений явля­ ется критерий х2 (хи-квадрат) для сравнения двух вероятностей

(/» ,-/г2) Ч « г ( и ,+ « 2- 1)

 

 

 

(*,+*,)(/!,+/!, -

Л

,

(11)

Если рассчитанное значение у} превзойдет значение 3,89, мы делаем заключение с доверительным уровнем 5%, что различие между частостя­ ми значимо. Доверительный уровень 5% соответствует мере возможной ошибочности такого заключения. Соответственно для доверительного уров­ ня 1% подсчитанное значение должно превосходить 6,63.

Значения 3,89 и 6,63 брались из таблицы «Распределение %2» с числом степеней свободы 1 и доверительной вероятностью 0,95 и соответственно 0,99.

Пример. Часто возникает необходимость такого рода проверки: удовлетво­ ренных работой в нашей выборке оказался 1091 человек, неудовлетворен­ ных — 421; на вопрос «Довольны ли вы размером заработной платы?» из 1091 человека, в целом удовлетворенного работой, 209 указали, что они не удовлетворены размером заработной платы: из 421 человека, в целом не удовлетворенного работой, недоволен размером заработной платы 191 ра­ бочий, т.е.

/2=209=0,191;/,=0,461. 1 1091

Можно ли на основании этих данных сделать вывод, что не удовлет­ воренные работой в целом чаще отмечают неудовлетворенность заработ­ ком, нежели удовлетворенные работой, значимо ли различие в наблюда­ емых частостях?

2_ 0,2702 -109142 !•(1091+421-1)

Х(209+194)( 1091+421-209-194-1)

Проверка указывает на то, что такой вывод можно сделать — раз­ личие значимо.

Оценка исходных данных по %2—одна из наиболее распространенных в конкретно-социологических исследованиях. Это наиболее простая фор­ ма определения статистической обоснованности вывода о наличии связи между двумя характеристиками (мы ее также широко использовали)1.

Однако данный критерий не указывает ни направление, ни величину (степень) тесноты связи. Более эффективным является корреляционный анализ.

Сравнение выборочной средней с генеральной

Постановки задачи. Производится выборка из генеральной совокуп­ ности со средним значением а. Выборочная средняя получилась равной х. Существенна ли разница а —х, не было ли тенденциозности при отборе?

Решение. Критерием проверки служит нормированная разность

Т=

х -а \

( 12)

о

где оа= ^ если мы знаем генеральную дисперсию о2, в противном случае

S

заменяем аона ^ , где S 2— выборочная дисперсия, п—объем выборки

Величина Т распределена по нормальному закону, и вероятность того, что она превысит значение 1,96, равна 0,05, а вероятность того, что эта величина превысит значение 2,58, равна 0,01.

Например. У нас есть распределение по заработной плате рабочей молодежи на заводе «Электросила».

Таблица 5

Средний заработок,

38

50

70

90

1 1 0

135

175

Итого

руб.) JC,

 

 

 

 

 

 

 

 

Всей рабочей моло­

 

 

 

 

 

 

 

2698

дежи (человек) п. 1

28

106

390

1274

485

337

78

Молодежи, попав­

 

 

 

 

 

 

 

 

шей в выборку

 

14

47

58

57

33

7

2 2 2

(человек)

6

о = 97,13; 1 = 96,16.

В этом

 

97,13-96,16

_

 

 

 

случае Т=

- 0,56 < 1,96 — разница

незначима.

 

 

 

1,68

 

 

 

 

 

 

 

 

 

 

 

 

различных вариантах применения критерия х2 см-: Ф- М ил л с . Статистичес­

кие методы. С. 59.

Проверка гипотезы о равенстве двух средних по выборкам большого объема

Постановка задачи. Мы имеем две выборки. В одной из них среднее значение некоторого признака х, в другой — среднее значение этого же признака.у. В общем случае х = у. Можно ли считать, что разница междух и у несущественна и, следовательно, выборки принадлежат к одной и той же генеральной совокупности -или же разница существенна и, значит, выборки принадлежат к разным совокупностям, которые отличаются по средней величине признака?

Решение. Критерием проверки этой гипотезы — разность несущественна

служит нормированная разность

х

Т= 7

о

(13)

У -*

ч

которая распределена так, что вероятность, что Т превысит 1,96, равна 0,05 и вероятность Т > 2,58 равна 0,01. распределена по нормальному закону; х, у — выборочные средние.) В этой формуле

где пх — объем первой выборки; пу — объем второй выборки; ст -

генеральная дисперсия в первой совокупности; CJ2v — генеральная дис­

персия во второй совокупности.

Если мы не знаем генеральных дисперсий, то оцениваем их по выбо­

рочным дисперсиям S 2 и S 2

Пример. Рассмотрим две группы рабочих — удовлетворенных специ­ альностью и не удовлетворенных ею. Есть предположение, что удовлетво­ ренность специальностью связана со стажем. Проверим это предположе­ ние, сравнив средние значения стажа удовлетворенных и не удовлетво­ ренных специальностью людей.

Таблица 6

Связь между стажем работы и удовлетворенностью специальностью

Стаж по специаль­

0,40

0,75

 

 

4,00

7,50

12,50

Итого

ности (в годах)

2 , 0

0

Удовлетворенные

 

 

 

 

 

 

 

 

специальностью

 

 

 

 

 

 

84

 

(человек) (пх)

49

52

191

158

233

767

Не удовлетворенные

 

 

 

 

 

 

 

 

специальностью

14

 

 

 

 

 

 

 

(человек) (//,.)

18

6 6

 

47

58

13

216

х = 5,05 года

S] = 13,04

= 0,0117

у = 4,34 года

S] =

s i

 

10,43

= 0,048

 

т_

5,05-4,34

no

 

1

7

— Z , / o .

 

 

V0,017+0,048

Поскольку Г = 2,78 > 2,58, то разница по стажу существенна. Можно считать, что для удовлетворенных специальностью стаж по специальности в среднем выше, чем для неудовлетворенных.

Проверка гипотезы о равенстве двух средних по выборкам малого объема (п < 100 единиц наблюдения)

В этом случае постановка задачи аналогична предыдущей, но способ проверки иной, ибо для данного случая предыдущий способ недостаточ­ но точен. Критерием проверки служит величина

, =_ J z Z

L

n n v( nx+nv- 2)

 

(14)

yjn S '+2

n vSl

ПX+ 7 2

V

Эта величина распределена по закону Стьюдента с числом степеней свободы/ = пх + пу 2, т. е. вероятность того, что t > tq/ равна q. Величина уберется из таблицы «Критерий Стьюдента. Доверительные границы для /с/степенями свободы». Например, при/ = 30 вероятность, что / превы­ сит величину 2,042, равна 0,05, а 0,01 — это вероятность, что t превысит величину 2,750.

Вообще этим критерием лучше пользоваться и при недостаточно боль­ ших объемах выборки, поскольку обычно распределения не удовлетворя­ ют требованиям, предъявляемым к предыдущему критерию.

Пример. Имеем две профессиональные группы, различные по содержа­ нию труда, проверяем, различаются ли эти группы по уровню образования.

Таблица 7

Различия в уровне образования двух групп по содержанию

Образование

1 -я группа

2 »

класса4

5—6классов

9-7классов

1-011

классов

Среднее техническое 1

Незакончен­ ноевысшее

Высшее

1п,

 

S 2

 

 

 

 

 

 

 

 

 

 

X

0

3

17

14

1 1

1

46

чел.

9,4

2 , 8 8

1

6

24

1

2

7

2

52

чел.

8 , 8

3,09

 

 

9,4-8,8

 

1( 46+52-2 >46^52 м

 

 

 

 

746-2,88+52-3,09 V

46+52

 

 

 

 

Соседние файлы в папке книги