- •Виды дисперсий Правило сложения дисперсий
- •Эмпирическое корреляционное отношение
- •Правило сложения дисперсий для доли признака
- •Показатели дифференциации и концентрации Показатели дифференциации
- •Показатели концентрации
- •Показатели формы распределения
- •Моменты распределения
- •Начальные моменты
- •Условные моменты
- •Центральные моменты
- •Показатели асимметрии распределения
- •Показатели крутизны распределения
- •Кривые распределения
- •Критерий согласия Романовского
- •Критерий согласия Колмогорова
Теория для выполнения лабораторной работы № 2
Оглавление
Виды дисперсий 1
Показатели дифференциации и концентрации 8
Показатели дифференциации 8
Показатели концентрации 10
Показатели формы распределения 12
Моменты распределения 12
Показатели асимметрии распределения 14
Показатели крутизны распределения 15
Кривые распределения 16
Нормальное распределение 16
Распределение Пуассона 18
Критерии согласия 18
Виды дисперсий Правило сложения дисперсий
Если статистическая совокупность разбита на группы по какому-либо признаку, то вариация признака в целом по совокупности зависит и от
вариации признака внутри каждой группы,
межгрупповой вариации (от вариации групповых средних).
Т.е. общую дисперсию можно получить на основе её составляющих. Рассмотрим представленное в общем виде распределение исходной совокупности, представленное в таблице 27. Исходная совокупность делится на m однородных групп по одному признаку.
Таблица 1. Представленное в общем виде разбиение исходной совокупности на однородные группы
Значение признака xi |
Число единиц в j-й группе |
Итого |
|||
1 |
2 |
… |
j |
||
X1 |
N11 |
N12 |
… |
N1m |
N11+ N12+…+ N1j = n1 |
X2 |
N21 |
N22 |
… |
N2m |
N21+ N22+…+ N2j = n2 |
… |
… |
… |
… |
… |
… |
xk |
Nk1 |
Nk2 |
… |
Nkm |
Nk1+ Nk2+…+ Nkj = nk |
Итого |
N1 |
N2 |
… |
Nm |
N |
Среднее значения признака в каждой группе равно:
На основе частных средних определяется общая средняя:
где
Общая дисперсия совокупности ( ) отражает вариацию признака за счёт всех условий (факторов), которые действуют в данной совокупности.
Межгрупповая дисперсия ( ) отражает вариацию между группами за счёт признака-фактора, положенного в основу группировки. Вычисляется межгрупповая дисперсия по отклонениям групповых средних от общей средней.
Частная групповая дисперсия ( ) отражает вариацию внутри каждой группы изучаемой совокупности. Вычисляется как средний квадрат отклонений значений признака x от частной средней .
и т.д.
Т.е. в общем виде частная дисперсия выражается так:
где
Nij – частоты i-го признака (i=1÷k) в каждой j группе.
Так как рассматриваемая совокупность разбита на группы, то для всей совокупности внутригрупповую вариацию отражает внутригрупповая дисперсия ( ). Она высчитывается как средняя арифметическая из групповых дисперсий.
Между представленными видами дисперсий существует соотношение: общая дисперсия равна сумме внутригрупповой дисперсии (средней из групповых дисперсий) и межгрупповой дисперсии (дисперсии частных средних):
Это равенство называется правилом сложения дисперсий. Первое слагаемое измеряет вариацию внутри частей совокупности, второе слагаемое – вариацию между средними этих частей.
Эмпирическое корреляционное отношение
Эмпирический коэффициент детерминации ( ) показывает, какая доля в общей дисперсии приходится на дисперсию, обусловленную вариацией признака, положенного в основу группировки:
Эмпирическое корреляционное отношение ( ) показывает, как связаны исследуемое явление и группировочный признак.
Эмпирическое корреляционное отношение принимает значение от 0 до 1.
Если и соответственно , то все групповые средние равны между собой и межгрупповой вариации нет. Следовательно, группировочный признак не влияет на вариацию признака.
Если и соответственно , то внутригрупповой вариации нет. Следовательно, группировочный признак полностью определяет вариацию изучаемого признака.
Чем больше приближается к 1, тем сильнее корреляционная связь между признаками.
Таблица 2. Качественная оценка связи между признаками
|
Связь |
0 |
Отсутствует |
0 – 0,2 |
Очень слабая |
0,2 – 0,3 |
Слабая |
0,3 – 0,5 |
Умеренная |
0,5 – 0,7 |
Заметная |
0,7 – 0,9 |
Тесная |
0,9 – 0,99 |
Весьма тесная |
1 |
Функциональная |
Пример 21. В таблице 29 представлены данные заработных платах сотрудников семи магазинов одной сети. Заработная плата сотрудников зависит от внутренних факторов (стаж работы, должность, образование и т.д.) и внешних факторов (территориальное расположение магазина, и как следствие, различная прибыль).
Рассчитать дисперсию, эмпирический коэффициент детерминации и эмпирическое корреляционное отношение и на основании полученных данных сделать вывод о влиянии на заработную плату внешних и внутренних факторов.
Таблица 3. Заработные платы сотрудников
Заработная плата, тыс. руб. xi |
Число сотрудников на магазинов с номерами m = 1÷j ( j=7), чел Nij |
Итого |
||||||
1 |
2 |
3 |
4 |
5 |
6 |
7 |
||
10 - 20 |
11 |
6 |
1 |
5 |
23 |
0 |
0 |
46 |
20 - 30 |
15 |
12 |
45 |
26 |
64 |
13 |
7 |
182 |
30 - 40 |
17 |
22 |
29 |
4 |
45 |
32 |
12 |
161 |
40 - 50 |
0 |
4 |
13 |
1 |
15 |
27 |
15 |
75 |
50 - 60 |
0 |
3 |
2 |
0 |
3 |
18 |
0 |
26 |
Итого |
43 |
47 |
90 |
36 |
150 |
90 |
34 |
490 |
Решение можно разбить на три этапа.
Вычисление дисперсии заработной платы для каждого магазина.
Таблица 4. Вспомогательная таблица для вычисления дисперсии заработной платы первого магазина
Заработная плата, тыс. руб. xi |
Число сотрудников, чел mi |
Середина интервала, xiср |
( =26,4) |
|
|
10 - 20 |
11 |
15 |
-11,4 |
125,4 |
1429,56 |
20 - 30 |
15 |
25 |
-1,4 |
21 |
29,4 |
30 - 40 |
17 |
35 |
8,6 |
146,2 |
1257,32 |
40 - 50 |
0 |
45 |
18,6 |
0 |
0 |
50 - 60 |
0 |
55 |
28,6 |
0 |
0 |
Итого |
43 |
|
|
292,6 |
2716,28 |
26,395
Среднее линейное отклонение:
6,804 тыс. руб.
Дисперсия:
63,169
Сведение полученных данных со всех магазинов в одну таблицу.
…
Таблица 5. Сведение данных о дисперсиях заработных плат всех магазинов в одну таблицу
Номер магазина |
Средняя заработная плата, тыс. руб
|
Число сотрудников, чел
|
Дисперсия заработной платы
|
1 |
26,395 |
43 |
63,169 |
2 |
32,021 |
47 |
101,766 |
3 |
31,667 |
90 |
66,667 |
4 |
25,278 |
36 |
36,034 |
5 |
29,067 |
150 |
86,796 |
6 |
40,556 |
90 |
93,580 |
7 |
37,353 |
34 |
59,170 |
Итого |
|
490 |
|
Вычисление дисперсии, эмпирического коэффициента детерминации и эмпирического корреляционного отношения.
Средний размер заработной платы по всем магазинам:
=(26,39543 + 32,02147 + 31,66790 + 25,27836 + 29,067150 + 40,55690 + 37,35334)/490 = 32,003 тыс. руб.
Межгрупповая дисперсия характеризует вариацию средней заработной платы по магазинам, обусловленную особенностями данного магазина, т.е. внешними факторами.
= [(26,395 - 32,003)243 + (32,021 - 32,003)247 + (31,667 - 32,003)290 +
+ (25,278 - 32.003)236 + (29,067 - 32,003)2150 + (40,556 - 32.003)290 +
+ (37,353 - 32,003)234] / 490 = 24,162
Средняя из групповых дисперсий характеризует вариацию заработной платы, обусловленную всеми факторами кроме особенностей данного магазина (стаж работы, должность, образование и т.д.), т.е. внутренними факторами.
=(63,16943 + 101,76647 + 66,66790 + 36,03436 +
+ 86,796150 + 93,58090 + 59,17034)/490 = 78,061
Общая дисперсия определяет вариацию средней заработной платы в магазинах, обусловленную влиянием всех факторов.
102,223
Эмпирический коэффициент детерминации показывает отношение межгрупповой дисперсии к общей.
0,236
Полученный эмпирический коэффициент детерминации показывает, что дисперсия заработной платы зависит от того, в каком магазине сотрудник работает, на 23,6%. А остальные 76,4% зависят от внутренних факторов самих магазинов (стаж работы, должность, образование и т.д.).
Эмпирическое корреляционное отношение
0,486
показывает, что существует умеренная связь между территориальным размещением магазина и заработной платой его сотрудников.