Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Эконометрика-методичка для заочников.doc
Скачиваний:
76
Добавлен:
18.11.2019
Размер:
5.91 Mб
Скачать

Коэффициент корреляции рангов

К мерам тесноты парной связи относится предложенный Спирменом коэффициент корреляции рангов. Ранги – это порядковые номера единиц совокупности в ранжированном ряду. Если проранжировать совокупность по двум признакам, связь между которыми изучается, то полное совпадение рангов означает максимально тесную прямую связь, а полная противоположность – максимально тесную обратную связь. Ранжировать оба признака необходимо в одном и том же порядке либо от меньших значений признака к большим, либо наоборот. Если ранги единиц совокупности по признакам X и Y обозначим как Px, Py, то коэффициент корреляции рангов равен:

(2.18)

– средние ранги в ряду натуральных чисел от 1 до n. Причём они равны: , а знаменатель формулы есть:

.

Обозначим: di = PxPy, тогда:

– формула Спирмена (2.19)

Преимущество коэффициента корреляции рангов состоит в том, что ранжировать можно и по таким признакам, которые нельзя выразить числами. Пример: умение руководить коллективом , по личному обаянию.

Недостаток – одинаковым разностям ранга могут соответствовать совершенно отличные разности значений признаков (в случае количественных признаков). Если среди значений признаков х и у встречается несколько одинаковых, образуются связанные ранги, т.е. одинаковые средние номера. Тогда коэффициент Спирмена вычисляется по формуле:

(2.20)

где ,

j – номер связок по порядку для признака х;

k – номер связок по порядку для признака у;

Aj число одинаковых рангов в j – той связке по х;

Bk число одинаковых рангов в k – той связке по у.

Пример 2.1.

Пусть по 10 однотипным предприятиям имеются следующие данные о выпуске продукции (х) в тыс. ед. и о расходе условного топлива (у) в тоннах (графы 1 и 2 таблицы).

Требуется найти уравнение зависимости расхода топлива от выпуска продукции (или уравнение регрессии у по х) и измерить тесноту зависимости между ними.

Решение.

А. Рассматривая уравнение регрессии в форме линейной функции вида параметры данного уравнения 0 и а1) найдем из системы нормальных уравнений

Таблица 2.1

i

x

y

x2

ху

y2

1

2

3

4

5

6

1

5

4

25

20

3,9

16

2

6

4

36

24

4,4

16

3

8

6

64

48

5,5

36

4

8

5

64

40

5,5

25

5

10

7

100

70

6,6

49

6

10

8

100

80

6,6

64

7

14

8

196

112

8,8

64

8

20

10

400

200

12,1

100

9

20

12

400

240

12,1

144

10

24

16

576

384

14,3

256

Σ

125

80

1961

1218

80

770

Необходимые для решения суммы рассчитаны выше в таблице. Подставляем их в уравнения и решаем систему:

;

Отсюда

Подставляя в это уравнение последовательно значения х= 5, 6, 8, 10 и т.д., получаем выравненные (теоретические) значения результативного показателя (графа 5 таблицы).

Поскольку параметры уравнения регрессии являются оценочными, то для каждого из них рассчитывается средняя ошибка, т.е. .

Конкретный расчет ошибок для а0 и а1 по данным нашего примера приведен далее.

Б. Для измерения тесноты зависимости между у и х воспользуемся прежде всего линейным коэффициентом корреляции (поскольку зависимость рассматривалась линейной):

а) применяем формулу .

Находим, Определяем и , предварительно найдя и :

Отсюда

Значение линейного коэффициента корреляции r = 0,96 (т.е. близкое к единице) характеризует не только меру тесноты зависимости вариации у от вариации х, но и степень близости этой зависимости к линейной;

б) воспользуемся еще одной формулой линейного коэффициента корреляции:

т.е. результат от же.

При расчете коэффициента корреляции очень важно оценить его значимость. Оценка значимости (существенности) линейного коэффициента корреляции основана на сопоставлении значения r с его средней квадратической ошибкой ( ).

Средняя ошибка коэффициента корреляции при п 50 рассчитывается приближенно по формуле

Если при этом коэффициент корреляции r превышает свою

среднюю ошибку больше чем в 3 раза, т.е. если , то он считается значимым, а связь – реальной.

При п 30 значимость коэффициента корреляции проверяется на основе t-критерия Стьюдента. Для этого рассчитывается фактическое (расчетное) значение критерия:

которое сопоставляется , определяемым по таблицам Приложений учебных пособий по эконометрики, для числа степеней свободы и заданного уровня значимости (обычно ).

Если r считается значимым, а связь – реальной. Если , то считается, что связь между х и у отсутствует и значение r, отличное от нуля, получено случайно.

В рассматриваемом примере средняя ошибка коэффициента корреляции

,

А

По таблице Приложения 9 находим, что при числе степеней свободы и уровне значимости табличное (критическое, пороговое) t равно 2,306, т.е. ( = 2,306).

Поскольку фактическое (расчетное) t больше табличного, т.е. , то линейный коэффициент корреляции r=0,96 считается значимым, а cвязь между х и у – реальной.

В. Кроме линейного коэффициента корреляции для измерения тесноты зависимости можно воспользоваться теоретическим корреляционным отношением:

где σ2 и δ2 – дисперсии соответственно теоретических и эмпирических значений результативного показателя. Расчет их показан ниже в таблице.

Таблица 2.2

i

x

y

1

2

3

4

5

6

7

8

9

1

5

4

3,9

-4

16

-4,1

16,81

0,1

0,01

2

6

4

4,4

-4

16

-3,6

12,96

-0,4

0,16

3

8

6

5,5

-2

4

-2,5

6,25

0/5

0,25

4

8

5

5,5

-3

9

-2,5

6,25

-0,5

0,25

5

10

7

6,6

-1

1

-1,4

1,96

0,4

0,16

6

10

8

6,6

0

0

-1,4

1,96

1,4

1,96

7

14

8

8,8

0

0

0,8

0,64

-0,8

0,64

8

20

10

12,1

2

4

4,1

16,81

-2,1

4,41

9

20

12

12,1

4

16

4,1

16,81

-0,1

0,01

10

24

16

14,3

8

64

6,3

39,69

. 1,7

2,89

Σ

125

80

80

130

120,14

10,74

Дисперсия выравненных значений результативного показателя,

или факторная дисперсия, общая дисперсия эмпирических значений результативного показателя теоретическое корреляционное отношение

Рассчитанные показатели позволяют сделать вывод о том, что связь между вариацией результативного показателя (у) и факторного (х) весьма высокая.

Вместо дисперсии выравненных значений у, т.е. δ2, можно воспользоваться остаточной дисперсией. В соответствии с правилом сложения дисперсий можно записать, что , где

тогда

В нашем примере расчет остаточной дисперсии (σ2ост) показан в графах 8 и 9 таблицы: σ2ост = 1,074. Отсюда

.

Остаточная дисперсия, вернее, корень квадратный из нее, т.е. σост, используется для расчета средних ошибок параметров уравнения регрессии. Так, средняя ошибка параметра а0, равна а для а1, равна

Сопоставляя значение параметра с его средней ошибкой, по значению судят о значимости данного параметра. Если число наблюдений п 20, то параметр считается значимым при t 3.

Если n 20, то обращаются к специальном таблицам значений критерия Стьюдента. И в данном случае параметр считается значимым, если .

В рассмотренном примере для уравнения регрессии = 1,16 + 0,547х ошибки параметров

т.е а0=1,16±0,366,

, т.е а1=0,547±0,058.

Чтобы сделать вывод о значимости параметров, находим

и .

Так как п 20, обращаемся к таблице значений t-критерия. Для и находим =2,306. Поскольку t 2,306 и для aо, и для a1, то считаем параметры значимыми.

В приведенных формулах ошибок параметров и | вместо остаточной дисперсии σ2ст можно пользоваться значением линейного коэффициента корреляции, исходя из следующих преобразований:

;

Разделив обе части равенства на получим . Отсюда . Тогда а

Наряду с проверкой значимости отдельных параметров можно оценить значимость уравнения регрессии в целом.

Эта задача решается на основе расчета F-критерия Фишера и сопоставления его с табличным (критическим), F-критерий представляет собой отношение факторной дисперсии ( ) к остаточной ( ), каждая из которых рассчитана на одну степень свободы:

где т – число параметров в уравнении регрессии;

(m-1) – число степеней свободы для факторной дисперсии;

п – число наблюдений;

(n-m) – число степеней свободы для остаточной дисперсии. Часто формула F-критерия записывается в виде

где k – число коэффициентов регрессии, которое на единицу меньше числа параметров, т.е.k = m-1

F – критерий можно рассчитать и через коэффициент корреляции (r или η):

Расчетное F сопоставляется с табличным, определяемым по Приложению 8 для числа степеней свободы и при заданном уровне значимости (например, ).

Если уравнение считается значимым.

Для рассмотренного выше примера

По Приложению 8 находим Fта6л: при и , Fтабл = 5,32.

Так как то уравнение значимо.