Лекция-Корреляция-
.docxЛЕКЦИЯ КОРРЕЛЯЦИЯ
Понятия корреляции и регрессии впервые появились в работах К. Пирсона и Ф. Гальтона. Последний, исследуя зависимость между ростом родителей и их детей, выявил «регрессию к среднему» − рост у детей, чьи родители высокого роста, имел тенденцию
«возвращаться» к средней величине.
Определение. Если изменение одной величины влечет за собой изменение распределения другой величины, то такая их зависимость называется статистической.
Определение. Если статистическая зависимость такова, что изменение одной величины влечет за собой изменение среднего значения (т.е. условного математического ожидания) другой величины, то она называется корреляционной зависимостью.
Определение. Условным
средним yx называют среднее арифметическое наблюдавшихся значений Y, соответствующих X x .
Определение. Условным средним
xy называют среднее
арифметическое наблюдавшихся значений X , соответствующих Y y .
Определение. Уравнение yx y yx x x
называется выборочным уравнением регрессии
*
Y на X , где yx rB xy* xxy x y2 x −
выборочный коэффициент регрессии, а его график − выборочной линией регрессии Y на X .
Определение. Уравнение xy x xy y y называется выборочным уравнением регрессии
X на Y , где xy rB *xy* yxy x y2 y −
выборочный коэффициент регрессии, а его график − выборочной линией регрессии X на Y .
Замечание. Выборочный коэффициент корреляции rB − это оценка степени тесноты линейной связи величин X и Y , а также величины x* и *y − выборочные средние квадратические отклонения вычисляются по
2 2
формулам: x* x2 x , *y y2 y ,
xy x y rB * * .
x y
Свойства выборочного коэффициента корреляции:
Коэффициент корреляции принимает значения на отрезке 1;1, чем ближе rB к единице, тем теснее связь.
Если все значения переменных увеличить или уменьшить на одно и то же число или в одно и то же число раз, то величина выборочного коэффициента корреляции не изменится.
При значениях rB 1 корреляционная связь представляет собой линейную функциональную зависимость. При этом выборочные линии регрессии Y на X и X на Y совпадают, и все наблюденные значения располагаются на одной общей прямой.
При значении rB 0 линейная корреляционная связь
отсутствует. При этом yx xy , а линии выборочной регрессии параллельны осям координат.
После нахождения выборочных уравнений линий регрессии следует проверить нулевую гипотезу об отсутствии линейной корреляционной связи между переменными. Для этого выполняют следующие шаги:
Вычисляют наблюдаемое значение критерия
tнабл rB n 2 , который имеет распределение 1 rB2
Стьюдента с k n 2 степенями свободы.
Вычисляют по таблице (приложение 4) критическое значение критерия tкрит t1 ;k, где − уровень значимости.
Решение принимают после сравнения найденных значений. Если tнабл tкрит, то нулевая гипотеза отвергается, а это значит, что выборочный коэффициент корреляции значимо отличается от нуля и выявленная линейная корреляционная зависимость не является следствием случайного отбора переменных в выборку.
Пример. Дана корреляционная таблица. Найти выборочный коэффициент корреляции, выборочные уравнения регрессии 𝑋 на 𝑌 и 𝑌 на 𝑋. Проверить гипотезу об отсутствии линейной корреляционной связи между переменными.
Решение. Сначала вычислим компоненты выборочных
k
x ni i
коэффициентов |
регрессии, а именно: x i1 , n |
l y nj j
y j1 , n l y n2 |
k l k x y ni j ij x ni2 i
xy i 1 j 1 , x2 i1 , n n |
y2 j1 , rB xy x y2 2 . Для этого n x2 x y2 y
расширим исходную таблицу следующим образом:
Откуда получаем следующие значения: x 64,89,
25,68, 76
xy 1713,87,
x2 472 16572 22672 10772 18872 10 4396,37,
76
2 202 13232 19262 19 292 13322 12 675,21, y
76
x* 4396,3764,892 13,626 и
*y 675,2125,682 3,968, rB 1713,87 64,89 25, 68 0,8784,
13,626 3,968
xy 0,8784 3,02 и
yx 0,8784 0,26.
Следовательно:
xy 64,89 3,02y 25,68 − уравнение выборочной регрессии X на Y ;
yx 25,68 0,26x64,89 − уравнение выборочной регрессии Y на X .
Выборочный коэффициент корреляции получился близким к единице, проверим, случайно это или нет.
Наблюдаемое значение критерия tнабл 0,8784 762 15,81.
2
10,8784
Критическое значение tкрит t1 0,05;741,99. Так как
15,81 1,99, то гипотезу о случайности линейной корреляционной связи между переменными следует отбросить, т.е. коэффициент корреляции значимо отличается от нуля.
САМОСТОЯТЕЛЬНО. По корреляционной таблице, приведенной ниже, найти выборочный коэффициент корреляции.
RB 0,85
КОНЕЦ ЛЕКЦИИ