Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Учебное пособие 400172.doc
Скачиваний:
14
Добавлен:
30.04.2022
Размер:
2.04 Mб
Скачать

Задача 5. Построение корреляционного поля

Постройте корреляционное поле. Нанесите линию эмпирической регрессии на корреляционное поле. Сделайте выводы.

Методика решения

Поле корреляции ‑ это поле точек, на котором каждая точка соответствует единице совокупности; ее координаты определяются значениями признаков х и у.

Для построения корреляционного поля используют неупорядоченные данные. На рис. 6 представлены основные типы корреляции между двумя переменными.

По характеру расположения точек на поле корреляции делают вывод о наличии или отсутствии связи, о характере связи (линейная или нелинейная, прямая или обратная).

В некоторых случаях зависимость между признаками проявляется сильнее при нанесении линии эмпирической регрессии, построенной по сгруппированным данным.

Рис. 6. Основные типы корреляции

Для этого необходимо использовать данные аналитической группировки (Задание 4, табл. 6). По оси Х откладываются интервалы и отмечаются середины интервалов ( ). Затем для каждого интервала строится точка с координатами ( ; ), где ‑ групповые средние значения y из аналитической группировки. После чего построенные точки соединяются прямыми отрезками. Полученный график и будет эмпирической линией регрессии (рис. 7).

П оскольку объекты в составе выборочной совокупности считаются независимыми, точки на графике не соединяют линями.

Рис. 7. Поле корреляции и эмпирическая регрессия

По внешнему виду графика можно выявить возможный характер взаимосвязи между признаками и оценить погрешность построения уравнения регрессии.

Задача 6. Построение уравнения регрессии

Постройте уравнения регрессии Y(X), Z(X), Z(X) графическим способом.

Методика решения

При построении линии регрессии на корреляционном поле проводят линию регрессии с помощью линейки, «на глаз» - по местам «сгущения» точек. Отдельные точки, далеко отстоящие от «облака рассеяния» (аномальные данные), игнорируют (рис. 8).

На линии регрессии выбирают две точки, ближе к краям диапазона значений. Составляем систему уравнений ‑ два уравнения с двумя неизвестными:

Р ис. 8. Графическое построение уравнение регрессии

Решая систему, получаем оценки неизвестных коэффициентов и . Затем записываем уравнение регрессии, подставляя найденные коэффициенты:

.

Задача 7. Вычисление линейных коэффициентов корреляции

Вычислите линейные коэффициенты корреляции , и . Сделайте вывод о тесноте линейной связи между признаками.

Методика решения

Л инейный коэффициент корреляции вычисляется следующим образом:

или

К оэффициент парной корреляции измеряется от -1 (случай полной обратной связи) до 1 (случай полной прямой связи). По абсолютной величине:

≤1. Чем ближе значение к единице, тем теснее связь, чем ближе к нулю, тем слабее связь.

При < 0,3 связь считается слабой, при 0,3 < < 0,7 – средней, при > 0,7 ‑ сильной, или тесной.

Коэффициент корреляции ‑ симметричная мера связи, т.е. это мера взаимосвязи между х и у. Поэтому = .

Задача 8. Проверка существенности коэффициентов корреляции

После определения коэффициентов корреляции , и . необходимо проверить их существенность.

Методика решения

Вычисление выборочного коэффициента корреляции осуществляется на основе выборочных данных, т.е. r является статистикой или оценкой некоторого параметра. Таким параметром, очевидно, будет генеральный коэффициент корреляции (ρ), вычисляемый на основе всех значений генеральной совокупности.

Выборочный коэффициент корреляции r, как правило, вычисляется по данным малых выборок (n < 30). Ввиду случайных причин значение r может существенно отличаться от генерального коэффициента корреляции ρ. Например, может возникнуть ситуация, когда линейной корреляции нет (т.е. истинное значение ρ=0), а по выборочным данным значение r существенно отличается от нуля.

Так на рис. 9 представлено корреляционное поле генеральной совокупности, где разброс точек явно отражает отсутствие линейной связи. Однако в выборку попали точки, которые расположены практически на одной прямой, имеющей положительный наклон. Поэтому следует ожидать, что выборочный коэффициент корреляции будет близок к единице.

В этой связи для выборочного коэффициента корреляции r необходима оценка существенности, или статистической значимости. Она заключается в том, что проверяются гипотезы:

(линейная связь между X и Y отсутствует);

(линейная связь между X и Y существует).

,

Рис. 9. Геометрическое представление выборки искажающей истинное значение

генерального коэффициента корреляции: ρ=0, r=1

При n < 30 проверку нулевой гипотезы можно производить с помощью t-критерия:

,

где r – наблюдаемое (выборочное) значение коэффициента корреляции;

ρ=0 – гипотетическое значение генерального коэффициента корреляции; - оценка стандартной ошибки коэффициента корреляции, т.е. стандартного отклонения распределения выборочных коэффициентов корреляции.

Величина вычисляется по формуле

Отсюда величина t-критерия примет вид

где r – выборочный коэффициент корреляции; n – объем выборки.

Известно, что t-критерий имеет распределение, близкое к t-распределению Стьюдента, соответствующему n-2 степеням свободы. При заданном уровне значимости α критическим значением будет величина .

Если , то коэффициент выборочной корреляции будет существенным, или значимым

Рассмотрим пример. Пусть, исследуя тесноту линейной связи между X (затраты на рекламу) и Y (объем продаж), мы рассчитали коэффициент корреляции: r=0,843, при объеме выборки n=10. Вычислим t-критерий:

Пусть α=0,05. Из табл. прил. 4 найдем критический предел =2,306. Ввиду того, что 4,44>2,306, нулевая гипотеза о равенстве генерального коэффициента корреляции нулю отвергается с уровнем значимости 5 %.