496421001292597074матем
.pdfТема: Кореляція та регресія
Матеріали та обладнання: ЕОМ, пакет програми «Сигма», вихідні дані
для розрахунку.
Загальні відомості
В дослідженнях рідко приходиться мати справу із точними і визначеними функціональними зв’язками, коли кожному значенню ознаки Х відповідає не одне, а декілька можливих значень ознаки У, тобто їх розподіл. Такі зв’язки називають кореляційними.
Для вимірювання тісноти та форми зв’язку використовують спеціальні статистичні методи: кореляцію та регресію.
По формі кореляція може бути лінійною і криволінійною, за напрямком
– прямою і зворотною. Лінійна кореляція і регресія ознаки У на ознаку Х показує, як змінюється в середньому величина У при зміні величини Х. Якщо при збільшені ознаки Х величина У в середньому збільшується, то кореляція і регресія називається позитивною або прямою, а якщо із збільшенням ознаки Х значення ознаки У зменшується то кореляцію і регресію називають негативною або зворотною. Кореляцію і регресію називають простою, якщо вивчається зв'язок між двома ознаками, і множиною, якщо вивчається залежність між трьома і більше ознаками.
Числовий показник простої лінійної кореляції, який вказує на силу та напрямок зв’язку Х із У називається коефіцієнтом кореляції. Ця величина немає одиниць вимірювання, змінюється в межах від – 1 до + 1. Коефіцієнт кореляції розраховують за формулою:
r = (X-x)(У-у)/ |
|
(Х-х)2 (У-у)2 |
|
Якщо коефіцієнт кореляції менше 0,3, то кореляційна залежність між ознаками слабка. Якщо він знаходиться в межах від 0,3 до 0,7, то кореляційна залежність середня, а якщо більше 0,7 – сильна.
Коли коефіцієнт кореляції дорівнює нулю то між ознаками Х і У немає лінійного зв’язку, але криволінійна залежність може існувати.
Число, яке показує. в якому напрямку та на яку величину в середньо - му ознака У змінюється при зміні ознаки Х на одиницю вимірювання називається коефіцієнтом регресії. Коефіцієнт регресії розраховують за форму-
лою:
вух = (Х-х)(У-у)/ (Х-х)2
Для оцінки надійності коефіцієнта кореляції вираховують його похибку та критерій достовірності.
Похибка коефіцієнта кореляції:
Sr = 1-r2/n-2,
де: r – коефіцієнт кореляції;
n-2 – число ступенів свободи.
Критерій достовірності коефіцієнта кореляції: tr = r/Sr,
де: Sr – похибка коефіцієнта кореляції
Якщо trф>trт, то кореляційний зв'язок суттєвий, а коли trф<trт – то не суттєвий
Кореляційний та регресійний аналіз
Хід роботи Потрібно встановити зв'язок між ознаками Х (відносна вологість грун-
ту) та У (липкість) Результати спостережень
№ |
Х,% |
У,г/см2 |
Х2 |
У2 |
ХУ |
1 |
32,7 |
1,7 |
1069,29 |
2,89 |
55,59 |
2 |
38,9 |
1,8 |
1513,21 |
3,24 |
70,02 |
3 |
42,5 |
1,9 |
1806,25 |
3,61 |
80,75 |
4 |
44,3 |
2,3 |
1962,49 |
5,29 |
101,89 |
5 |
49,8 |
3,0 |
2480,04 |
9,00 |
149,40 |
6 |
52,7 |
3,8 |
2777,29 |
14,44 |
200,26 |
сума |
260,9 |
14,5 |
11608,57 |
38,47 |
657,91 |
|
|
Допоміжні величини: |
|
|
(Х-х)2 = Х2-( Х )2/n = 11608,57-(260,9)2/6 = 355,77
(У-у)2 = У2-( У )2/n = 38,47-(14,5)2/6 = 3,43
(Х-х)(У-у) = ХУ-( Х У )/n = 657,91-(260,9x14,5)/6 = 27,4
Коефіцієнт кореляції: r = 27,4/ 355,77x3,43 = 0,78
Коефіцієнт регресії:
вух = 27,4/355,77 = 0,08
Похибка коефіцієнта кореляції: Sr = 1-0,782/6-2 = 0,31
Критерій достовірності коефіцієнта кореляції: trф = 0,78/0,31 = 2,44
trт05 = 0,811
Висновок: кореляційна залежність між ознаками сильна, кореляційний зв'язок суттєвий так, як trф>trт.
Контрольні запитання Для закріплення теми студенти виконують завдання
Лабораторна №13 Тема:
Визначення коефіцієнта множинної лінійної кореляції
Основні відомості.
Множинний коефіцієнт кореляції трьох змінних – це показник тісного лінійного зв’язку між однією із ознак і сукупністю двох інших ознак.
Розраховується за формулою:
Ryzx=r2xy+ryz2 – 2ryx*rxz*ryz/1 – r2xz
Ця формула дозволяє розраховувати множинний коефіцієнт кореляції при відомих значеннях парних коефіцієнтів кореляції rxy , rxz і ryz.
Коефіцієнт R не може бути від’ємним і завжди знаходиться в межах від 0 до 1. При наближення R до одиниці ступінь лінійного зв’язку трьох ознак збільшується.. Між коефіцієнтом множинної кореляції Ryxz і двома коефіцієнтами парної кореляції ryx і ryz існує наступне співвідношення: кожен
зпарних коефіцієнтів не може перевищувати по абсолютній величині Ryxz/ Квадрат коефіцієнта множинної кореляції R2 називають коефіцієнтом
множинної детермінації. Він показує частку варіації залежної змінної під впливом досліджуваних факторів.
Значення множинної кореляції оцінюють по F – критерію (критерій істотності)
F= |
R*R |
( |
n k |
), |
|
|
|||
1 R*R |
|
k 1 |
де n – об’єм вибірки; k – число ознак.
Теоретичне значення F – критерію беруть з таблиці, для V1=K-1 V2=n-K ступенів свободи і працюючого рівня значимості. Нульова гіпотеза про рівність множинного коефіцієнта кореляції в сукупності нулю приймається, і якщо Fср< Fт, і відхиляється, якщо Fср Fт