Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
статистика 2 модуль.docx
Скачиваний:
3
Добавлен:
28.08.2019
Размер:
348.14 Кб
Скачать

Тема 8. Статистичні методи вимірювання взаємозв'язків.

8.1. Види взаємозв'язків між явищами.

8.2. Метод аналітичного групування. Дисперсійний аналіз.

8.3. Кореляційно-регресійний аналіз.

8.4. Багатофакторна кореляція.

8.5. Рангова кореляція.

8.1. Види взаємозв'язків між явищами.

Всі явища та процеси, що існують в природі та суспільстві, взаємопов'язані, тому вивчення взаємо­зв'язків та причинних залежностей є одним із найваж­ливіших завдань статистики. Причинна залежність є головною формою закономірних зв'язків, проте при­чина сама по собі ще не визначає повною мірою на­слідок; останній залежить також від умов, у яких діє причина. Умови і причини являють собою фактори. Ознака, що характеризує наслідок, називається результативною, а та, що характеризує фактор, -факторною.

Зв'язки між явищами поділяють на функціональні та стохастичні. При функціональному зв'язку кожному можливому значенню факторної ознаки х відповідає чітко визначене значення результативної ознаки у. Графічно вона має такий вигляд:(рис. 7.1.1).

х1 =======> y1

х2=======> у2

х3=======> у3

х4=======> у4

... ... ...

хn========> у4

Рис. 7.1.1. Схематичне зображення функціонального зв'язку.

При стохастичному зв'язку кожному зна­ченню ознаки х відповідає певна множина ознаки у, які варіюють і утворюють ряд розподілу, який нази­вається умовним. Стохастичний зв'язок проявля­ється зміною умовних розподілів. Графічно її можна представити на (рис. 7.1.2).

х 1 =======> y1

х2=======> у2

х3=======> у3

х4=======> у4

... ... ...

хn========> у4

Рис. 7.1.2. Схематичне зображення стохастичного зв'язку.

Прикладом такого зв'язку можна навести залежність між рівнем кваліфікації та продуктивністю праці або залежність між кольором очей та кольором волосся.

Різновидом стохастичного зв'язку є кореляційний зв'язок, коли зі зміною факторної ознаки змінюється середнє значення результативної ознаки.

8.2. Метод аналітичного групування. Дисперсійний аналіз.

У загальних рисах метод аналітичних групувань полягає в тому, що всі елементи сукупності групують за факторною ознакою і в кожній групі обчислюють середні значення результативної ознаки.

За допомогою критерію Стьюдента можна визначити наявність зв'язку та його напрям.

Дисперсійний аналіз дає можливість визначити роль систематичної та випадкової варіації у загальній варіації і тим самим визначити роль фактора, покладеного в основу групування, в зміні результативної ознаки. Для цього використовують правило складання дисперсії, згідно з яким загальна дисперсія дорівнює сумі двох дисперсій: середньої із групових і міжгрупової:

(7.2.1)

Тісноту зв'язку характеризує співставлення міжгрупової дисперсії із загальною. Це відношення називається кореляційним відношенням:

(7.2.2)

Кореляційне відношення змінюється від 0 до 1. Коли міжгрупова дисперсія дорівнює нулю, що мож­ливо лише тоді, коли всі групові середні однакові, тобто коли кореляційний зв'язок між середніми відсутній. Причому міжгрупова дисперсія дорівнює загальній, а середня з групових — нулю. Це означає, що кожному значенню факторної ознаки відповідає єдине значення результативної ознаки, тобто зв'язок між ознаками функціональний.

Перевірку істотності (невипадковості) відхилень групових середніх здійснюють за допомогою статистичних критеріїв, а саме можна використати критерій Фішера, або порівняти фактичне значення η²з критичним (табличним).

У таблиці розподіл залежить від числа ступенів вільності факторної К1 та випадкової К2 дисперсій.

К1 = т - 1, (7.2.3.)

К2=п -т; (7.2.4.)

де т — число груп;

п — загальний обсяг сукупності.

«Входами» в таблицю критичних значень є числа ступенів вільності К1 К2 та рівень значимості α, який задається дослідником і характеризує, в якій мірі він ризикує помилитися в своєму припущенні (про «невипадковість»).

При перевірці істотності зв'язку частіше використовують F-критерій Фішера, тому що при великих значеннях ступенів вільності його табличні значення мало змінюються, а таблиці менш громіздкі.

Як бачимо, при дисперсійному аналізі факторна ознака може бути як кількісною, так і якісною. Маю­чи названі переваги порівняно з методом аналітичних групувань, дисперсійний аналіз не дає змоги вивчити форму зв'язку.

Якщо ми маємо достатню кількість груп і кількісну факторну ознаку, то, довівши істотність зв'язку, мо­жемо на координатах X та Y знайти певні точки, об'єднати їх ламаною і отримати певну модель форми зв'язку.

8.3. Кореляційно-регресійний аналіз.

Головною характеристикою кореляційного зв'язку є лінія регресії. Лінія регресії х на у — це функція, яка зв'язує середні значення ознаки у зі зна­ченнями ознаки х. Залежно від форми лінії регресії розрізняють лінійний і нелінійний зв'язки. Лінія регресії може бути представлена таблично, графічно, аналітично. У кореляційно-регресійному аналізі (КРА) оцінка лінії регресії здійснюється не в окремих точках, як в аналітичному групуванні, а в кожній точці інтервалу зміни фактичної ознаки х. Лінія регресії при цьому безперервна і зображується у вигляді певної функції Y =f(x), яка зветься рівнянням регресії, a Y — це теоретичні значення результативної ознаки.

Кореляційно-регресійний аналіз складається із таких етапів:

1. Вибір форми регресії.

При виборі функції використовують графіки, ана­літичні групування, теоретичне обґрунтування. Мож­ливий перебір функцій, коли обчислюють рівняння регресії різних видів і з них вибирають найкраще.

Найбільш поширена у статистичному аналізі лінійна функція

Y = a+bx, (7.3.1)

Параметр b називають коефіцієнтом регресії. Він показує, на скільки одиниць власного виміру в серед­ньому змінюється значення ознаки Y при збільшенні значення ознаки х на одиницю.

Параметр а - це значення Y при х = 0.

Якщо х не може приймати нульового значення, то а економічно не інтерпретується і як вільний член рівняння регресії має тільки розрахункове значення.

Іноді суть явища, яке вивчається, приводить до необхідності використання нелінійних рівнянь регресії. При цьому переважно використовують степеневу функцію:

Y= ахь, (7.3.2)

або гіперболу:

Y = a+ /x, (7.3.3)

2. Визначення параметрів рівняння.

Визначення параметрів рівняння регресії проводиться методом найменших квадратів, основною умовою якого є мінімізація суми квадратів відхилень емпіричних значень від теоретичних; це дає можливість отримати найкращі оцінки параметрів а і:

Σ(y-Y)2=>min, (7.3.4)

Для їх обчислення складають і розв'язують систему нормальних рівнянь:

Σу= па + bΣх,

Σху=аΣх+bΣх2, (7.3.5)

Для рішення системи використовують метод детермінантів:

(7.3.6)

(7.3.7.)

3. Оцінка тісноти зв'язку.

Визначення тісноти зв'язку в КРА, як і в методі дисперсійного аналізу, ґрунтується на правилі скла­дання дисперсій, але якщо оцінками лінії регресії в першому методі були значення середніх групових, ре­зультативної ознаки, то в КРА — теоретичні значення останньої.

Дисперсію теоретичних значень називають факторною і обчислюють за формулою

(7.3.8)

Вона характеризує варіацію результативної ознаки, пов'язану з варіацією факторної ознаки. Замість се­редньої з групових дисперсій обчислюють залишкову, випадкову дисперсію:

(7.3.9)

Тоді загальна дисперсія розраховується за форму­лою

σу2= (7.3.10)

або

(7.3.11)

де уі- фактичне значення результативної ознаки;

Yітеоретичне значення результативної ознаки;

п — кількість рівней.

Вона характеризує варіацію результативної ознаки, не пов'язану з варіацією факторної ознаки. Мірою тісноти зв'язку в КРА є коефіцієнт детермінації, аналогічний кореляційному відношенню:

(7.3.12)

де R2 — коефіцієнт детермінації,

σу2загальна дисперсія,

σУ2- факторна дисперсія.

Він приймає значення від 0 (при відсутності лі­нійного зв'язку) до 1 (зв'язок між ознаками функціональний).

Тіснота зв'язку характеризує також індекс кореляції:

(7.3.13)

Коли зв'язок між ознаками лінійний, використовують лінійний коефіцієнт кореляції, який, приймаючи значення від —1 до +1, характеризує не тільки тісноту зв'язку, а і його напрям. Його абсолютна величина збігається з індексом кореляції.

Його розраховують за наступною формулою:

(7.3.14)

4. Перевірка істотності зв'язку.

Перевірку істотності зв'язку в КРА здійснюють за допомогою F-критерія Фішера:

(7.3.15)

де т — число параметрів рівняння регресії.

8.4. Багатофакторна кореляція.

Для опису залежності результативної ознаки від кількох факторів використовують багатофакторну регресійну модель

Y = F(x1,x2,...,xп„), (7.3.16)

Через труднощі обґрунтування форми зв'язку час­тіше використовують багатофакторні лінійні рівняння і рівняння, що приводяться до лінійного виду відпо­відними перетвореннями, тобто

Y=а+b1 х+b2 x2+b3 x3+.. .+bпxn, (7.3.17)

Параметр рівняння bі називають частковим коефіцієнтом регресії, який показує, як у середньому змінюється результативна ознака У при зміні факторної ознаки хі на одиницю за умови, що інші факторні ознаки залишаються незмінними.

Розв'язання такого рівняння регресії можна здійснити також за методом найменших квадратів:

(7.3.18)

Кожний коефіцієнт рівняння вказує на ступінь впливу відповідного фактора на результативний показник при фіксованому положенні решти факторів, тобто як зі зміною окремого фактора на одиницю змінюється результативний показник. Вільний член рівняння множинної регресії економічного змісту не має.

Однак на підставі коефіцієнтів регресії не можна судити, яка з факторних ознак найбільше впливає на результативну, оскільки коефіцієнти регресії між собою непорівняльні, адже їх виражено різними одиницями.

З метою виявлення порівняльної сили впливу окремих факторів та їхніх резервів, статистика обчислює часткові коефіцієнти еластичності εі, а також бета-коефіцієнти ßі за формулами:

(7.3.19)

(7.3.20)

де bі — коефіцієнт регресії при і-му факторі;

— середнє значення і-го фактора;

у— середнє значення результативної ознаки;

σхі — середнє квадратичне відхилення і-го фактора;

оу — середнє квадра­тичне відхилення результативної ознаки.

Часткові коефіцієнти еластичності показують, на скільки процентів у середньому зміниться результативна ознака при зміненій на 1 % кожного фактора та фіксованому положенні інших факторів.

Для визначення факторів, які мають найбільші резерви поліпшен­ня досліджуваної ознаки, з урахуванням ступеня варіації факторів, закладених у рівняння множинної регресії, обчислюють часткові ß-коефіцієнти, які показують, на яку частину середнього квадратич­ного відхилення змінюється результативна ознака при зміненні відповідної факторної ознаки на значення її середнього квадратичного відхилення.

8.5.Рангова кореляція

Вимірювання тісноти зв'язку за допомогою кореляційного і дисперсійного аналізу супроводжується певними складностями і вимагає громіздких обчис­лень. Для орієнтовної оцінки тісноти зв'язку користу­ються наближеними показниками, які не вимагають трудомістких обчислень. До них потрібно віднести: коефіцієнт кореляції знаків Фехнера, коефіцієнт коре­ляції рангів Спірмена і Кендала.

Коефіцієнт кореляції знаків Фехнера визначають на співставленні знаків відхилень від середньої і на підрахунку числа співпадань і неспівпадань знаків. Коефіцієнт кореляції знаків визначають за формулою:

(7.6.1.)

де и — число пар с однаковими знаками відхилень х і у від х і у ;

v — число пар с різними знаками відхилень х і у від х~ і у .

Коефіцієнт кореляції знаків коливається в межах від —1 до +1. Чим ближче до 1, тим сильніший зв'язок. Знак + або — вказує напрям зв'язку. Якщо и = v, то і = 0 і зв'язку немає.

Розглянемо ще один метод оцінки тісноти зв'язку на основі розрахунку коефіцієнта кореляції рангів. Його основна відмінність полягає в тому, що він обчислюється не на основі первинних даних, а на основі рангів, які присвоюються всім значенням дослід­жуваних ознак, що розміщені у порядку зростання. Якщо значення співпадають, то ранг визначається шляхом ділення суми рангів на число значень.

Коефіцієнт кореляції рангів Спірмена визначається за формулою

(7.6.2)

де d2квадрат різниці рангів для кожної одиниці d = х — у;

п — обсяг сукупності.

Коефіцієнт кореляції рангів Спірмена також коли­вається від —1 до +1. Чим ближче до 1, тим тісніший зв'язок. Знак + або — вказує напрям зв'язку. Якщо ранги за обома ознаками співпадають, то зв'язок пря­мий. Якщо ρ=0, то зв'язок між ознаками відсутній.

Ранговий коефіцієнт кореляції більш точний порівняно з коефіцієнтом кореляції знаків, тому що він враховує не тільки знаки відхилень, а й місце ве­личини ознаки в даному ряду.

Окрім вище згаданих коефіцієнтів, на практиці для визначення рейтингу і оцінки тісноти зв'язку використовують коефіцієнт кореляції рангів Кендала:

(7.6.3)

де Si— сума балів.

Суть даного методу полягає в підрахунку числа балів для кожної одиниці сукупності. Для цього ранг першої одиниці сукупності за ознакою у в упоряд­кованому по х ряду порівнюємо з усіма іншими оди­ницями сукупності, які розміщені нижче в списку. Якщо він менше першої одиниці сукупності, при­своюємо йому +1 бал, якщо більше — присвоюємо -1.