Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Задачник.doc
Скачиваний:
8
Добавлен:
13.11.2019
Размер:
6.75 Mб
Скачать

9.2. Задачі

9.2.1. Типові задачі

Однофакторний зв’язок, парна кореляція.

Задача №32. Завдання. За умов задачі №6, по даних про місячні трудові доходи (Х, грн.) і грошові витрати на купівлю продуктів харчування (Y, грн.) 20-ти вибірково обстежених сімей N-ої обл., вважаючи факторною ознакою трудові доходи, а результативною – грошові витрати на купівлю продуктів харчування:

1) побудувати кореляційне поле факторного зв’язку грошових витрат на купівлю продуктів харчування і трудових доходів;

2) представити модель зв’язку функціонально такими рівняннями регресії: (а) лінійним, (б) напівлогарифмічним, (в) показниковим, - перевіривши на значущість оцінки параметрів моделі;

3) оцінити детермінованість (стохастичність) зв’язку з перевіркою значущості параметрів зв’язку на рівні значущості 0,05;

4) обрати серед трьох запропонованих рівнянь регресії адекватне, використовуючи критерії найменшої середньої відносної та квадратичної похибок апроксимації, і зобразити криву регресії на одному графіку з кореляційним полем.

Зробити висновки по кожному пункту завдання.

Розв’язок. Для зручності розрахунків початкові дані і результати проміжних розрахунків щодо синтезування регресійної моделі представимо в розрахунковій таблиці №1.

Розрахункова таблиця №1

i

xi

yi

xi²

xiyi

lgxi

(lgxi

yilgxi

lgyi

xilgyi

1

2

3

4

5

6

7

8

9

10

1

1000

500

1000000

500000

3,000000

9,000000

1500,000000

2,698970

2698,970004

2

2500

1000

6250000

2500000

3,397940

11,545996

3397,940009

3,000000

7500,000000

3

3000

1500

9000000

4500000

3,477121

12,090372

5215,681882

3,176091

9528,273777

4

4500

2000

20250000

9000000

3,653213

13,345962

7306,425028

3,301030

14854,634980

5

2000

600

4000000

1200000

3,301030

10,896799

1980,617997

2,778151

5556,302501

6

5000

2000

25000000

10000000

3,698970

13,682379

7397,940009

3,301030

16505,149978

7

6500

2700

42250000

17550000

3,812913

14,538308

10294,866063

3,431364

22303,864467

8

7000

3000

49000000

21000000

3,845098

14,784779

11535,294120

3,477121

24339,848783

9

2200

700

4840000

1540000

3,342423

11,171789

2339,695877

2,845098

6259,215688

10

2400

800

5760000

1920000

3,380211

11,425828

2704,168993

2,903090

6967,415969

11

4200

1500

17640000

6300000

3,623249

13,127935

5434,873936

3,176091

13339,583288

12

4500

1800

20250000

8100000

3,653213

13,345962

6575,782525

3,255273

14648,726273

13

3700

1500

13690000

5550000

3,568202

12,732064

5352,302586

3,176091

11751,537659

14

4000

1800

16000000

7200000

3,602060

12,974836

6483,707984

3,255273

13021,090020

15

2800

1400

7840000

3920000

3,447158

11,882898

4826,021244

3,146128

8809,158500

16

3200

1200

10240000

3840000

3,505150

12,286076

4206,179974

3,079181

9853,379987

17

4200

2300

17640000

9660000

3,623249

13,127935

8333,473368

3,361728

14119,256911

18

4500

2400

20250000

10800000

3,653213

13,345962

8767,710033

3,380211

15210,950588

19

3000

1000

9000000

3000000

3,477121

12,090372

3477,121255

3,000000

9000,000000

20

4000

1700

16000000

6800000

3,602060

12,974836

6123,501985

3,230449

12921,795686

Σ

74200

31400

315900000

134880000

70,663594

250,371090

113253,304867

62,972370

239189,15506

1) Побудуймо кореляційне поле залежності грошових витрат на купівлю продуктів харчування від трудових доходів (див. множину точок (1) на рисунку).

2

1

Рис. Кореляційне поле (1) і лінія регресії (2) залежності грошових витрат 20-ти

сімей N-ої обл. на купівлю продуктів харчування від їх трудових доходів

у звітному місяці

2) Представимо модель зв’язку функціонально рівняннями регресії:

а) лінійним, для чого розрахуємо оцінки параметрів лінійної моделі (9.18):

а0 = (31400 · 315900000 – 134880000 · 74200) :

: (20 · 315900000 – 74200 · 74200) ≈ -109,355458 (грош.од.);

а1 = (20 · 134880000 – 74200 · 31400) :

: (20 · 315900000 – 74200 · 74200) ≈ 0,452656;

б) півлогарифмічним, для чого розрахуємо оцінки параметрів напівлогарифмічної моделі (9.20):

а0 = (31400 · 250,371090 – 113253,304867 · 70,663594) :

: (20 · 250,371090 – 70,663594 · 70,663594) ≈ -10031,962465 (грош.од.);

а1 = (20 · 113253,304867 – 31400 · 70,663594) :

: (20 · 250,371090 – 70,663594 · 70,663594) ≈ 3283,717077;

в) показниковим, для чого розрахуємо оцінки параметрів показникової моделі (9.19):

а0 = 10(315900000 · 62,972370 – 74200 · 239189,155060) : (20 · 315900000 – 74200 · 74200) ≈ 1,000315(грош.од.);

а1 = 10(20 · 239189,155060 – 74200 · 62,972370) : (20 · 315900000 – 74200 · 74200) ≈ 437,142457.

Отже, рівняння регресії виглядають так (9.3):

- лінійне – YX = -109,355458 + 0,452656 · X;

- напівлогарифмічне – YX = -10031,962465 + 3283,717077 · lgX;

- показникове – YX = 437,142457 · 1,000315X.

Для зручності проміжні розрахунки щодо оцінки якості регресійних моделей представимо в розрахунковій таблиці №2.

Перевіримо значущість розрахованих оцінок на рівні значущості 0,05, для чого, скориставшись отриманими рівняннями, обчислимо відповідні теоретичні значення результативної ознаки (представлені в гр.гр. 6-8 розрахункової таблиці №2), відповідні значення квадратичного відхилення фактичних і теоретичних значень результативної ознаки (представлені в гр.гр. 9-11 розрахункової таблиці №2; див нижче), а також:

- СКВ факторної ознаки (5.15 і 5.17) –

-

- критичне значення t-критерію (Д.4) tкр. = |t|20 – 2; 1 – 0,05 = 2,100922;

а) для лінійної моделі:

- залишкове СКВ (9.28) –

- залишкову дисперсію – σЕ² = 221,298257² = 48972,918551 (грош.од.²);

- значення t-критерію для оцінок а0 і а1 (9.80):

б) для напівлогарифмічної моделі:

- залишкове СКВ (9.28) –

- залишкову дисперсію – σЕ² = 292,558553² = 85590,506933 (грош.од.²);

- значення t-критерію для оцінок а0 і а1 (9.80):

в) для показникової моделі:

- залишкове СКВ (9.28) –

- залишкову дисперсію – σЕ² = 371,771013² = 138213,686107 (грош.од.²);

- значення t-критерію для оцінок а0 і а1 (9.80):

3) Оцінимо детермінованість (стохастичність) зв’язку з перевіркою значущості параметрів зв’язку на рівні значущості 0,05, для чого, скористаємось попередніми результатами, а також обчислимо:

- середнє арифметичне значення результативної ознаки

- загальну дисперсію (9.27)

- критичне значення F-критерію (Д.5) Fкр. = F2 – 1; 20 – 2; 1 – 0,05 = 4,413873;

а) для лінійної моделі:

- оцінку коефіцієнта детермінації (9.25)

- значення F-критерію для оцінки (9.83 і 9.84)

- оцінку коефіцієнта кореляції (9.53)

- значення t-критерію для оцінки (9.86)

б) для півлогарифмічної моделі:

- оцінку коефіцієнта детермінації (9.25)

- значення F-критерію для оцінки (9.83 і 9.84)

в) для показникової моделі:

- оцінку коефіцієнта детермінації (9.25)

- значення F-критерію для оцінки (9.83 і 9.84)

4) Оберемо серед цих трьох рівнянь регресії адекватне (9.8), скориставшись результатами проміжних розрахунків (див. розрахункову таблицю 2):

4-1) найменшої середньої відносної похибки апроксимації (9.9):

а) для лінійної моделі (гр.12) (адекватна)

εапрокс. = 281,951958 : 20 ≈ 14,097598 (%) (min);

б) для півлогарифмічної моделі (гр.13)

εапрокс. = 446,640798 : 20 ≈ 22,332040 (%);

в) для показникової моделі (гр.14)

εапрокс. = 330,776127 : 20 ≈ 16,538806 (%);

4-2) квадратичної похибки апроксимації (9.10), вона ж – залишкове СКВ σЕ:

а) для лінійної моделі (гр.9) (адекватна)

σапрокс. = 221,298257 (грош.од.) (min);

б) для півлогарифмічної моделі (гр.10)

σапрокс. = 292,558553 (грош.од.);

в) для показникової моделі (гр.11)

σапрокс. = 371,771013 (грош.од.).

Зобразимо лінію адекватної моделі регресії на одному графіку з кореляційним полем (лінія 2 на рисунку).

Висновки: Побудувавши три регресійні моделі факторного зв’язку між грошовими витратами сімей на купівлю продуктів харчування (результативна ознака) та їх трудовими доходами (факторна ознака) по місячних звітних даних про 20 сімей, а також задавшись мірою точності оцінки шуканих параметрів зв’язку, можна зробити наступні висновки.

1) Із збільшенням значень факторної ознаки спостерігається загальна тенденція до збільшення результативної ознаки (див. кореляційне поле на рисунку). Враховуючи, що залежність цих ознак між собою є неоднозначною, зв’язок між ними є кореляційним.

2) Усі три дані функції (лінійна, напівлогарифмічна та показникова) підходять для вирівнювання (осереднення) кореляційного зв’язку, тому що оцінки параметрів цих моделей є значущими на заданому рівні значущості α = 0,05 t-критерію, тобто фактичні значення критерію, обчислені для кожної оцінки, в декілька разів (від 2,5 до 32300) перевищують його критичне значення (2,10). Лише оцінки А0 відповідних параметрів лінійної та показникової моделей дають квантилі, менші в 2,79 і 1,17 разів відповідно, ніж критичне значення t-критерію. Але їх незначущість не є принциповою для вибору адекватної моделі серед запропонованих, тим паче, значущою є оцінка А1 коефіцієнта лінійної регресії, який «відповідає» за зв’язок між ознаками. Вибір саме t-критерію для перевірки оцінок на значущість зроблений через обмежений об’єм вибірки (20 одиниць, що менше 30-ти).

3) Зв’язок між ознаками можна визнати дуже сильним, якщо вважати його або лінійним, або напівлогарифмічним, тому що для цих двох моделей відпо-

відні оцінки коефіцієнта детермінації за шкалою Чеддока перевищують 0,9 (0,945888 і 0,903313), і лише показникова модель, для якої = 0,838350 (більше 0,7 i менше 0,9), за згаданою шкалою дає сильний зв’язок. Однак, усі три моделі характеризуються переважаючим відсотком варіації результативної ознаки, обумовленим впливом саме обраного Х-фактора: 89,47 % для лінійного зв’язку, 81,60 % для напівлогарифмічного зв’язку і 70,28 % для показникової моделі.

Говорячи про лінійну модель, необхідно оцінити міру лінійного статистичного зв’язку між ознаками за допомогою оцінки коефіцієнта кореляції, значення якої повинно співпадати зі значенням квадратного кореня від оцінки коефіцієнта детермінації. Обидві оцінки насправді мають однакові значення (0,945888), що підтверджує коректність розрахунків, і, до того ж, наближені до одиниці, що свідчить про дуже високу «лінійність» зв’язку.

Оцінки коефіцієнтів детермінації та коефіцієнта кореляції усіх трьох моделей є значущими, тому що фактичні значення відповідно F-критерію і t-критерію, обчислені для них на рівні значущості α = 0,05, перевищують критичні значення критеріїв: 4,413873 і 2,100922 відповідно. Вибір саме F- і t-критеріїв для перевірки оцінок на значущість зроблений через обмежений об’єм вибірки (20 одиниць, що менше 30-ти).

4) Отже, кожна з цих моделей характеризується досить високою якістю оцінюваного факторного зв’язку, але говорячи про адекватність регресійної моделі, єдиною серед них, яка і за критерієм найменшої середньої відносної похибки апроксимації, і за критерієм найменшої середньої квадратичної похибки апроксимації дає найменшу відповідну похибку (14,10 % і 221,298257 грош.од.), є лінійна модель. До того ж, вона є й найпростішою.

Багатофакторний зв’язок, множинна кореляція.

Задача №33. Початкові умови. Валовий прибуток (залежна ознака Y), основні фонди (факторна ознака Х1) і оборотні засоби (факторна ознака Х2) 19-ти випадково відібраних типових підприємств виробничої галузі у звітному періоді становили (таблиця):

Таблиця

підприємства

Y, млн.грош.од.

Х1, млн.грош.од.

Х2, млн.грош.од.

1

2

3

4

1

203,4

119,0

105,4

2

63,3

28,1

56,0

3

36,1

15,9

35,0

4

34,4

36,8

36,8

5

45,9

17,5

54,2

6

113,7

50,3

63,4

7

121,8

55,9

26,8

8

70,8

26,1

43,2

9

87,8

21,6

40,7

10

75,8

25,4

66,5

11

49,0

17,2

25,1

12

111,8

119,6

54,3

13

96,4

124,2

41,9

14

80,0

114,8

36,2

15

88,9

166,5

50,0

Продовження таблиці

1

2

3

4

16

75,2

103,5

58,4

17

61,8

141,1

42,8

18

237,7

154,2

106,7

19

160,5

24,4

36,8

Завдання: По наведених даних, а також, встановивши рівень значущості α = 0,05 t- і F-критеріїв щодо перевірки якості регресійної моделі, побудувати двофакторну лінійну модель залежності валового прибутку від основних фондів і оборотних засобів і за допомогою цієї моделі виконати параметризацію, верифікацію і прогноз, для чого:

1) знайти оцінки аj коефіцієнтів регресії αj та провести регресійний аналіз за допомогою нормованих оцінок коефіцієнтів регресії і частинних коефіцієнтів еластичності;

2) перевірити оцінки аj на незміщеність (передумови застосування МНК) і значущість, здійснивши дисперсійний аналіз із визначенням коваріаційної матриці;

3) по значущих оцінках обчислити границі довірчих інтервалів відповідних коефіцієнтів регресії;

4) визначити оцінки множинних коефіцієнтів детермінації та кореляції (в т.ч. через обчислення кореляційної матриці) з перевіркою їх значущості;

5) визначити оцінки парних коефіцієнтів кореляції між результативною ознакою і кожною з факторних ознак, а також між самими Х-факторами з перевіркою наявності лінійного зв’язку між останніми (мультиколінеарності);

6) визначити оцінки частинних коефіцієнтів детермінації (кореляції), в тому числі в матричній формі, з перевіркою їх значущості й обчисленням границь довірчих інтервалів коефіцієнтів при значущих оцінках;

7) виконати прогноз із визначенням границь довірчих інтервалів для середнього й індивідуального значень результативної ознаки при наступних очікуваних значеннях Х-факторів: Х = 150 млн.грош.од. і Х = 80 млн.грош.од.;

8) оцінити прогнозні можливості моделі за критерієм М.А.Р.Е. (середньої відносної похибки прогнозу) і через визначення коефіцієнта відповідності Тейла.

Якщо можна, спростити модель, і по кожному завданню зробити висновки.

Розв’язок. Дана задача передбачає проведення багатофакторного аналізу з оцінкою параметрів зв’язку (параметризація) і перевіркою значущості отриманих оцінок щодо встановлення остаточного виду рівняння регресії (верифікація), яке представляє модель двофакторного зв’язку даних ознак.

1) Виконаємо параметризацію, для чого запишемо лінійне рівняння моделі зв’язку (9.11):

Y = α 0 + α1 · X1 + α2 · X2 + E,

де α0, α1 і α2 – коефіцієнти лінійної регресії Y на X0 (одинична фіктивна змінна), X1 і X2 відповідно;

Е – випадковий залишок.

У матричному виді це рівняння запишеться так (9.12 і 9.13):

Y = α · X + E,

де Y – вектор-стовпець значень результативної ознаки розміру n = 19;

α – вектор стовпець невідомих значень коефіцієнтів регресії розміру (М + 1) = 3 (М – кількість Х-факторів);

Х – матриця значень Х-факторів розміру (n × (M + 1)) = (19 × 3) (перший стовпець – значення фіктивної змінної Х0 при вільному коефіцієнті α0, кожне з яких умовно обране за 1;

E – вектор-стовпець невідомих значень залишку розміру n = 19:

Всього:

1814,3

16

180,2

1362,1

Рівняння регресії, що гіпотетично (функціонально та наближено, без урахування E) характеризує багатофакторний зв’язок між Y і {Xj}, представляє множинну регресію та має вид (9.14 і 9.15):

YХ = АX,

де YХ – вектор-стовпець гіпотетичних значень результативної ознаки розміру n = 19;

А – вектор-стовпець шуканих оцінок параметрів факторного зв’язку розміру (M + 1) = 3:

1-1) Оцінки аj параметрів αj, визначені із застосуванням МНК (9.16), мають вид:

А=(X'X)-1X'Y, –

де X' – результат транспонування матриці Х; (…)-1 –обертання матриці.

Отже,

Висновок: Отже, рівняння лінійної регресії даного кореляційного зв’язку має вид:

YХ = 2,794061 + 0,190313 · X1 + 1,532328 · X2.

Гіпотетичні значення {ухi} результативної ознаки визначаються підстановкою в рівняння регресії фактичних значень Х-факторів. Вони становлять:

Всього:

1814,300000

Рівність сум фактичних (Σуі) і гіпотетичних (Σухі) значень результативної ознаки (1814,3 = 1814,3) свідчить про коректність виконаних розрахунків.

1-2) Оцінимо вплив обох факторів на валовий прибуток, для чого обчислимо нормовані емпіричні коефіцієнти регресії. Для визначення останніх нам знадобляться числові характеристики положення та розсіювання результативної та факторних ознак (у значеннях вибіркових оцінок):

- середнє арифметичне значення Х1-фактора (5.1)

- середнє арифметичне значення Х2-фактора (5.1)

- середнє арифметичне значення залежної змінної Y (5.1)

- СКВ Х1-фактора (5.15 і 5.17)

- СКВ Х2-фактора (5.15 і 5.17)

- СКВ залежної змінної Y (5.15 і 5.17)

Усі проміжні розрахунки (гр.гр.4-6) для зручності зведені в розрахункову таблицю №1 (див. нижче).

Отже, нормовані емпіричні коефіцієнти регресії становлять (9.36):

Через малий об’єм вибірки (n = 19) отримані оцінки СКВ можуть бути зміщеними. Незміщені їх оцінки дає ділення у формулі СКВ не на n, а на (n – 1). Але у визначені коефіцієнтів β співвідношення двох оцінок СКВ дає взаємне скорочення знаменників останніх, тому у формулах β необов’язково застосовувати незміщені оцінки СКВ.

Висновок: При зміні розміру основних фондів (оборотних засобів) на величину одного свого СКВ валовий прибуток змінюється на 0,189232 (0,630431) величини свого СКВ. Це означає, що другий фактор в 3,33 (0,630431 : 0,189232) рази сильніше впливає на валовий прибуток, ніж перший фактор.

1-3) Оцінимо вплив кожного фактора на валовий прибуток, для чого обчислимо частинні коефіцієнти еластичності18:

Висновок: При зміні розміру основних фондів (оборотних засобів) на 1 % з фіксацією іншого фактора на рівні його середнього арифметичного значення валовий прибуток змінюється на 0,142879 (0,827861) %. Це означає, що другий фактор в 5,79 (0,827861: 0,142879) разів сильніше впливає на валовий прибуток, ніж перший фактор.

2) Перевіримо оцінки аj на незміщеність (передумови застосування МНК) і значущість, зробивши дисперсійний аналіз із визначенням коваріаційної матриці.

2-1) Для перевірки оцінок на незміщеність визначимо коефіцієнти варіації кожної оцінки як співвідношення її СКП й її абсолютного значення (9.70):

де – модульні значення оцінок aj – {2,794061; 0,190313; 1,532328};

– незміщена середня квадратична похибка (СКП) оцінювання параметра αj, або стандартна похибка коефіцієнта регресії (9.71), така, що

де bjj – елементи головної діагоналі матриці (Х'Х)-1 – {3,569002 · 10-1; 2,308470 · 10-5; 1,348351 · 10-4};

незміщена оцінка вибіркової залишкової дисперсії (9.72), або стандартна похибка регресії, визначена для M-факторної (М = 2) моделі з s оцінюваними параметрами (s = M + 1 = 3), така, що (див. гр.гр.2, 7 і 8 розрахункової таблиці №1).

Тоді

разом з оцінками коваріації між Aі і Aj (i j) утворюють коваріаційну матрицю (9.73)

і знаходяться в її головній діагоналі.

Отже,

Висновок: Враховуючи, що кожен з цих індексів перевищує 5 %, усі оцінки коефіцієнтів регресії є зміщеними, тобто залишки можуть мати систематичну складову, яка зумовлюється неточністю специфікації моделі (не всі основні фактори, що впливають на валовий прибуток, включені в модель). Найменшу варіацію відчуває оцінка А2 коефіцієнта регресії α2 з відповідним індексом варіації, який є меншим за 40 %. Тому така варіація може бути визнана несуттєвою, й є всі підстави сподіватись на значущість оцінки А2.

Щодо оцінок А0 і А1, навряд чи вони будуть значущими. Впевнимось в цьому.

2-2) Перевірку значущості оцінок коефіцієнтів регресії виконаємо за t-критерієм, для чого обчислимо модульні фактичні значення останнього по кожній оцінці, припускаючи, що Аj = 0 (нульова гіпотеза Н0: Y не залежить від Xj) (9.79):

|ta0| = 2,794061 : 23,5280814 ≈ 0,118754,

|ta1| = 0,190313 : 0,1892236 ≈ 1,005757,

|ta2| = 1,532328 : 0,4573141 ≈ 3,350712.

Грубе оцінювання значущості свідчить про те, що А0 є статистично незначущою (|t| < 1), А1 – відносно значущою (1 < |t| < 2), А2 – сильно значущою (|t| > 3).

Для остаточного прийняття рішення щодо їх значущості порівняємо кожне з цих значень з критичним значенням t-критерію, яке визначимо на заданому рівні значущості α = 0,05 з кількістю ступенів свободи m = 19 – 3 = 16 (Д.4):

|t|16; 1 – 0,05 = 2,119905.

Висновок: Як і передбачалося, лише оцінка А2 є значущою, тому що співвідношення Стьюдента, обчислене для неї, перевищує критичне значення t-критерію на заданому рівні значущості (гіпотеза Н0 спростована), чого не можна сказати про оцінки А0 і А1, для яких співвідношення Стьюдента є меншим, ніж критичне значення t-критерію (для кожної оцінки гіпотеза Н0 не спростовується).

Отже, валовий прибуток, безумовно, залежить від оборотних засобів. На скільки він залежить від основних фондів (відносна значущість оцінки а1 залишає це питання відкритим), можна сказати лише по значеннях відповідного коефіцієнта детермінації (див. нижче).

2-3) Говорячи про загальну якість регресійної моделі, перевіримо сукупну значущість оцінок коефіцієнтів регресії, для чого скористаємось значенням середнього валового прибутку і визначимо фактичне значення F-критерію (9.81), припускаючи, що А0 = А1 = А2 = 0 (нульова гіпотеза Н0: Y не залежить від {Xj}) (див. гр.гр.2 і 3 розрахункової таблиці №1):

яке порівняємо з критичним значенням F-критерію, визначеним на рівні значущості α = 0,05 з кількістю ступенів свободи k1 = 3 – 1 = 2 i k2 = 19 – 3 = 16, тобто з F2; 16; 1 – 0,05 = 3,663716 (Д.5).

Висновок: Отже, перевищення фактичного значення F-критерію над теоретичним дає підстави вважати гіпотезу Н0 хибною, факторну дисперсію значно більшою, ніж залишкова дисперсія, а валовий прибуток – суттєво залежним від основних фондів й оборотних засобів; на скільки суттєво – покаже кількісна оцінка детермінованості (стохастичності) їх зв’язку, зроблена в п.4.

3) По значущих оцінках коефіцієнтів регресії αj, а до таких належить лише оцінка А2, обчислимо границі довірчого інтервалу коефіцієнта регресії α2, які визначимо симетрично відносно значення а2 на відстані граничної похибки оцінювання (9.89):

Висновок: Отже, довірчий інтервал з границями 0,562866 і 2,501790 на рівні значущості α = 0,05 «накриває» область можливих значень коефіцієнта регресії α2. Через незначущість оцінок А0 і А1 довірчі інтервали відповідних коефіцієнтів регресії α0 і α1 не визначалися.

4) Продовжуючи перевірку загальної якості регресійної моделі, визначимо оцінки множинних коефіцієнтів детермінації та кореляції з перевіркою їх значущості.

4-1) Оцінку множинного коефіцієнта (індексу) детермінації обчислимо як співвідношення оцінок (спочатку зміщених) факторної та загальної дисперсій (9.30) (див. гр.гр.3 і 6 розрахункової таблиці №1):

Уточнимо це значення по незміщених оцінках вказаних дисперсій (9.37):

Висновок: Отже, 53,34 % (за уточненою оцінкою – 47,51 %) варіації валового прибутку, а це – майже половина, обумовлено спільною варіацією основних фондів й оборотних засобів, решта – 46,66 % (52,49 %) – це варіація, що

відбувається під впливом факторів, не врахованих в регресійній моделі, або під впливом залишку. Оцінку множинного коефіцієнта детермінації можна отримати і в інший спосіб, через елементи кореляційної (коваріаційної) матриці, що буде зроблено в п.5.

4-2) Враховуючи те, що регресія є лінійною, оцінку множинного коефіцієнта кореляції обчислимо як квадратний корінь з оцінки множинного коефіцієнта детермінації (9.50):

Висновок: Отже, за шкалою Чеддока міру лінійності статистичного зв’язку між валовим прибутком і двома факторами, основними фондами й оборотними засобами, можна визнати високою, тому що оцінка множинного коефіцієнта їх спільної кореляції ř = 0,730349, а це значення знаходиться в межах 0,7÷0,9, що кваліфікується за даною шкалою як «сильний зв’язок».

4-3) Перевіримо на значущість оцінки коефіцієнтів детермінації та кореляції відповідно за F- і t-критеріями, для чого обчислимо фактичні значення цих критеріїв у припущенні, що R² = 0 (нульова гіпотеза Н0: Y не залежить від обох X-факторів) і r = 0 (нульова гіпотеза Н0: Y лінійно не залежить від X-факторів):

- F-критерій (9.83):

- t-критерій (9.85):

Порівняємо ці значення з відповідними критичними значеннями F- і t-критеріїв, визначеними на рівні значущості α = 0,05 з кількістю ступенів свободи k1 = 3 – 1 = 2 i k2 = 19 – 3 = 16 для F-критерію, тобто з F2; 16; 1 – 0,05 = = 3,663716 (Д.5), і з кількістю ступенів свободи m = 19 – 3 = 16 для t-критерію, тобто з t16; 1 – 0,05/2 = 2,119905 (Д.4).

Висновок: Отже, перевищення фактичних значень F- і t-критеріїв над відповідними теоретичними значеннями цих критеріїв дає підстави вважати обидві гіпотези Н0 хибними, оцінки коефіцієнтів детермінації та кореляції статистично значущими, сукупний вплив основних фондів (X1-фактор) й оборотних засобів (X2-фактор) на валовий прибуток (Y) суттєвим, а зв’язок між Y і X-факторами сильним. Перевірки на значущість обох оцінок є тотожними, тому що модель регресії є лінійною. Це означає, що для визнання загальної

якості моделі високою достатньо визнати значущою оцінку коефіцієнта детермінації.

5) Визначимо оцінки парних коефіцієнтів кореляції між результативною ознакою і кожною з факторних ознак, а також між самими Х-факторами з перевіркою наявності лінійного зв’язку між останніми (мультиколінеарності), для чого обчислимо кореляційну матрицю з попередньою нормалізацією Y і X-факторів:

5-1) Оцінимо кореляцію факторних ознак між собою – парні коефіцієнти кореляції řXX = UXUX/n, для чого визначимо:

- нормалізовані значення X-факторів (4.10) (див. гр.гр.9-10 розрахункової таблиці №1):

- транспоновані дані:

- U′XUX:

Отже (9.58),

Висновок: Отже, за шкалою Чеддока міру лінійності статистичного зв’язку між основними фондами й оборотними засобами можна визнати помірною, тому що оцінка їх парного коефіцієнта кореляції řX1X2 = řX2X1 = 0,419778, а це значення знаходиться в межах 0,3÷0,5, що кваліфікується за даною шкалою як «помірний зв’язок».

5-2) Оцінимо кореляцію результативної ознаки з кожною факторною ознакою окремо – оцінки парних коефіцієнтів кореляції řYX = UYUX/n, для чого визначимо:

- нормалізовані значення Y (4.10) (див. гр.11 розрахункової таблиці №1):

- транспоновані дані:

- U′YUX:

Отже (9.54),

Висновок: Отже, за шкалою Чеддока міру лінійності статистичного зв’язку між валовим прибутком і основними фондами можна визнати помірною, тому що оцінки їх парного коефіцієнта кореляції řYX1 = řX1Y = 0,453873, а це значення знаходиться в межах 0,3÷0,5, що кваліфікується за даною шкалою як «помірний зв’язок». Міру лінійності статистичного зв’язку між валовим прибутком і оборотними засобами можна визнати високою, тому що оцінка їх парного коефіцієнта кореляції řYX2 = řX2Y = 0,709867, а це значення знаходиться в межах 0,7÷0,9, що кваліфікується за даною шкалою як «сильний зв’язок». Враховуючи, що обидва ці коефіцієнти мають значення вищі, ніж значення оцінки парного коефіцієнта кореляції факторних ознак řX1X2X2X1), а остання є меншою за 0,8, то мультиколінеарність, або сильна лінійна залежність між факторними ознаками, відсутня. До того ж, вони помітно відрізняються: řYX1 < řYX2 (0,453873 < 0,709867), – що, разом з незначущістю оцінки а1, є підставою для виключення Х1-фактора (основних фондів) із регресійної моделі.

5-3) Обчислимо кореляційну матрицю – оцінки парних коефіцієнтів кореляції ř = UYXUYX/n, для чого:

- зведемо в єдину матрицю нормалізовані значення Y і X-факторів (див. гр.гр.9-11 розрахункової таблиці №1):

- транспоновані дані:

- U′YXUYX:

Отже (9.54),

Висновок: Елементи кореляційної матриці повністю повторюють значення оцінок парних коефіцієнтів кореляції, визначених в п.п.5-1 і 5-2, що свідчить про коректність проведених розрахунків, а сама матриця може стати в нагоді щодо визначення оцінки множинного коефіцієнта детермінації (кореляції) (див. п.5-4).

5-4) Визначимо оцінку множинного коефіцієнта детермінації через оцінки парних коефіцієнтів кореляції (9.34):

Ř² = řYX(řXX)-1ř′YX =

або через визначник |r| кореляційної матриці r і A11 – алгебраїчне доповнення до елемента ř11= ř YY кореляційної матриці (визначник |řXX| матриці řXX)

або через перший елемент λ11 головної діагоналі коваріаційної матриці λ (він є оцінкою дисперсії залежної змінної Y) і через перший елемент Λ11 головної діагоналі матриці Λ (Λ = λ-1 і = 1/Λ11) (9.30):

що вже було зроблено в п.4-1.

Коваріаційна матриця виглядає так (9.39):

Обернена коваріаційна матриця має вид:

Дійсно = 1/Λ11 = 1/7,656096·10-04 ≈ 1306,148799 млн.грош.од.².

Усі проміжні розрахунки щодо визначення елементів коваріаційної матриці λ, крім елементів головної діагоналі (обчислені в п.1-2), зведені в розрахункову таблицю №2.

Розрахункова таблиця №2

п/п

Y

X1

X2

(Y

× (X1 )

(Y

× (X2 )

(X1

× (X2 )

1

3

4

5

6

7

8

1

107,910526

47,310526

53,810526

5105,303795

5806,722216

2545,804321

2

-32,189474

-43,589474

4,410526

1403,122216

-141,972521

-192,252521

3

-59,389474

-55,789474

-16,589474

3313,307479

985,240111

925,518006

4

-61,089474

-34,889474

-14,789474

2131,379584

903,481163

515,996953

5

-49,589474

-54,189474

2,610526

2687,227479

-129,454626

-141,463047

6

18,210526

-21,389474

11,810526

-389,513573

215,075900

-252,620942

7

26,310526

-15,789474

-24,789474

-415,429363

-652,224100

391,412742

8

-24,689474

-45,589474

-8,389474

1125,580111

207,131690

382,471690

9

-7,689474

-50,089474

-10,889474

385,161690

83,734321

545,448006

10

-19,689474

-46,289474

14,910526

911,415374

-293,580416

-690,200416

11

-46,489474

-54,489474

-26,489474

2533,186953

1231,481690

1443,397479

12

16,310526

47,910526

2,710526

781,445900

44,210111

129,862742

13

0,910526

52,510526

-9,689474

47,812216

-8,822521

-508,799363

14

-15,489474

43,110526

-15,389474

-667,759363

238,374848

-663,448310

15

-6,589474

94,810526

-1,589474

-624,751468

10,473795

-150,698837

16

-20,289474

31,810526

6,810526

-645,418837

-138,181994

216,646427

17

-33,689474

69,410526

-8,789474

-2338,404100

296,112742

-610,081994

18

142,210526

82,510526

55,110526

11733,865374

7837,296953

4547,198532

19

65,010526

-47,289474

-14,789474

-3074,313573

-961,471468

699,386427

Σ:

0,000000

0,000000

0,000000

24003,217895

15533,627895

9133,577895

Σ/19:

х

х

х

Висновок: Обчислення оцінки множинного коефіцієнта детермінації, виконане в різний спосіб, через елементи коваріаційної та кореляційної матриць, дає один і той же самий результат, що свідчить про коректність виконаних розрахунків.

6) Визначимо оцінки частинних коефіцієнтів детермінації (кореляції) з перевіркою їх значущості й обчисленням границь довірчих інтервалів коефіцієнтів при значущих оцінках, для чого побудуємо однофакторні моделі регресії Y окремо на X1 і окремо на X2.

Для зручності проміжні розрахунки зведені в розрахункові таблиці №3 і №4 (див. нижче).

6-1) Однофакторна лінійна модель регресії Y окремо на X1 дає :

- оцінки коефіцієнтів регресії (9.18):

- рівняння лінійної регресії Y на X1:

YX1 = 62,765667 + 0,456464 · X1;

- значення t-критерію для отриманих оцінок (9.80):

- оцінку коефіцієнта детермінації (кореляції) (9.41):

- значення F- (9.84) і t-критеріїв (9.86) для отриманих оцінок:

- критичні значення цих критеріїв:

F1; 17; 1 – 0,05 = 4,451323 (Д.5),

|t|17; 1 – 0,05 = 2,109819 (Д.4).

Висновок: При неврахуванні оборотних засобі в моделі маємо лінійну регресію валового прибутку на основні фонди у виді рівняння YX1 = 62,765667 + + 0,456464 · X1, в якому оцінка а0 є значущою, а оцінка а1 – незначущою (ta0 = 3,247550 більше, ніж tкр. = 2,109819, а ta1 = 2,100140 менше, ніж tкр. = 2,109819). Незначущими в цьому факторному зв’язку є й оцінка коефіцієнта детермінації ( = 4,410579 менше, ніж Fкр. = 4,451323), й оцінка коефіцієнта кореляції ( = 2,100137 менше, ніж tкр. = 2,109819). Між тим, значення оцінок параметрів зв’язку говорять самі за себе: лише 20,6 % варіації валового прибутку пояснюється основними фондами, що характеризує зв’язок між ними як помірний (0,3 < = 0,453873 < 0,5). До речі, значення оцінок коефіцієнта кореляції, отримані по однофакторній і двофакторній (п.5-2) моделях, співпадають, що свідчить про коректність виконаних розрахунків.

6-2) Однофакторна лінійна модель регресії Y окремо на X2 дає:

- оцінки коефіцієнтів регресії (9.18):

- рівняння лінійної регресії Y на X1:

YX2 = 6,476836 + 1,725403 · X2;

- значення t-критерію для отриманих оцінок (9.80):

- оцінку коефіцієнта детермінації (кореляції) (9.41):

- значення F- (9.84) і t-критеріїв (9.86) для отриманих оцінок:

Висновок: При неврахуванні основних фондів в моделі маємо лінійну регресію валового прибутку на оборотні засоби у виді рівняння YX2 = 6,476836 + + 1,725403·X2, в якому оцінка а0 є незначущою, а оцінка а1 – значущою (ta0 = 0,278583 менше, ніж tкр. = 2,109819, а ta1 = 4,155488 більше, ніж tкр. = 2,109819). Значущими в цьому факторному зв’язку є й оцінка коефіцієнта детермінації ( = 17,268045 більше, ніж Fкр. = 4,451323), й оцінка коефіцієнта кореляції ( = 4,155484 більше, ніж tкр. = 2,109819). Значення оцінок параметрів зв’язку говорять самі за себе: 50,39 % варіації валового прибутку пояснюється оборотними засобами, що характеризує зв’язок між ними як сильний (0,7 < = 0,709867 < 0,9). До речі, значення оцінок коефіцієнта кореляції, отримані по однофакторній і двофакторній (п.5-2) моделях, співпадають, що свідчить про коректність виконаних розрахунків.

6-3) Оцінка частинного коефіцієнта детермінації (кореляції) Y і одного з Х-факторів при елімінації іншого фактора (проміжні розрахунки оцінок факторних дисперсій і зведені в розрахункову таблицю №3):

- при елімінації Х2-фактора (9.61):

такий же самий результат дає матрична форма цього коефіцієнта:

- при елімінації Х1-фактора (9.61):

такий же самий результат дає матрична форма цього коефіцієнта:

Оцінки частинних коефіцієнтів кореляції можна визначити через перетворення кореляційної матриці оцінок парних коефіцієнтів кореляції, а саме її обертання:

Елементи оберненої кореляційної матриці беруть участь в обчисленні оцінок частинних коефіцієнтів кореляції (9.65 і 9.66):

Серед вже названих оцінок в новій кореляційній матриці з’явилися оцінки, які пов’язують фактори Х1 і Х2 між собою при елімінації Y: = 0,155492.

Висновок: Отже, 5,95 % варіації валового прибутку пояснюється основними фондами і 41,24 % – оборотними засобами. Це означає, що перший фактор може бути виключеним з регресійної моделі (аналогічний висновок зроблений в п.5-2). Зв’язок між основними фондами й оборотними засобами слабкий, тому що оцінка коефіцієнта їх кореляції не перевищує 0,3 за шкалою

Чеддока. Це свідчить про відсутність мультиколінеарності (аналогічний висновок зроблений в п.5-2).

6-4) Для перевірки значущості оцінок частинних коефіцієнтів кореляції визначимо їх незміщені СКП (9.88`):

Значення t-критерію оцінок становлять (9.85):

Порівняємо ці значення зі значенням t-критерію, визначеним на рівні значущості α = 0,05 з кількістю ступенів свободи m = 19 – 3 = 16 (Д.4), тобто з |t|16; 1 – 0,05 = 2,119905.

Висновок: Отже, оцінка частинного коефіцієнта кореляції валового прибутку і основних фондів при елімінації оборотних засобів є незначущою, тому що значення t-критерію для неї становить 1,005757, що менше, ніж критичне значення критерію (2,119905), на відміну від оцінки частинного коефіцієнта кореляції валового прибутку і оборотних засобів при елімінації основних фондів, яку можна вважати значущою – значення t-критерію для неї становить 3,350712, що більше, ніж критичне значення критерію (2,119905).

6-5) Перевіримо, погіршиться чи ні якість рівняння регресії при виключенні з нього фактора Х1, для чого обчислимо значення F-критерію щодо перевірки гіпотези Н0 (якщо з рівняння регресії з М-факторами (М = 2) виключається К пояснювальних змінних (К = 1) і сподіваною є нерівність , якість рівняння не змінюється, тобто погіршення (покращання) якості , або дорівнює нулю коефіцієнт регресії при основних фондах) (9.100):

Порівняємо це значення з відповідним критичним значенням F-критерію, визначеним на рівні значущості α = 0,05 з кількістю ступенів свободи k1 = 3 – 1 = 2 i k2 = 19 – 3 = 16, тобто з F2; 16; 1 – 0,05 = 3,663716 (Д.5).

Висновок: Отже, фактичне значення F-критерію (1,011524) є меншим за критичне його значення (3,663716), що відповідає незначній втраті якості регресійної моделі через виключення з неї основних фондів, яке, у свою чергу, є допустимим.

6-6) Обчислимо границі довірчих інтервалів частинних коефіцієнтів кореляції при значущих оцінках (9.88). Значущою є оцінка частинного коефіцієнта кореляції Y і Х2, тому саме для нього проведемо відповідні розрахунки на рівні значущості α = 0,05 t-критерію з m = ns = 19 – 3 = 16 ступенями свободи:

Бачимо, що верхня границя довірчого інтервалу перевищує одиницю, що свідчить про некоректність отриманих границь і потребує їх уточнення по нормалізованих значеннях оцінки коефіцієнта кореляції через перетворення Фішера (9.89):

яке дає коректні границі довірчого інтервалу (9.91):

Висновок: Отже, при елімінації основних фондів від 22,78 % до 85,96 % варіації валового прибутку пояснюється оборотними засобами.

7) Виконаємо прогноз із визначенням границь довірчих інтервалів для середнього й індивідуального значень результативної ознаки при наступних очікуваних значеннях Х-факторів: х = 150 млн.грош.од. і х = 80 млн.грош.од., – для чого представимо очікувані значення факторних змінних у векторно-матричній формі:

Транспонуємо цей вектор:

Знайдемо векторно-матричний добуток Xp (XX)-1Xp (послідовним множенням вектора на матрицю і матриці на вектор):

Тоді середня квадратична похибка прогнозу становить:

- для середнього значення Y:

- для індивідуального значення Y :

Прогнозне значення Y знайдемо з регресійної моделі по початкових очікуваних даних Х1 і Х2:

yxp = 2,794061 + 0,190313 · х + 1,532328 · х =

= 2,794061 + 0,190313 · 150 + 1,532328 · 80 = 153,927251 (млн.грош.од.).

Отже, інтервал довіри на рівні значущості α = 0,05 t-критерію (|t|16; 1 – 0,05 = = 2,119905) становить:

  • для середнього значення Y (9.92):

- для індивідуального значення Y (9.94):

Висновок: Якщо основні фонди зафіксувати на рівні 150 млн.грош.од., а оборотні засоби – на рівні 80 млн.грош.од., то, застосовуючи регресійну модель, яка пов’язує валовий прибуток з цими факторами, можна прогнозувати середнє значення валового прибутку на рівні від 116,699932 млн.грош.од. до 191,154570 млн.грош.од. при індивідуальних значеннях прибутку від 62,514476 млн.грош.од. до 245,340026 млн.грош.од.

8) Оцінимо прогнозні можливості моделі (результати проміжних розрахунків зведені у розрахункову таблицю №5):

Розрахункова таблиця №5

п/п

Y

YX

Y - YX

|Y - YX|

|Y-YX|/Y

(Y - YX

Y²

YX²

1

2

3

4

5

6

7

8

9

1

203,4

186,948640

16,451360

16,451360

0,080882

270,647258

41371,56

34949,793859

2

63,3

93,952208

-30,652208

30,652208

0,484237

939,557844

4006,89

8827,017354

3

36,1

59,451508

-23,351508

23,351508

0,646856

545,292907

1303,21

3534,481755

4

34,4

66,187237

-31,787237

31,787237

0,924048

1010,428408

1183,36

4380,750283

5

45,9

89,176701

-43,276701

43,276701

0,942848

1872,872885

2106,81

7952,484074

6

113,7

109,516379

4,183621

4,183621

0,036795

17,502684

12927,69

11993,837278

7

121,8

54,498935

67,301065

67,301065

0,552554

4529,433397

14835,24

2970,133878

8

70,8

73,957787

-3,157787

3,157787

0,044602

9,971616

5012,64

5469,754198

9

87,8

69,270559

18,529441

18,529441

0,211041

343,340175

7708,84

4798,410379

10

75,8

109,527805

-33,727805

33,727805

0,444958

1137,564808

5745,64

11996,339997

11

49,0

44,528869

4,471131

4,471131

0,091248

19,991009

2401,00

1982,820208

12

111,8

108,760878

3,039122

3,039122

0,027184

9,236261

12499,24

11828,928625

13

96,4

90,635453

5,764547

5,764547

0,059798

33,230002

9292,96

8214,785344

14

80,0

80,112244

-0,112244

0,112244

0,001403

0,012599

6400,00

6417,971597

15

88,9

111,097542

-22,197542

22,197542

0,249691

492,730887

7903,21

12342,663920

16

75,2

111,979385

-36,779385

36,779385

0,489088

1352,723150

5655,04

12539,382632

17

61,8

95,230836

-33,430836

33,430836

0,540952

1117,620763

3819,24

9068,912033

18

237,7

195,639679

42,060321

42,060321

0,176947

1769,070624

56501,29

38274,883901

19

160,5

63,827357

96,672643

96,672643

0,602322

9345,599910

25760,25

4073,931498

Σ:

1814,3

1814,300000

0,000000

516,946502

6,607452

24816,827187

226434,11

201617,282813

- за критерієм М.А.Р.Е. через визначення середньої відносної похибки прогнозу (9.97):

- через визначення коефіцієнта відповідності Тейла (9.98):

Висновок: Як видно з таблиці відповідності, обчислений рівень М.А.Р.Е. = 34,78 % знаходиться в межах від 20 % до 50 % , що означає задовільну якість прогнозу, а значення коефіцієнта відповідності Тейла КТ = 17,03 % в межах від 10 % до 20 %, що відповідає досить добрій якості прогнозу.

Загальні висновки: Отримана регресійна модель факторного зв’язку між валовим прибутком і двома факторами, основними фондами й оборотними засобами, характеризується сильним впливом останніх на валовий прибуток, чого не можна сказати про основні фонди, які через слабку кореляцію з валовим прибутком можна виключити з моделі, спростивши її без суттєвого погіршення загальної якості. Усі оцінки параметрів зв’язку є значущими на заданому рівні значущості критеріїв перевірки загальної якості моделі регресії. До того ж, модель має задовільні прогнозні можливості. Усі розрахунки виконані коректно, що підтверджують однакові результати від застосування різних способів обчислення одних і тих же самих характеристик зв’язку.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]