- •Частина іі Математична статистика
- •Розділ іv. Статистична перевірка гіпотез
- •1.1 Статистичний розподіл вибірки
- •1.2 Емпірична функція розподілу
- •1.3 Полігон та гістограма
- •Приклад 3. Вибірку задано у вигляді розподілу частот
- •1.4 Тренувальні вправи
- •2.1 Точкові оцінки параметрів розподілу
- •Основні властивості вибіркової середньої
- •1) При множенні усіх варіант вибірки на однаковий множник вибіркова середня також множиться на цей множник:
- •Приклад 1. Вибіркова сукупність задана таблицею
- •2.2 Інтервальні оцінки параметрів розподілу
- •2.3 Тренувальні вправи
- •2.4 Обчислення параметрів розподілу методом добутків
- •2.5 Індивідуальне семестрове завдання №1 “Статистичний розподіл вибірки. Обчислення параметрів розподілу методом добутків”
- •2.6 Зразок виконання індивідуального семестрового завдання №1
- •2.7 Обробка вибірки методом найменших квадратів
- •2.8 Тренувальні вправи
- •2.9 Індивідуальне семестрове завдання №2 «Метод найменших квадратів»
- •2.10 Зразок виконання індивідуального семестрового завдання №2
- •Розділ ііі. Елементи теорії кореляції
- •3.2 Лінійна кореляція
- •3.3 Криволінійна кореляція
- •3.4 Рангова кореляція. Вибірковий коефіцієнт рангової кореляції Спірмена
- •3.5 Тренувальні вправи
- •3.6 Індивідуальне семестрове завдання №3 “Знаходження вибіркового коефіцієнта кореляції та прямих ліній регресії”
- •Варіант 5. Розподіл 50 за вартістю основних виробничих фондів (млн. Грн) та витратами (% до вартості основних фондів) на капітальний ремонт дано у таблиці:
- •Варіант 6. Розподіл 40 заводів кольорової металургії за середньодобовим виробленням металу (тис.Т) та затратами електроенергії на 1 тн. (тис. КВт-год) дано у таблиці:
- •Варіант 7. Розподіл 80 корів за живою вагою (кг) та надоями молока (кг) дано у таблиці:
- •Варіант 8. Розподіл 100 ткацьких фабрик за виробничими потужностями (тис. М. На рік) та собівартістю 1 м тканини (грн) дано у таблиці:
- •Варіант 9. Розподіл 100 прямокутних чавунних плиток за довжиною (см) та масою (кг) дано у таблиці:
- •Варіант 10. Розподіл 200 заводів за вартістю основних фондів (млн. Грн.) та вартістю готової продукції ( млн. Грн.) дано у таблиці:
- •Варіант 11. Розподіл підприємств за об’ємом продукції (грн) та за її собівартістю (грн) надано у таблиці:
- •Варіант 12. Розподіл 120 вагонних коліс за терміном служби (в роках) та величиною зносу ободу колеса (в мм) дано у таблиці:
- •Варіант 14. Розподіл 100 проб руди з вмістом окису заліза (%) та закису заліза (%) дано у таблиці:
- •Варіант 15. Розподіл однотипних підприємств за вартістю основних фондів (млн. Грн) та собівартістю одиниці продукції (грн) дано у таблиці:
- •Варіант 16. Розподіл 100 прямокутних плиток за їх довжиною (см) та масою (кг) дано у таблиці:
- •За відповідним рівнянням регресії оцінити середнє значення собівартості вугілля тих шахт, глибина виробок яких складає 800 м, та порівняти одержаний результат з відповідним груповим середнім.
- •За відповідним рівнянням регресії оцінити середнє значення газоносності тих шахт, глибина виробок яких складає 900 м, та порівняти його з відповідним груповим середнім.
- •3.7 Зразок виконання індивідуального семестрового завдання №3 Розподіл однотипних підприємств за вартістю основних фондів (млн. Грн) та собівартістю одиниці продукції (грн) дано у таблиці:
- •3.8 Питання для самоперевірки
- •Розділ іv. Статистична перевірка гіпотез
- •4.1 Поняття статистичної гіпотези
- •4.2 Критична область. Знаходження критичних областей
- •4.3 Критерій узгодження Пірсона
- •4.4 Тренувальні вправи
- •4.5 Питання для самоперевірки
- •Література
- •Додатки Додаток а Таблиця значень функції (х)
- •Додаток б
- •Додаток в
- •Додаток д
- •Додаток е Критичні точки розподілу 2
- •Додаток ж Критичні точки розподілу Стьюдента
- •Додаток и Критичні точки розподілу f Фішера – Снедекора
- •Додаток к Критичні точки розподілу Колмогорова
3.2 Лінійна кореляція
Якщо обидві лінії регресії на й на – прямі, то кореляція називається лінійною.
Для оцінки сили лінійного кореляційного зв'язку служить вибірковий коефіцієнт кореляції .
Вибірковий коефіцієнт кореляції визначається рівністю
,
де: – варіанти ознак Х та Y ;
– частота пари ;
– об'єм вибірки;
– вибіркові середні квадратичні відхилення;
– вибіркові середні ознак Х та Y.
Якщо перейти до умовних варіант
,
то вибірковий коефіцієнт кореляції обчислюється за формулою
.
Рівняння прямих регресії Y на Х та Х на Y мають вигляд
,
.
де – умовні середні, тобто середні значення однієї змінної, які відповідають певному значенню іншої.
Приклад 1. Розподіл 195 рослин за загальною вагою всієї рослини Х (г) та вагу насіння Y (г) дано у таблиці:
|
|
|
||||
35-45 |
45-55 |
55-65 |
65-75 |
75-85 |
||
12,5-17,5 |
5 |
10 |
|
|
|
10 |
17,5-22,5 |
7 |
7 |
27 |
|
|
41 |
22,5-27,5 |
|
26 |
40 |
24 |
|
90 |
27,5-32,5 |
|
|
20 |
10 |
4 |
34 |
32,5-37,5 |
|
|
|
8 |
12 |
20 |
|
12 |
43 |
87 |
42 |
16 |
195 |
За відповідним рівнянням регресії оцінити середню вагу насіння тих рослин, вага яких дорівнює 60 г, та порівняти її з відповідним груповим середнім.
Допускаючи, що між Х та існує лінійна кореляційна залежність:
1. Обчислити коефіцієнт кореляції й проаналізувати тісноту і напрямок зв'язку між Х та .
2. Скласти рівняння прямих регресії на X та Х на .
3. За відповідним рівнянням регресії оцінити середню вагу насіння тих рослин, вага яких дорівнює 60 г, та порівняти її з відповідним груповим середнім.
Розв’язання.
Перейдемо до дискретних розподілів, тобто значення змінних X та приймемо середини відповідних інтервалів.
|
|
|
||||
40 |
50 |
60 |
70 |
80 |
||
15 |
5 |
10 |
|
|
|
10 |
20 |
7 |
7 |
27 |
|
|
41 |
25 |
|
26 |
40 |
24 |
|
90 |
30 |
|
|
20 |
10 |
4 |
34 |
40 |
|
|
|
8 |
12 |
20 |
|
12 |
43 |
87 |
42 |
16 |
195 |
Для обчислення вибіркового коефіцієнта кореляції потрібно обчислити вираз , для чого скласти кореляційну таблицю в умовних варіантах.
За умовний нуль взято варіанту х = 60, а за умовний нуль взято варіанту у = 25, які розташовані приблизно в серединах відповідних варіаційних рядів.
У кожній клітині, у якій частота , записуємо в правому верхньому куті добуток частоти на варіанту и .
Знаходимо суму всіх чисел, що стоять в правих верхніх кутах клітинок одного рядка й записуємо її в клітинку стовпчика и .
Множимо варіанту v на u й отриманий добуток записуємо в останню клітинку того ж рядка.
3 метою контролю аналогічні обчислення проводимо в стовпчика, причому добутки записуємо в лівому нижньому куті кожної клітинки, для яких , після чого їх додаємо і одержану суму записуємо в рядок V.
Потім множимо варіанту и на v й результат записуємо в останньому рядку.
|
|
|||||||
|
-2 |
-1 |
0 |
1 |
2 |
|
|
|
-2 |
|
|
|
|
|
10 |
-20 |
40 |
-1 |
7 |
|
|
|
|
41 |
-21 |
21 |
0 |
|
|
|
|
|
90 |
-2 |
0 |
1 |
|
|
|
|
|
34 |
18 |
18 |
2 |
|
|
|
|
|
20 |
32 |
64 |
|
12 |
43 |
87 |
42 |
16 |
195 |
195 |
|
|
-17 |
-27 |
-7 |
26 |
28 |
|
|
|
|
34 |
27 |
0 |
26 |
56 |
|
|
143 |
5) Обчислюємо й :
.
.
6) Обчислюємо допоміжні величини й :
.
.
7) Обчислимо й :
.
.
8). Шуканий вибірковий коефіцієнт кореляції:
.
Тому що > 0, цей зв'язок прямий.
9). Вибіркове рівняння прямої лінії регресії У на Х має вигляд:
Обчислимо ( 0, , , ):
.
.
.
10) Рівняння прямої лінії регресії на X:
.
.
.
.
11) Рівняння прямої лінії регресії X на :
.
.
.
За відповідним рівнянням регресії оцінити середню вагу насіння тих рослин, вага яких дорівнює 60 г, та порівняти її з відповідним груповим середнім.
.
.
Якщо скористатися безпосередньо таблицею, то
.
Як видно, узгодження розрахункового і спостережуваного умовних середніх – задовільне.