Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Задачник.doc
Скачиваний:
8
Добавлен:
13.11.2019
Размер:
6.75 Mб
Скачать

6.2. Задачі

6.2.1. Типові задачі

Власно-випадкова вибірка, повторний (безповторний) відбір.

Інтервальна оцінка параметра ГСС по заданій довірчій ймовірності.

Задача №15. Завдання. За умов задачі №5, на рівнях значущості α = 0,05 і α = 0,01 обраного критерію з’ясувати, якими є середні витрати на купівлю продуктів харчування 50 тис. сімей N-ої обл., якщо СКВ витрат останніх (σ) становить 578,79 грн. Якими будуть середні витрати при невідомій генеральній дисперсії? Виконати ці завдання для двох способів відбору: повторного і безповторного. Зробити порівняльний аналіз. Що відбудеться з границями довірчого інтервалу, якщо за інших рівних умов (ті ж самі значення середніх витрат, дисперсії, рівня значущості критерію і однаковий спосіб відбору) об’єм вибірки зменшити до 20 сімей?

Розв’язок. Дана задача зводиться до визначення границь довірчого інтервалу можливих значень середніх місячних витрат на купівлю продуктів харчування всіх 50 тис. сімей N-ої обл., які представляють ГСС, по результатах вибіркового аналізу лише 1000 відібраних для обстеження сімей, які представляють ВСС.

Якщо генеральна дисперсія є відомою (DГСС = σ² = 578,79² = = 334997,864100 грн. ²), то СКП вибірки обчислюється через значення и-критерію, а якщо вона невідома, то СКП вибірки обчислюється через значення t-критерію з тим же самим рівнем значущості α.

Однак, в останньому випадку замість заданої дисперсії у формулу СКП підставляється вибіркова дисперсія, скоригована об’ємом вибірки, тобто незміщена вибіркова оцінка генеральної дисперсії (6.5):

= ((750 – 1425)² ∙ 200 + (1250 – 1425)² ∙ 400 + (1750 – 1425)² ∙ 300 +

+ (2500 – 1425)² ∙ 100) : (1000 – 1) = 250625000 : 999 ≈ ≈ 250875,875876 ≈ 250875,88 (грн.²), –

де {750, 1250, 1750, 2500} (грн.) – середини інтервалів, а 1425 грн. – середнє арифметичне значення даного інтервального розподілу витрат.

1) Отже, на першому кроці інтервального оцінювання визначається пара числових характеристик вибіркового розподілу: вибіркові середнє (1425 грн.) і дисперсія (250875,88 грн.²).

2) Визначимо СКП:

а) через відому дисперсію (334997,864100 грн. ²):

- для повторного відбору (6.18)

,

- для безповторного відбору (6.19)

;

б) через незміщену вибіркову дисперсію (250875,88 грн. ²):

- для повторного відбору (6.18)

,

- для безповторного відбору (6.19)

3) Визначимо коефіцієнт довіри на рівні значущості α обраного критерію (Д.2, Д.4):

а) α = 0,05:

- для и-критерію:

|u|1 – α = |u|0,95 ≈ 1,9600,

- для t-критерію:

|t|m; 1 – α = |t|999; 0,95 ≈ 1,9623;

б) α = 0,01:

- для и-критерію:

|u|1 – α = |u|0,99 ≈ 2,5758,

- для t-критерію:

|t|m; 1 – α = |t|999; 0,99 ≈ 2,5808.

4) Визначимо граничну похибку вибірки δ (6.16):

4.1) при повторному відборі:

а) на рівні значущості α = 0,05:

- и-критерію:

δ = 18,302947 ∙ 1,9600 ≈ 35,873117 (грн.),

- t-критерію:

δ = 15,839062 ∙ 1,9623 ≈ 31,081647 (грн.);

б) на рівні значущості α = 0,01:

- и-критерію:

δ = 18,302947 ∙ 2,5758 ≈ 47,145267 (грн.),

- t-критерію:

δ = 15,839062 ∙ 2,5808 ≈ 40,876811 (грн.);

4.2) при безповторному відборі:

а) на рівні значущості α = 0,05:

- и-критерію:

δ = 18,118993 ∙ 1,9600 ≈ 35,512574 (грн.),

- t-критерію:

δ = 15,679871 ∙ 1,9623 ≈ 30,769261 (грн.);

б) на рівні значущості α = 0,01:

- и-критерію:

δ = 18,118993 ∙ 2,5758 ≈ 46,671433 (грн.),

- t-критерію:

δ = 15,679871 ∙ 2,5808 ≈ 40,465978 (грн.).

5) Визначимо границі довірчого інтервалу Іα (6.22):

5.1) при повторному відборі:

а) на рівні значущості α = 0,05:

- и-критерію (6.23):

Іα = [1425 – 35,873117; 1425 + 35,873117] ≈ [1389,13; 1460,87] (грн.; грн.),

- t-критерію (6.24):

Іα = [1425 – 30,769261; 1425 + 30,769261] ≈ [1393,92; 1456,08] (грн.; грн.);

б) на рівні значущості α = 0,01:

- и-критерію (6.23):

Іα = [1425 – 47,145267; 1425 + 47,145267] ≈ [1377,85; 1472,15] (грн.; грн.),

- t-критерію (6.24):

Іα = [1425 – 40,876811; 1425 + 40,876811] ≈ [1384,12; 1465,88] (грн.; грн.);

5.2) при безповторному відборі:

а) на рівні значущості α = 0,05:

- и-критерію (6.23):

Іα = [1425 – 35,512574; 1425 + 35,512574] ≈ [1389,49; 1460,51] (грн.; грн.),

- t-критерію (6.24):

Іα = [1425 – 30,769261; 1425 + 30,769261] ≈ [1394,23; 1455,77] (грн.; грн.);

б) на рівні значущості α = 0,01:

- и-критерію (6.23):

Іα = [1425 – 46,671433; 1425 + 46,671433] ≈ [1378,33; 1471,67] (грн.; грн.),

- t-критерію (6.24):

Іα = [1425 – 40,465978; 1425 + 40,465978] ≈ [1384,53; 1465,47] (грн.; грн.).

Зведемо результати розрахунків у порівняльну таблицю, в якій також представимо остаточні результати аналогічних розрахунків, але для вибірки з 20-ти сімей.

Порівняльна таблиця

Визначення границь довірчого інтервалу середньомісячних витрат на купівлю продуктів харчування (грн.) 50-и тис. сімей N-ої обл. (ГСС) по даних вибіркового обстеження (ВСС об’єму n)

Д ані про DГСС

Спосіб відбору

DГСС = 334997,8641 грн. ²

(и-критерій)

DГСС не відома

(t-критерій)

α = 0,05

α = 0,01

α = 0,05

α = 0,01

n =

= 1000

Повторний

[1389,13; 1460,87]

[1377,85; 1472,15]

[1393,92; 1456,08]

[1384,12; 1465,88]

Безповторний

[1389,49; 1460,51]

[1378,33; 1471,67]

[1394,23; 1455,77]

[1384,53; 1465,47]

n =

= 20

Повторний

[1171,34; 1678,66]

[1091,63; 1758,37]

[1190,58; 1659,42]

[1104,58; 1745,42]

Безповторний

[1171,39; 1678,62]

[1091,70; 1758,30]

[1190,63; 1659,37]

[1104,64; 1745,36]

Висновки. При безповторному відборі, в порівнянні з повторним відбором, за інших рівних умов (однакова дисперсія й однаковий рівень значущості критерію), спостерігається дуже незначне скорочення довжини довірчого інтервалу (менше, ніж на 0,01 %). Пояснюється це тим, що у формулі СКП безповторної вибірки величина √(1 – n/N) при значній відмінності n (1000) і N (50000) майже не відрізняється від одиниці (0,9899…), тому СКП повторної та безповторної вибірок майже однакові. При збільшенні об’єму вибірки різниця між похибками зростатиме, при повторному відборі СКП завжди залишається більшою, ніж при безповторному відборі, а якщо nN, останній дає СКП, яка наближається до 0.

Зменшення рівня значущості α (з 0,05 до 0,01) за інших рівних умов (один і той же самий спосіб відбору і однакова дисперсія) дає розширення границь довірчого інтервалу (на 31,42÷31,53 %; мала розбіжність пояснюється значною відмінністю n і N).

Враховуючи те, що незміщена вибіркова дисперсія (250875,88 грн.²) менша (на 25,11 %), ніж генеральна дисперсія (334997,8641 грн.²), а значення t-критерію, який застосовується при невідомій генеральній дисперсії, перевищує значення и-критерію з тим же самим рівнем значущості, але, на відміну від співвідношення дисперсій, незначно (на 0,12 % для α = 0,05 і на 0,19 % для α = 0,01), то за інших рівних умов (один і той же самий спосіб відбору і однаковий рівень значущості критерію), при невідомій генеральній дисперсії застосування її незміщеної вибіркової оцінки дає скорочення довжини довірчого інтервалу (на 13,28÷13,35 %; мала розбіжність пояснюється значною відмінністю n і N, а також достатньо великим об’ємом вибірки, при якому значення t-критерію наближається до значення и-критерію).

Суттєве зменшення об’єму вибірки (з 1000 сімей до 20, тобто в 50 разів) порівняно з об’ємом ГСС (50000) призводить до практично непомітної різниці між результатами повторного і безповторного відборів (довжина інтервалу при безповторному відборі зменшується на 0,018÷0,021 % порівняно з повто-

рним відбором), а от значення t-критерію вже помітно відрізняється від значення и-критерію (на 6,77 % для α = 0,05 і на 11,07 % для α = 0,01). Остання обставина обумовлює збільшення розбіжності у змінах довжини інтервалу (на 4,04÷8,21 %) за рахунок застосування різних дисперсій в обчисленні СКП. При зменшенні n в k разів сама СКП збільшується в √k разів (в даному випадку k = √50 ≈ 7,07).

Визначення довірчої ймовірності по заданій граничній похибці вибірки .

Задача №16. Початкові умови. Із різних вагонів з вугіллям, що поступило на електростанцію, в порядку власно-випадкового відбору взято 100 проб для визначення зольності вугілля. На основі аналізу зольності отримані наступні дані (див. таблицю).

Таблиця

Зольність, %

до 12

12-14

14-16

16-18

18-20

понад 20

Кількість проб

5

10

35

25

15

10

Завдання. Визначити ймовірність того, що похибка репрезентативності при обчисленні середньої зольності всього вугілля не перевищує 0,3 %. Зробити висновок.

Розв’язок. Дана задача є зворотною по відношенню до попередньої задачі, де похибку треба знайти із заданою ймовірністю. Тепер по заданій похибці маємо визначити довірчу ймовірність: гранична похибка задана; середню квадратичну похибку можна визначити через початкові данні вибіркового розподілу кількості проб; через коефіцієнт довіри, який визначимо як співвідношення граничної та середньоквадратичної похибок, по таблиці значень двостороннього t-критерію (генеральна дисперсія не відома) знайдемо шукану ймовірність. До того ж, даний ряд розподілу є інтервальним, тому його числові характеристики, середнє та дисперсію, розрахуємо по відповідних формулах. З умов задачі залишаються невизначеними нижня границя першого і верхня границя останнього інтервалів. Застосовуючи принцип аналогії (решта інтервалів мають однакову довжину – по 2 %), встановимо ці границі: 10 % і 22 % відповідно.

1) Визначимо середню (5.5) зольність:

= (11 ∙ 5 + 13 ∙ 10 + 15 ∙ 35 + 17 ∙ 25 + 19 ∙ 15 + 21 ∙ 10) : 100 =

= 1630 : 100 = 16,3 (%).

2) Визначимо дисперсію (5.16) зольності (при об’ємі вибірки у 100 проб вважатиме дисперсію незміщеною):

= ((11 – 16,3)² ∙ 5 + (13 – 16,3)² ∙ 10 + (15 – 16,3)² ∙ 35 + (17 – 16,3)² ∙ 25 +

+ (19 – 16,3)² ∙ 15 + (21 – 16,3)² ∙ 10) : 100 = 651 : 100 = 6,51 (%²).

3) Визначимо СКП вибірки (хоча відбір має бути безповторним, застосуємо формулу СКП повторної вибірки, тому що 100 проб по відношенню до загальної кількості доставленого вугілля є числом, значно меншим за одиницю, а це урівнює обидва способи обчислення СКП) (6.18):

≈ 0,255147 (%).

4) Визначимо коефіцієнт довіри:

= 0,3 : 0,255147 ≈ 1,175793.

5) Знайдемо шукану ймовірність (з таблиці значень t-критерію) для визначеного значення t-критерію з кількістю ступенів свободи m = 100 – 1 = 99 (Д.4):

р ≈ 0,758.

Якщо в даній задачі замість t-критерію застосувати и-критерій, результат відрізнятиметься незначно: р ≈ 0,760 (з таблиці значень и-критерію) (Д.2), – що обумовлюється достатньо великим об’ємом вибірки (n = 100).

Якщо дисперсію, обчислену в п. 2), скоригувати через об’єм вибірки (651 : 99 = 6,(57)), то остаточні результати зміняться майже непомітно (на 0,2÷0,4 %): р ≈ 0,755 для t-критерію і р ≈ 0,758 для и-критерію.

Висновок: Для того щоб за умов задачі похибка репрезентативності не перевищувала 0,3 %, необхідно міру точності у визначенні середньої зольності вугілля обрати на рівні 0,76 значення ймовірності двостороннього t- або и-критерію, остаточний вибір якого принципової різниці не має із-за достатньо великого об’єму вибірки.

Типова вибірка, визначення похибки оцінювання.

Задача №17. Завдання. По результатах розв’язку задачі №13 визначити з імовірністю 0,95 значення граничної похибки вибірки при обчисленні середніх витрат сімей N-ої обл. на купівлю продуктів харчування, якщо застосовувався 10%-ний пропорційний типовий відбір сімей, які проживають у міській і сільській місцевості. Зробити висновок.

Розв’язок. У цій задачі необхідно визначити СКП типової вибірки через середнє внутрішніх групових дисперсій витрат 10-ти міських і 10-ти сільських сімей, відібраних з генеральної сукупності, яка складається з 200-от (відбір 10%-ний) сімей N-ої обл., попередньо скоригувавши цю дисперсію (349500,00 грн.²) через об’єм вибірки (n = 20) (6.5):

1) незміщене середнє внутрішніх групових дисперсій

= 3449500 : 19 ≈ 181552,6316 (грн.²),

2) СКП вибірки (6.19)

≈ 38,11 (грн.).

3) Знайдемо коефіцієнт довіри із статистичної таблиці значень двостороннього t-критерію (через невідому генеральну дисперсію і малу вибірку в двадцять сімей) з кількістю ступенів свободи m = 20 – 1 = 19 на рівні значущості α = 1 – 0,95 = 0,05 (Д.4):

≈ 2,0930.

4) Визначимо граничну похибку вибірки (6.16):

δ = 2,093 ∙ 38,11 = 79,764230 ≈ 79,76 (грн.).

Висновок: Отже, з 200-от сімей N-ої обл., рівно половина яких проживає в міській місцевості, а друга половина – у сільській місцевості, кожна сім’я витрачає на продукти харчування у середньому наближено (з 5%-ною похибкою) 1570 ± 79,76 (грн.).

Серійна вибірка, визначення похибки оцінювання.

Задача №18. Початкові умови. У порядку серійного відбору з 10000 одиниць готових виробів, упакованих в 100 коробках по 100 одиниць в кожній, випадково перевірено 10 коробок: усі вироби кожної з них на відповідність стандартам. Унаслідок перевірки отримані наступні результати процента браку (див. таблицю).

Таблиця

№ коробки

5

15

25

35

45

55

65

75

85

95

% браку

1

2

4

3

5

2

6

3

1

3

Завдання. Визначити з імовірністю 0,95 процент браку в усій партії готових виробів. Зробити висновок.

Розв’язок. Ця задача розв’язується аналогічно задачі №15 з тією різницею, що в якості дисперсії бракованих виробів застосовується міжсерійна незміщена вибіркова дисперсія. Коефіцієнтом довіри є значення двостороннього t-критерію (через невідому генеральну дисперсію і малу вибірку в 10 коробок) з кількістю ступенів свободи m = 10 – 1 = 9 на рівні значущості α = 1 – 0,95 = = 0,05. СКП визначається за відповідною формулою (6.31).

1) Обчислимо числові характеристики (середнє (5.4) і дисперсію (5.15)) вибіркового розподілу, для чого результати проміжних розрахунків зведемо в розрахункову таблицю:

Отже, середній процент і дисперсія браку відповідно становлять:

= 30 : 10 = 3 (%),

= 24 :10 = 2,4 (%²).

2) Скоригуємо вибіркову дисперсію через об’єм вибірки (6.5):

= 2,4 ∙ 10 : 9 = 2,(66) (%²).

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]