- •31. Класичне, статистичне та геометричне означення ймовірності.
- •32. Емпірична функція розподілу, її властивості та графік.
- •33.Різновиди випадкових подій
- •34. Точкові оцінки.
- •35. Перестановки, сполучення, комбінації : формули для обчислення.
- •36. Інтервальні оцінки
- •37. Перестановки, сполучення, комбінації : формули для обчислення.
- •38. Статистична перевірка гіпотез
- •39. Дії над множинами
- •40. Похибки перевірка гіпотез
40. Похибки перевірка гіпотез
Похибки першого роду і похибки другого роду в математичній статистиці — це ключові поняття завдань перевірки статистичних гіпотез. Проте, дані поняття часто використовуються і в інших областях, коли йдеться про ухвалення «бінарного» рішення (так/ні) на основі якогось критерію (тесту, перевірки, вимірювання), який з деякою вірогідністю може давати помилковий результат. Нехай дано вибірку з невідомого розподілу , и постовлена бінарна задача перевірки статистичних гіпотез:де H0 — нульова гіпотеза, а H1 — альтернативна гіпотеза. Припустимо, що заданий статистичний критерій,що зіставляє кожній реалізації вибірки одну з гіпотез, які маємо. Тоді можливі чотири ситуації:1Розподіл вибірки відповідає гіпотезі H0, і вона точно визначена статистичним критерієм, тобто .2Розподіл вибірки відповідає гіпотезі H0, але вона невірно знехтувана статистичним критерієм, тобто .3Розподіл вибірки відповідає гіпотезі H1, і вона точно визначена статистичним критерієм, тобто .4Розподіл вибірки відповідає гіпотезі H1, але вона невірно знехтувана статистичним критерієм, тобто .У другому і четвертому випадку говорять, що відбулася статистична помилка, і її називають похибкою першого і другого роду відповідно. Ймовірність похибки першого роду при перевірці статистичних гіпотез називають рівнем значущості і зазвичай позначають грецькою буквою α (звідси назва α-errors).
Ймовірність похибки другого роду не має якоїсь особливої загальноприйнятої назви, на папері позначається грецькою буквою β (звідси β-errors). Проте з цією величиною тісно зв'язана інша, що має велике статистичне значення — потужність критерію. Вона обчислюється за формулою (1 − β). Таким чином, чим вище потужність, тим менше вірогідність зробити похибку другого роду.Обидві ці характеристики зазвичай обчислюються за допомогою так званої функції потужності критерію. Зокрема, ймовірність похибки першого роду є функцією потужності, обчисленою при нульовій гіпотезі. Для критеріїв, заснованих на вибірці фіксованого обсягу, ймовірність похибки другого роду є одиниця мінус функція потужності, обчислена в припущенні, що розподіл спостережень відповідає альтернативній гіпотезі. Для послідовних критеріїв це також вірно, якщо критерій зупиняється з ймовірністю одиниця (при даному розподілі з альтернативи).У статистичних тестах зазвичай доводиться йти на компроміс між прийнятним рівнем похибок першого і другого роду. Часто для ухвалення рішення використовується порогове значення, яке може варіюватися з метою зробити тест строгішим або, навпаки, м'якшим. Цим пороговим значенням є рівень значущості, яким задаються при перевірці статистичних гіпотез. Наприклад, у разі металлодетектора підвищення чутливості приладу приведе до збільшення ризику похибки першого роду (помилкова тривога), а пониження чутливості — до збільшення ризику похибки другого роду (пропуск забороненого предмету).