Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
tema6.doc
Скачиваний:
13
Добавлен:
08.11.2018
Размер:
907.78 Кб
Скачать

Розподіл

Нехай незалежні випадкові величини х1, х2,..., хn розподілені за нормальним законом з m=0 та =1. Закон розподілу випадкової величини ,

називається хі-квадрат розподілом з n ступенями свободи (кількість незалежних координат).

Зі збільшенням ступенів свободи розподіл наближається до нормального.

На рис. 3. зображені графіки деяких функцій щільності випадкової величини, яка має χ2 - розподіл.

Рис. 3

Функції щільності випадкової величини, яка має χ2 – розподіл

Розподіл Ст’юдента (Госсета)

Нехай х, у незалежні випадкові величини, причому х розподілена за нормальним законом з параметрами (0;1), у – за законом з n ступенями свободи. Тоді, розподіл випадкової величини називається розподілом Ст’юдента з n ступенями свободи або t-розподілом.

При збільшенні числа ступенів свободи розподіл Ст’юдента наближається до нормального.

Для розподілу Ст’юдента при різних n складено таблиці.

Як приклад, на рис. 4 зображено графік функції щільності випадкової величини, яка розподілена за Ст'юдентом.

Рис. 4. Функція щільності випадкової величини, розподіленої за Ст'юдентом

Елементи вибіркової теорії.

Кінцевою метою аналізу даних будь-яких медико-біологічних досліджень є виявлення певних зв’язків між показниками біологічних об’єктів. Тобто взаємозв’язків, які притаманні усій множині подібних об’єктів – генеральній сукупності на основі дослідження обмеженої групи цих об’єктів – вибірки.

Звичайно, при будь-яких дослідженнях ідеально було б перевірити всі можливі ситуації - визначити всі можливі значення досліджуваної ознаки, що складають генеральну сукупність (сукупність, в якій досліджуються всі випадки). Проте дослідити всі випадки не можливо, тому для аналізу використовують вибіркову сукупність або вибірку (відібрану частину генеральної сукупності).

Щоб результати аналізу адекватно відображали досліджувані закономірності необхідно забезпечити наступні властивості вибірки.

Однорідність. При вибірці впливи досліджуваної сукупності факторів на досліджувані ознаки не повинні суперечити один одному. Наприклад, при дослідженні впливу кави на організм людини, у вибірці одночасно не повинно бути людей, яких кава збуджує, і тих, котрих від неї хилить у сон.

При вибірці не повинно бути значимо впливаючих на досліджуваний параметр факторів, крім тих, котрі ми вивчаємо. Якщо ми припускаємо, що препарат в загальному випадку не викликає алергії, то при дослідженні не повинно повинно бути людей, що мають алергію.

Репрезентативність (структурна відповідність). Досліджувана вибірка повинна мати ті ж суттєві для дослідження ознаки, що і генеральна сукупність, тобто вид розподілу вибірки повинен відповідати розподілу генеральної сукупності, а величина вибірки повинна бути достатньою для відображення структури генеральної сукупності.

У зв'язку з цим вибірка з хворих, що проходили курс лікування в одній клініці чи покупців однієї аптеки не є репрезентативною по своїй структурі.

Наприклад, синдром Дауна – тяжке спадкове захворювання, яке зустрічається з частотою 1/800 або 1/1000. Проводиться дослідження з метою виявлення діагностичних маркерів захворювання. Для цього вимірювалося значення певного параметру в контрольній групі і в групі хворих на це захворювання. У результаті дослідження була сформована вибірка з 3000 пацієнтів, серед яких у 100 пацієнтів спостерігався синдром Дауна. Ця вибірка не буде репрезентативною, оскільки частота синдрому Дауна в ній становить 1/29, що не відповідає об’єктивному популяційному показнику. Відповідно результати такого дослідження не можуть розглядатися як об’єктивні закономірності.

Основним правилом при формуванні достатньо чисельної для дослідження (репрезентативної) вибіркової сукупності є створення рівної можливості попадання у вибірку всіх членів генеральної сукупності. У цьому випадку застосовують випадковий відбір її членів (спосіб рандомізації).

Наприклад, щоб зробити випадкову вибірку з 100 студентів вищих навчальних закладів, можна скласти папірці з іменами всіх студентів вузу в капелюх, а потім дістати з неї 100 папірців — це буде випадковим відбором

Рандомізація експериментальних даних має за мету максимальне виключення суб’єктивного впливу спеціаліста-дослідника (лікаря, біолога, хіміка і т.д.), що доволі важко. Вплив людини може бути присутній на буд-якому етапі підготовки даних для подальшого аналізу. Це насамперед формування груп даних (експериментальної і контрольної) для їх подальшого порівняння. Твердження, що групові дані отримані з генеральної сукупності випадково, має на увазі що будь-який елемент генеральної сукупності може з однаковою ймовірністю попасти в будь-яку з груп за умови, що їх обсяги рівні. Завдання рандомізації у цьому випадку – забезпечити такі умови проведення досліджень, при яких контрольна група нічим не відрізняється від експериментальної окрім фактора, який досліджується (напр. методу лікування)

Збіг умов спостережень. Умови спостереження для окремих елементів вибірки чи двох порівнюваних вибірок повинні збігатися. Найкращим способом забезпечення цієї властивості є подвійний сліпий метод, при якому ні пацієнт, ні лікар, ні середній медичний персонал не знають ліки чи плацебо видаються конкретному хворому. Це дозволяє позбутися ефекту навіювання (вплив якого можливий на 30-50% пацієнтів) і ефекту упередженості.

Елементи вибіркової сукупності x1…xn називаються варіантами.

Кожна варіанта вибірки може спостерігатися ni раз (ni ≥ 1), число ni називають частотою варіанти xi.

При цьому

де k – кількість варіант, що різняться числовим значенням;

n – обсяг вибірки.

Відношення частоти ni варіанти xi до обсягу вибірки n називають її відносною частотою і позначають через pi , тобто

Для кожної вибірки виконується рівність

Варіаційним рядом х(1) х(2) ... х(k) називається вибірка, записана в порядку зростання її елементів.

Вибірки великих обсягів важко обробляти, тому для таких вибірок діапазон значень вибірки розбивається на рівні інтервали і підраховується для кожного інтервалу частота - кількість спостережень, що потрапили в нього, та відносна частота – частота, віднесена до загального числа спостережень n. Таким інтервалам відповідає інтервальний варіаційний ряд.

[a1, a2), [a2, a3), [a3, a4), …, [ar-1,ar],

де x(1)=a1<a2<a3<a4<…<ar=x(k).

Перелік варіант варіаційного ряду і відповідних їм частот, або відносних частот, називають дискретним статистичним розподілом вибірки.

Дискретний статистичний розподіл вибірки можна подати емпіричною функцією F* (x) – функцією, що визначає відносну частоту події Xx, тобто

де nxкількість варіант статистичного розподілу вибірки, значення яких менше за фіксовану варіанту x;

У реальних дослідженнях закон розподілу невідомий, але з тих чи інших міркувань можна зробити певний прогноз щодо його виду. Для якісного оцінювання форми закону розподілу широко застосовують наочні графічні методи.

Дискретний статистичний розподіл вибірки можна зобразити графічно у вигляді ламаної лінії, відрізки якої сполучають координати точок (xi;ni), або (xi; pi). У першому випадку ламану лінію називають полігоном частот (рис.5), у другому – полігоном відносних частот.

Р ис.5. Полігон частот.

Графічне представлення розподілу частот по інтервалах називають гістограмою;

Для побудови гістограми весь діапазон отриманих значень розбивають на малі інтервали і підраховують ймовірність попадання випадкової величини в даний інтервал, тобто вісь ординат – це вісь ймовірностей попадання випадкової величини в даний інтервал, а вісь абсцис – це вісь результатів спостережень, котрі розбиті на напівзамкнені інтервали. Отримаємо фігуру, що складається з прямокутників, кількість яких дорівнює числу інтервалів на які розбиті результати спостережень.

Прикладами таких спостережень є частота серцевих скорочень, частота дихання у групи осіб (рис. 6); розподіл числа імпульсів, що поступають від звукового генератора за певний проміжок часу тощо.

Рис.6. Гістограма.

До основних статистичних характеристик випадкової величини належать:

  • Середнє вибіркове значення – найбільш ймовірне значення вимірюваної величини:

де xi – варіанта варіаційного ряду вибірки

ni - частота цієї варіанти;

n – обсяг вибірки ( n = ∑ni ).

  • Модою Mo* дискретного статистичного розподілу вибірки називають варіанту, що має найбільшу частоту появи.

  • Медіаною Me* дискретного статистичного розподілу вибірки називають варіанту, яка поділяє варіаційний ряд на дві частини, рівні за кількістю варіант.

Для знаходження медіани, ряд необхідно записати за зростанням (прорангувати). При непарній кількості варіант медіана – це варіанта, розташована точно в середині варіаційного ряду, а при парній кількості дорівнює півсумі двох суміжних варіант у середині ряду. Медіана містить інформацію, яку не може дати середнє вибіркове, наприклад коли ряд різко асиметричний.

  • Дисперсія вибірки – середнє арифметичне квадратів відхилень варіант відносно середнього вибіркового значення

  • Середнє квадратичне відхилення вибірки σв. При обчисленні Dв відхилення підноситься до квадрата, а отже, змінюється одиниця виміру ознаки X, тому на основі дисперсії вводиться середнє квадратичне відхилення

Зазвичай використовують незміщену оцінку дисперсії

  • Розмах вибірки – дорівнює різниці між найбільшою xmax і найменшою xmin варіантами варіаційного ряду. Використовується для грубого оцінювання варіант відносно середнього.

R=xmax-xmin

Перші три показники описують положення випадкової величини по числовій осі. Останні три характеристики дозволяють оцінити наскільки зосереджені експериментальні дані відносно центру.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]