- •"Анализ данных в информационных технологиях"
- •Лабораторная работа № 2
- •"Оценки параметров случайных величин. Проверка статистических гипотез"
- •2.1. Цель работы
- •2.2. Возможности, представляемые пакетом Statgraphics Centurion XVI для оценки параметров случайных величин и проверки гипотез
- •2.2.1. Некоторые числовые характеристики случайных величин.
- •2.2.2. Точечное оценивание числовых характеристик случайных величин.
- •2.2.2.1. Суммарные статистики (Summary Statistics).
- •2.2.2.2. Оценки квантилей (Percentiles).
- •2.2.2.5. Оценка показателей корреляционной связи.
- •2.2.3. Построение доверительных интервалов числовых характеристик случайных величин.
- •2.2.4. Проверка статистических гипотез.
- •2.2.4.1. Проверка гипотез о значении параметра случайной величины.
- •2.2.4.2. Проверка гипотезы о законе распределения вероятностей случайной величины.
- •2.2.5. Использование меню пакета.
- •2.2.5.1. Раздел главного меню Plot
- •2.2.5.2. Раздел главного меню Describe
- •2.3. Задание на лабораторную работу
- •2.3.1. Изучить средства построения статистик выборки.
- •2.3.2. Изучить свойства процедур оценивания параметров и проверки статистических гипотез.
- •2.3.2.1. Свойства точечных оценок..
- •2.3.2.2. Свойства интервальных оценок.
- •2.3.2.3. Параметрические гипотезы.
- •2.3.2.4. Критерии согласия.
- •2.4. Требования к оформлению отчета по лабораторной работе
- •Реквизиты предшествуют тексту отчета.
- •2.5. Контрольные вопросы
- •Литература 2
- •2.1. Цель работы 2
- •2.2. Возможности, представляемые пакетом Statgraphics Centurion XVI для оценки параметров случайных величин и проверки гипотез 3
- •2.3. Задание на лабораторную работу 12
- •2.4. Требования к оформлению отчета по лабораторной работе 16
- •2.5. Контрольные вопросы 17
2.2.5. Использование меню пакета.
2.2.5.1. Раздел главного меню Plot
Помимо средства визуализации результатов наблюдений их статистик в разделе главного меню: Plot доступны возможности для проверки статистических гипотез и построения доверительных интервалов.
Для двадцати двух законов распределения вероятностей доступно:
в режиме "Analysis Option" (вызывается правой кнопкой мыши) задание параметров распределения вероятностей;
в режиме " Tables and graphs" (вызывается в меню пункта Probability Distribution) выбор функции: распределения вероятностей, обратной функции распределения вероятностей, генерация случайных чисел или значения параметров;
если выбрана обратная функция распределения вероятностей (Inverse CDF), то в режиме "Pane Option" (вызывается правой кнопкой мыши) можно задать значения уровней квантиля и/или критического значения распределения вероятностей.
Последнее используется для определения границ доверительного интервала или порогов принятия решения.
2.2.5.2. Раздел главного меню Describe
Используется для проверки соответствия результатов наблюдений выбранному закону распределения вероятностей. Выбор распределения вероятностей осуществляется в режиме "Analysis Option" (вызывается правой кнопкой мыши). В режиме " Tables and graphs" (вызывается в меню пункта Probability Distribution) выбирается позиция “Goodness jf Fit Test”.
2.3. Задание на лабораторную работу
2.3.1. Изучить средства построения статистик выборки.
Используются те же данные, которые использовались в лабораторной работе № 1.
Нужно найти значения тех статистик, которые можно сопоставить с соответствующими графиками лабораторной работы № 1.
Для сопоставления с «ящиком с усами» и гистограммой следует использовать оценки:
Математического ожидания.
Среднеквадратичного отклонения.
Медианы.
Коэффициента асимметрии.
Диаграммы рассеяния и множественные «ящики с усами» следует сопоставлять с оценками ковариации и коэффициентов корреляции.
Результаты анализа вероятностной бумаги следует сопоставить результатами работы критериев согласия.
2.3.2. Изучить свойства процедур оценивания параметров и проверки статистических гипотез.
2.3.2.1. Свойства точечных оценок..
Для одной из сгенерированных в лабораторной работе № 1 случайных величин: X1 или X2 (по выбору студента) построить оценки параметров для отдельных подвыборок объемом (n): 10, 20, 30, 50, 70, 80. 100 наблюдений (выборок объема nk=10k (1k10)). Сравнить значения оценок с истинными значениями параметров. Сравните поведение выборочного размаха и оценки средне квадратичного отклонения от числа наблюдений. Построить графики значений оценок математического ожидания и среднего квадратичного отклонения (и их абсолютных отклонений от истинных значений) как функций числа наблюдений. Дать интерпретацию построенным графикам.
2.3.2.2. Свойства интервальных оценок.
Построить доверительные интервалы математического ожидания и дисперсии нормально распределенной случайной величины (для различных объемов выборки). Оба параметра считаются неизвестными. Значение доверительной вероятности для построения интервалов заданы в табл. 2.1. Построить графики значений границ интервалов математического ожидания и среднего квадратичного отклонения (на графиках должно быть показано истинное значение соответствующего параметра) и длин интервалов как функций числа наблюдений. Отметить случаи, когда истинное значение параметра не было накрыто интервалом. Дайте анализ полученных результатов.
Значение доверительной вероятности для построения интервалов заданы в табл. 2.1.
Доверительная вероятность Таблица 2.1
№ |
|
№ |
|
№ |
|
№ |
|
1 |
0,90 |
11 |
0,79 |
21 |
0,678 |
|
|
2 |
0,91 |
12 |
0,96 |
22 |
0,996 |
|
|
3 |
0,92 |
13 |
0,76 |
23 |
0,966 |
|
|
4 |
0,93 |
14 |
0,99 |
24 |
0,878 |
|
|
5 |
0,94 |
15 |
0,89 |
25 |
0,898 |
|
|
6 |
0,85 |
16 |
0,84 |
26 |
0,994 |
|
|
7 |
0,95 |
17 |
0,72 |
27 |
0,896 |
|
|
8 |
0,87 |
18 |
0,81 |
28 |
0,796 |
|
|
9 |
0,88 |
19 |
0,97 |
29 |
0,788 |
|
|
10 |
0,98 |
20 |
0,69 |
30 |
0,888 |
|
|