m35674_18
.DOCПроверка гипотезы о нормальном распределении признака
с помощью критерия Пирсона
Проведем проверку на нормальность признака X, выборочное распределение которого задано следующей матрицей:
Образуем из матрицы А массив А1 поставив в один ряд строки матрицы А:
A1augment
A1= |
|
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
11 |
12 |
13 |
14 |
15 |
16 |
1 |
52.2 |
54 |
41 |
42 |
58.2 |
59.3 |
84.8 |
45 |
76.5 |
58.3 |
21 |
55 |
45 |
21.5 |
46 |
44 |
Вычислим размер выборки N, выборочную среднюю m и исправленное выборочное среднее квадратическое отклонение s массива А1:
N length N = 100
m mean(A1) m = 47.312
s Stdev(A1) s = 16.303
Найдем абсолютные эмпирические частоты и середины частичных интервалов:
Frhistogram (8, A)
|
|
Найдем размах выборки, левые и правые концы частичных интервалов:
R max(A1) min(A1) R = 75
Fright +
= (19.438 28.938 38.438 47.938 57.438 66.938 76.438 85.938)
i 2..8
100000
= ( 19.438 28.938 38.438 47.938 57.438 66.938 76.438)
100000
= (19.438 28.938 38.438 47.938 57.438 66.938 76.438 )
Найдем вероятности попадания в частичные интервалы значений признака при условии, что он имеет нормальное распределение, в котором в качестве числовых характеристик взяты выборочное среднее и исправленное выборочное среднее квадратическое отклонение: (учтем, что в конечном итоге сумма вероятностей должна быть равна 1):
Pteor pnorm(Fright, m, s) pnorm(Frleft, m, s)
= (0.044 0.086 0.163 0.222 0.217 0.153 0.077 0.037)
Сравним наблюдаемые и теоретические частоты:
obs exp Pteor N
= (4 11 12 24 23 13 7 6)
= (4.366 8.621 16.324 22.22 21.742 15.294 7.733 3.701)
Для принятия гипотезы введем уровень значимости:
0
Вычислим число степеней свободы критерия :
length(obs) 1 7
Вычислим наблюдаемое значение :
2 2 = 3.89
Вычислим критическое значение критерия при выбранном уровне значимости:
2 qchisp (1 , ) 2 = 14.067
Гипотеза о нормальности распределения признака не отвергается, если выполняется утверждение
2 > 2 = 1
Так как 1 в правой части выражения означает справедливость неравенства, принимаем гипотезу о нормальности признака X на выбранном уровне значимости 0.
Однофакторный дисперсионный анализ
Пусть на уровне значимости 0.05 требуется оценить степень влияния фактора А на признак Y, используя данные из следующей таблицы:
-
Уровни
фактора А
а1
а2
а3
13.4
10.2
8.1
Ре зуль-
5.8
9.5
7.3
таты
7.9
11.1
8.4
опытов
9.7
7.6
8.1
Составляем векторы-столбцы:
а1 а2 а3
Вводим необходимые постоянные:
общее число наблюдений N;
число наблюдений на уровнях а1, а2, а3 n1; n2; n3 соответственно;
число уровней фактора А k.
N length (a1) + length (a2) + length (a3)
n1 length (a1) n2 length (a2) n3 length (a3)
N = 15 n1 = 4 n2 = 6 n3 = 5
1. Вычисляем групповые средние значений по столбцам и общую среднюю:
Asr Asr = 8.827
2. Вычисляем факторную и остаточную суммы квадратов: