Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги / Теория вероятностей и математическая статистика. Прикладная статистика с использованием MS EXCEL

.pdf
Скачиваний:
8
Добавлен:
12.11.2023
Размер:
3.04 Mб
Скачать

нажатой ЛКМ по столбцу А до ячейки А15 задаем значения аргумента х с шагом 0,5 (способ задания арифметической прогрессии в Excel).

В ячейке В2 задаем функцию НОРМРАСП (А2; 0; 1; ИСТИНА), в ячейке С2 задаем функцию НОРМРАСП (А2; 0; 1; ЛОЖЬ), копируем формулы из ячеек В2 и С2 в ячейки В3:В14 и С3:С14 аналогично примеру 1.1. Результаты показаны на рис. 1.6, б в столбцах В и С.

Приведенные примеры показывают эффективность использования MS Excel для вычисления значений функций нормального распределения и их квантилей в сравнении с рассмотренным выше использованием табулированной нормированной функции Лапласа Ф0 (х).

1.2.2. Распределение χ2

Распределение χ2 случайной величины Х определяется плотностью вероятностей:

0,

 

 

 

 

 

 

 

 

 

 

x ≤ 0;

 

 

 

 

1

 

 

 

ν−2

 

 

x

 

 

 

 

 

 

 

 

 

 

 

 

 

 

f (x) =

 

 

 

 

 

x

2

exp

 

 

,

x > 0,

(1.8)

 

ν

 

ν

 

 

 

2

2

 

 

 

 

2

 

 

 

 

 

Γ

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

где ν ≥1 – число степеней свободы – параметр, определяющий

распределение; Γ(z) = yz1 exp(− y)d y – гамма-функция.

0

Случайные величины, имеющие распределение χ2 с ν степенями свободы, обозначают χν2 . Математическое ожидание и дисперсия распределения χν2 равны соответственно ν и 2ν. График этой функции при различных значениях ν приведен на рис. 1.7.

21

Рис. 1.7. Плотность χ2-распределения для различных степеней свободы ν = 1; 4; 10; 20

Многочисленные применения χ2-распределения в теории

вероятностей и математической статистике основаны на следующей его интерпретации.

Пусть X1, X2 , X3 , ..., Xn – случайные величины, имеющие стандартное нормальное распределение

Xi ~ N (0;1), i =1,2, ...,ν.

 

 

ν

 

Тогда случайная величина

χ2

= Xi2

имеет распределе-

 

 

i=1

 

ние χ2 с ν степенями свободы.

 

 

 

Квантили распределения

χν2

при

малых значениях

ν (ν ≤ 30) находятся с помощью справочных таблиц или с помощью прикладных пакетов программ.

22

Распределение χ2 при больших значениях ν (ν > 30) с достаточной для практических расчетов точностью аппроксимируется нормальным распределением N (ν;2ν), или, другими словами, распределение χ2 асимптотически нормально со средним ν и дисперсией 2ν. Для вычисления квантилей рас-

пределений χν2

при больших ν

(ν > 30)

используютформулу

 

χ2

 

 

1

u

 

+ 2ν −1 2 .

 

 

 

 

 

 

p; ν

 

 

2

p

 

 

 

 

 

 

Для квантилей малого порядка p

 

более точное значение

можно определить из соотношения

 

 

 

 

 

χ2

≈ ν

1

2

+u

p

2

3 .

 

 

 

 

 

p;ν

 

 

 

9

ν

 

9ν

 

Здесь up

 

 

 

 

 

 

 

– квантиль порядка

p стандартного нормально-

го распределения (1.3).

В табличном процессоре MS Excel 2003 для работы с распределением χ2 используются следующие две статистические функции (см. прил. 2):

ХИ2РАСП (х; ν) – возвращает Р{X > x} = 1 – F(x) (одностороннюю вероятность) дляраспределенияχν2 ;

ХИ2ОБР (р; ν) – возвращает значение, обратное односторонней вероятности распределения χ2 (Р{X > x} = 1 – F(x) =

=р) – квантиль x1p, ν дляраспределенияχν2 .

Пример 1.4. Вычислить с помощью функции ХИ2РАСП (х; ν) функцию распределения F(x) распределенияχ32 , а с по-

мощью функции ХИ2ОБР (р; ν) для полученных значений F(x) = Р{X < x} = p вычислить квантили уровня р этого распределения для значений х от 0 до 5 с шагом 0,5.

Решение: Зададим в ячейках A1:C1 названия столбцов, в А2 – значение 0, в А3 – значение 0,5, выделим эти обе ячейки

23

и протаскиванием черного крестика – маркера заполнения при нажатой ЛКМ по столбцу А до ячейки А13 задаем значения аргумента х с шагом 0,5. В ячейке В2 задаем функцию 1–ХИ2РАСП (А2; 3), в ячейке С2 задаем функцию ХИ2ОБР (1–В2; 3), копируем формулу из ячейки В2 в ячейки В3:В12, а затем формулу из С2 в С3:С12 аналогично примеру 1.1. Результаты показаны на рис. 1.8 в столбцах В и С.

Рис. 1.8. Результаты вычислений для примера 1.4

Следовательно, при практическом нахождении квантилей

χ2

,

χ2

и χ2

в подразд. 4.1.3, 5.1, 5.3.1 аргу-

α/ 2, ν−1

1−α/ 2, ν−1

1−α, ν−1

 

мент «вероятность р» в ХИ2ОБР (р; ν) следует задавать через вероятность противоположного события соответственно, как: p =1−α/ 2; p =11−α/ 2 = α/ z; p =11−α = α.

24

1.2.3. Распределение Стьюдента

Распределение Стьюдента (t-распределение) названо в честь английского математика В. Госсета, публиковавшегося под псевдонимом «Student». Распределение случайной величины Т определяется плотностью вероятностей:

 

 

 

k +1

 

 

 

 

 

 

 

 

Γ

 

 

 

 

 

t

2

 

 

 

 

2

 

 

 

 

f (t ) = St (t,k ) =

 

 

 

 

 

 

 

(1.9)

 

 

 

 

1+

 

 

 

, − ∞ < t < ∞.

 

 

k

k

 

 

 

 

 

 

 

 

 

 

 

 

πkΓ

 

 

 

 

 

 

Параметр k

 

 

 

 

2

 

 

 

 

 

 

– число

степеней

 

свободы распределения,

математическое ожидание

M (T ) = 0

 

 

существует только при

k >1, дисперсия

D(T ) =

k

– только приk > 2. Распределе-

k 2

 

ние Стьюдента симметрично относительно x = 0, при k = 1 оно

является распределением Коши:

f (t ) =

1

 

; при k → ∞

π 1+t2

)

 

(

 

)

 

(

)

 

(

 

St

t;k

N

 

 

 

 

 

 

 

0;1 , то есть стремится к стандартному нормаль-

ному распределению.

На рис. 1.9 приведены графики плотности распределения Стьюдента для трех значений k.

Рис. 1.9. Плотность распределения Стьюдента для трех значений степени свободы: k = 1; 5; ∞ [=N(0;1)]

25

Это распределение используется при малых объемах выборок для проверки гипотез и для определения доверительных интервалов. При больших значениях k (k > 30) для вычисления

квантилей распределения Стьюдента используют соотношение:

 

tp;k

up .

 

Распределению Стьюдента с n степенями свободы под-

чиняется, например, случайная величина

 

T =

Z

 

,

(1.10)

 

 

k

χk2

k

 

 

 

гдеZ – случайная величина со стандартным нормальным рас-

пределением, а χk2 распределена по закону

χ2 с k степенями

свободы.

В MS Excel 2003 вместо справочных таблиц для критических точек распределения Стьюдента, приводимых в учебниках, используются две статистические функции СТЬЮДРАСП (х; k; хвосты) и СТЬЮДРАСПОБР (р; k) (см. прил. 2), определенные только для положительной полуоси х возможных значений случайной величины Х. Свойство четности этой функции плотности распределения дает возможность вычислять необходимые величиныв области отрицательных возможных значений Х.

СТЬЮДРАСП (х; k; хвосты),

где x > 0 – численное положительное значение, для которого требуется вычислить t-распределение;

k ≥ 1 – целое, указывающее число степеней свободы; хвосты – число возвращаемых «хвостов» распределения:

– если хвосты = 1, то возвращается (вычисляется) вероятность события {X > x} с односторонним условием (критерием): СТЬЮДРАСП = P{X > x}=1 – F(x), где Х– случайная величина

сфункциейраспределенияF(x), соответствующейt-распределению;

если хвосты = 2, то вычисляется вероятность события {|X| > x} – с двусторонним условием (критерием): СТЬЮД-

РАСП = P{|X| > x} = P{X > x ИЛИ X < –x}.

26

При x < 0 для симметричного относительно точки х = 0 t-распределения вычисление вероятностей попадания случайной точки X в заданный интервал ее возможных значений выполняется с помощью следующих формул:

P{X > x}=1 – P{X < x} = 1 – СТЬЮДРАСП(–x; k; 1); P{|X| > x} = 1 – P{|X| < x} = СТЬЮДРАСП(–x; k; 2).

Связь вычисляемых вероятностных характеристик (вероятностей попадания случайной точки X в затемненный интервал под кривой плотности распределения на рис. 1.10–1.11) с функцией распределения Стьюдента F(x) для степени свободы k = 3 показана на подписях к этим рисункам при х = –1 и х = = 1; хвосты = 1 (рис. 1.10) и хвосты = 2 (рис. 1.11). Здесь вер-

тикальная черта в определении вероятности события имеет широко распространенное толкование – разделяет описание события и условия, при котором оно рассматривается.

 

 

 

 

 

P{X<x|x<0} = F(x)

P{X<x|x>0} = F(x)

P{X>x|x<0} = 1–

P{X>x|x>0} =

 

 

 

F(x)

= 1–F(x)

 

Рис. 1.10. Распределения Стьюдента для степени свободы k = 3, односторонние критерии оценки вероятности (хвосты = 1)

СТЬЮДРАСПОБР (р; k),

где р – вероятность, соответствующая двустороннему критерию по распределению Стьюдента (ниже в подразд. 4.1.2, 5.1–5.2 для вероятности р следует задавать уровень значимости α =1−β

вероятность ошибки в оценке доверительного интервала или вероятность отвергнуть верную основную гипотезу);

27

k ≥ 1 – целое число степеней свободы; функция СТЬЮДРАСПОБР (р; k) возвращает значение x, для которого P{|X| > > x} = р, где X – случайная величина, соответствующая t-расп- ределению.

P{|X| < x|x < 0} = = 1–2F(x)

P{|X| < x|x >0} = = 1–2(1–F(x))

P{|X| > x|x < 0}= = 2F(x)

P{|X| > x|x > 0} = = 2(1–F(x))

Рис. 1.11. Распределения Стьюдента для степени свободы k =3, двусторонние критерии оценки вероятности (хвосты = 2)

Одностороннее отрицательное t-значение х, соответствующее условию P{X > x} = р, вычисляется при замене аргумента р на 2р для р < 0,5 функцией СТЬЮДРАСПОБР(2*р; k).

Пример 1.5. Вычислить с помощью функции СТЬЮДРАСП (х; k; хвосты) функцию распределения F(x) и вероятности р= P{|X| > x} для случайной величины Х, имеющей t-распределение с тремя степенями свободы для значений х: –3, –2, –1, 0, 1, 2, 3, 4, 5, 6. Для найденных значений р с помощью функции СТЬЮДРАСПОБР (р; 3) вычислить исходные значения х (двустороннее t-значение) и соответствующее р одностороннее t-значение СТЬЮДРАСПОБР (2*р; 3) – квантили уровняр.

Решение: Зададим в ячейках А1:E2 текстовые заголовки столбцов, в ячейках А3:А12 – заданные значения х (рис. 1.12). Рассмотрим сначала случай одностороннего критерия (хвосты = 1), вычислим значения функции распределения и значения квантилей уровня хр, решив прямую (по заданному

28

значению х находим вероятность события {X<=x}) и обратную (по заданному значению вероятности события {X<=x} находим значение квантиля уровня хр) задачи. Заданные формулы в вычисляемых ячейках С3:С12 и Е3:Е12 (их копирование в другие ячейки – способом примера 1.1) определены в соответствующих текстовых ячейках В3:В12 и D3:D12.

Результат, представленный на рис.1.12 в виде копии экранного окна, обычным копированием из MS Excel сохраним в виде табл. 1.1 для текстового редактора MS Word.

Рис. 1.12. Результаты для примера 1.5 (хвосты = 1)

 

 

 

 

Таблица 1.1

x

Формула для

F(x) = P

Формула для

 

Квантиль

ячейки столбца С

{X<=x}

ячейки столбца Е

 

xрр_одностор

 

 

 

 

 

 

 

 

–3

1–(1–СТЬЮДРАСП

0,028834443

–СТЬЮДРАСПОБР

 

–3

 

(–A3; 3; 1))

(2*C3; 3)

 

–2

1–(1–СТЬЮДРАСП

0,069662984

–СТЬЮДРАСПОБР

 

–2

(–A4; 3; 1))

(2*C4; 3)

 

–1

1–(1–СТЬЮДРАСП

0,195501109

–СТЬЮДРАСПОБР

 

–1

 

(–A5; 3; 1))

(2*C5; 3)

 

0

1–(1–СТЬЮДРАСП

0,5

–СТЬЮДРАСПОБР

 

–1,49048E–08

(–A6; 3; 1))

(2*C6; 3)

 

1

1–СТЬЮДРАСП

0,804498891

СТЬЮДРАСПОБР

 

1

(A7; 3; 1)

(2*(1–C7); 3)

 

2

1–СТЬЮДРАСП

0,930337016

СТЬЮДРАСПОБР

 

2

 

(A8; 3; 1)

(2*(1–C8); 3)

 

3

1–СТЬЮДРАСП (A9; 3;

0,971165557

СТЬЮДРАСПОБР

 

3

1)

(2*(1–C9); 3)

 

 

 

 

 

29

Окончание табл. 1.1

x

Формула для

F(x) = P

Формула для

Квантиль

ячейки столбца С

{X<=x}

ячейки столбца Е

xрр_одностор

 

 

 

 

 

 

4

1–СТЬЮДРАСП (A10;

0,985995772

СТЬЮДРАСПОБР (2*(1–

4

 

3; 1)

C10); 3)

5

1–СТЬЮДРАСП (A11;

0,992303781

СТЬЮДРАСПОБР (2*(1–

5

3; 1)

C11); 3)

6

1–СТЬЮДРАСП (A12;

0,995363643

СТЬЮДРАСПОБР (2*(1–

6

3; 1)

C12); 3)

Аналогичное решение задачи для двустороннего критерия (хвосты = 2) представлено на рис. 1.13, оно обладает симметрией, показанной на рис. 1.11.

Рис. 1.13. Результаты для примера 1.5 (хвосты = 2)

Сравнение численных полученных результатов с аналогичными результатами для стандартного нормального распределения (см. рис. 1.6, а также графики рис. 1.9) показывает, что распределение Стьюдента при малом числе степеней свободы дает существенно большие вероятности при |x| > 2,5, то есть имеет существенно отличающиеся хвосты.

1.2.4. Распределение Фишера (Фишера – Снедекора)

Случайнаявеличина Fν1,ν2 поопределениюравнаотношению двухнезависимыхслучайныхвеличин χ2ν1 ν1 и χ2ν2 ν2, тоесть

30