Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Черник, О. В. Контрольная тетрадь по теории вероятностей и математической статистике

.pdf
Скачиваний:
53
Добавлен:
25.03.2016
Размер:
535.32 Кб
Скачать

Значение функции ϕ(x) определяется по таблице (см. приложение 1) с учетом следующих ее свойств:

1) она четная: ϕ(x) =ϕ(x) ;

2) lim ϕ(x) = 0 , поэтому при x 5 полагают, что ϕ(x) 0 .

x→+∞

Интегральная формула Лапласа применяется для нахождения вероятности того, что событие A появится не менее k1 и не более k2 в n

испытаниях; записывают – Pn (k1;k2 ) ; и дает достаточно точное ее значение в условиях применимости локальной формулы Лапласа.

 

 

 

 

 

 

 

 

 

 

 

k1,2

np

 

 

1

x

t2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

P

(k ; k

 

) Ф(x

 

) Ф(x ),

где x

=

,

Ф(x) =

2 dt

 

 

 

2

2

 

 

 

e

 

 

 

 

n

1

 

 

1

1,2

 

npq

 

 

2π 0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Значение функции Ф(x) определяется по таблице (см. приложение 2) с

учетом следующих ее свойств:

 

 

 

 

 

 

 

 

 

 

 

 

1) она нечетная: Ф(x) = −Ф(x) ;

lim Ф(x) = 0,5, поэтому при x 5

2) она монотонно возрастающая и

полагают, что

Ф(x) 0,5 .

 

x→+∞

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Пример. В регионе на 100 семей приходится 80 компьютеров. Найти вероятность того, что из 400 семей региона компьютер имеют: а) 300 семей; б) не менее 300 и не более 360 семей.

Решение. Так как отдельно взятое испытание состоит в выяснении наличия в семье компьютера, то количество испытаний будет равно 400:

n = 400 .

Событие, ожидаемое в результате каждого испытания, состоит в следующем:

A – семья имеет компьютер.

Тогда по условию задачи

 

 

 

 

 

 

p = P( A) =

 

80

= 0,8;

 

 

 

 

 

 

100

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

q =10,8 = 0,2.

 

Так как n

велико,

p – велико,

то искомые вероятности P400 (300) и

P400 (300;360) находим, используя формулы Лапласа:

а) x =

300 400 0,8

= − 20

= −2,5

 

 

 

 

 

 

400 0,8 0.2

8

 

 

 

 

 

 

P

 

(300)

ϕ(2,5)

 

= ϕ(2,5) = 0,1753 0,02;

400

400 0,8 0,2

8

 

8

 

 

 

 

 

б) x

= 300 400 0,8

= − 20

= −2,5; x

2

 

= 360 400 0,8 = 40 = 5

1

 

400 0,8

0.2

8

 

 

 

 

400 0,8 0.2 8

 

 

 

 

 

 

 

23

P400 (300;360) Ф(5) Ф(2,5) 0,5 +Ф(2,5) = 0,5 +0,49379 0,994.

Случайная величина

Величина называется случайной, если в результате испытания она примет одно и только одно числовое значение, наперед неизвестное и зависящее от ряда случайных факторов, которые заранее не могут быть учтены.

Числовые значения, которые может принять случайная величина,

называют ее возможными значениями.

Обозначают: X ,Y , Z – случайные величины; xi , yi , zi – их возможные

значения.

Пример. X – число очков, выпавших на игральной кости.

Y – масса пакета молока при автоматической фасовке. Случайные величины делятся на дискретные и непрерывные. В примере

случайная величина X является дискретной, Y – непрерывной.

Дискретная случайная величина. Закон распределения дискретной случайной величины

Случайная величина называется дискретной, если множество ее возможных значений конечно или счётно, т.е. возможные значения можно пронумеровать.

Законом распределения дискретной случайной величины называют соотношение между ее возможными значениями и вероятностями этих значений.

Формы закона распределения:

1) табличная – представляет собой таблицу, в первой строке которой указывают возможные значения случайной величины, а во второй – соответствующие им вероятности. Эта таблица называется рядом распределения.

X:

x1

x2

xn

 

 

p1

p2

...

pn

,

n

где pi = P( X = xi ), i =1,2,...,n и pi =1;

i=1

2)графическая – в виде многоугольника распределения, который

представляет собой ломаную линию с вершинами в точках (xi ; pi ) ;

3) аналитическая – в виде формулы pi = f (xi ) . Следует знать, что закон

распределения не каждой дискретной случайной величины можно задать в такой форме.

24

Случайная величина называется распределенной по биномиальному закону, если она выражает число появлений события А в n повторных независимых испытаниях. Биномиальный закон распределения можно представить в аналитической форме следующим образом:

p = P( X = x ) =C xi pxi qnxi , где x =0; 1; 2;…; n;

i

i

n

i

n – число повторных независимых испытаний,

p = P( A) , q = P(

 

) =1p .

A

Функция распределения вероятностей дискретной случайной величины

Функцией распределения вероятностей случайной величины X

называют функцию F(x) , которая каждому значению x сопоставляет

вероятность того, что случайная величина X примет значения, меньшие x , т.е.

F(x) = P( X < x) .

Свойства F(x) :

1)F(x) неубывающая;

2)F(x) [0;1].

Спомощью функции распределения можно найти вероятность того, что дискретная случайная величина X примет значения из интервала (a;b),

применяя следующую формулу:

P(a X < b) = F(b) F(a) .

Числовые характеристики дискретной случайной величины

Математическим ожиданием (средним значением) дискретной случайной величины называется сумма произведений возможных значений этой величины на соответствующие им вероятности. Обозначают:

n

M ( X ) = x1 p1 + x2 p2 +... + xn pn = xi pi

i =1

Дисперсией случайной величины называют среднее значение квадрата отклонения этой случайной величины от ее математического ожидания. Обозначают:

 

 

 

 

D( X ) = M ( X M ( X ))2 =

n

(x M ( X ))2 p

 

 

 

 

 

 

 

 

 

 

.

i

……i

 

 

 

 

 

 

i =1

.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Однако при вычислении дисперсии удобнее использовать не

определение, а формулу для нахождения дисперсии:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

n

2

 

 

 

D( X ) = M ( X 2 ) M 2 ( X ) = xi2 pi

xi pi

 

 

 

 

 

i =1

 

i =1

 

 

 

 

 

 

 

 

 

 

 

 

25

Дисперсия характеризует распределение возможных значений случайной величины относительно ее математического ожидания. Однако недостаток дисперсии в том, что она имеет размерность квадрата случайной величины. Этот недостаток ликвидирует среднее квадратическое отклонение.

Средним квадратическим отклонением случайной величины называют квадратный корень из дисперсии. Обозначают:

 

σ(X ) = D(X )

 

 

D( X ) =σ 2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Если случайная величина X имеет биномиальный закон распределения, то ее числовые характеристики можно найти по следующим формулам:

M (X ) = np D(X ) = npq σ(X ) = npq ,

где n – число повторных независимых испытаний, p=P(A), q= P( A) =1–p.

Непрерывная случайная величина. Функция распределения и плотность вероятности непрерывной случайной величины

Случайная величина называется непрерывной, если ее возможные значения непрерывно заполняют некоторый промежуток или совокупность промежутков числовой оси (конечных или бесконечных).

Примеры непрерывных случайных величин: масса товара при автоматической фасовке, дальность полета снаряда, текущая цена акции.

Функцией распределения непрерывной случайной величины X

называют функцию F(x) , которая каждому значению x сопоставляет вероятность того, что случайная величина X примет значения, меньшие x , т.е.

F(x) = P( X < x).

Свойства F(x) непрерывной случайной величины: 1) F(x) непрерывная и неубывающая;

2) lim F(x) =1;

lim F(x) = 0.

x→+∞

x→−∞

Для непрерывной случайной величины X вероятность того, что она примет какое-то конкретное значение xi , равна нулю: P( X = xi ) = 0 .

Поэтому отличными от нуля могут быть только вероятности того, что непрерывная случайная величина X примет значения из некоторого промежутка. Эти вероятности находят с помощью функции распределения, применяя следующие формулы:

P(a < X < b) = P(a X b) = F(b) F(a) ,

26

P( X < b) = P( X b) = F(b) , P( X > b) = P( X b) =1F(b) .

Плотностью распределения вероятностей или плотностью

вероятности называется

функция f (x) ,

равная первой производной

от

функции распределения вероятности, т.е.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

f (x) = F (x).

 

 

Рассмотрим P(x < X < x + ∆x) = F(x + ∆x) F(x) . При малых

x

F(x + ∆x) F(x) dF .

Но так как

 

то

 

dF = F (x)x = f (x)x ,

P(x < X < x + ∆x) f (x)x . В этом приближенном равенстве и заключается

вероятностный смысл плотности вероятности.

Свойства f (x) :

1) f (x) 0, как производная неубывающей функции;

+∞

2) f (x)dx =1.

−∞

Если известна плотность вероятности случайной величины, то ее

x

функцию распределения можно найти по формуле f (x)dx = F(x) .

−∞

С помощью плотности вероятности можно найти вероятность того, что непрерывная случайная величина X примет значения из некоторого промежутка, применяя следующие формулы:

b

P(a < X < b) = P(a X b) = f (x)dx ;

a

b

P( X < b) = P( X b) = f (x)dx ;

−∞

+∞

P( X > b) = P( X b) = f (x)dx .

b

F(x) называют интегральным законом распределения непрерывной случайной величины, а f (x) – дифференциальным законом.

Числовые характеристики непрерывной случайной величины

Пусть все возможные значения непрерывной случайной величины X занимают промежуток [a;b]. Разобьем его на n частичных отрезков точками x0 = a, x1, x2 , x3,..., xn 1, xn = b . Длины этих отрезков обозначим

x1, x2 , x3,..., xn .

Пользуясь определением математического ожидания, получаем

n

M ( X ) x1 f (x1 )x1 + x2 f (x2 )x2 +... + xn f (xn )xn = xi f (xi )xi , где

i =1

f (xi )xi P(xi 1 < X < xi ) , если xi достаточно малы.

27

Для получения точного значения M ( X ) устремим n в бесконечность,

n

тем самым max xi 0 , и найдем предел суммы xi f (xi )xi при условии,

что max xi 0 .

 

i =1

 

b

M ( X ) =

lim

n

xi f (xi )xi = xf (x)dx (см. определение определенного

 

max xi 0 i =1

a

интеграла). Значит,

b

M ( X ) = xf (x)dx .

a

b

Аналогично, M ( X 2 ) = x2 f (x)dx .

a

Следовательно, формула для нахождения дисперсии непрерывной случайной величины будет иметь вид:

b

D( X ) = x2 f (x)dx M 2 ( X ) ,

a

σ(X ) = D(X ) .

Нормальный закон распределения непрерывной случайной величины

Непрерывная случайная величина X называется распределенной по нормальному закону, если ее плотность вероятности имеет вид

 

f(x)

 

 

 

 

1

e

( x a)2

 

 

 

 

 

 

 

 

 

 

 

 

 

f (x) =

σ

2σ2 ,

 

 

1

 

 

 

 

2π

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

σ

 

 

 

 

 

 

 

 

 

 

 

 

2π

 

 

 

 

 

 

 

 

 

1

 

где a = M ( X ) и σ =

D( X ) – параметры

 

 

нормального закона распределения.

σ

2πe

 

 

 

 

График

 

функции f (x) называется

 

 

 

a-σ a a+σ

x кривой Гаусса и изображен на рисунке 1.

Рисунок 1

Функция распределения нормально распределенной случайной

величины имеет вид

 

 

 

 

 

 

 

 

1

x a

 

 

F(x) =

 

+Ф

 

,

 

 

2

σ

 

 

 

 

 

 

 

 

 

 

 

 

28

 

1

t

z2

где Ф(t) =

e

2

dz – интегральная функция Лапласа, заданная таблично

 

2π

0

 

 

 

(см. приложение 2). График функции распределения нормально распределенной случайной величины изображен на рисунке 2.

F(x)

1

½

a

x

Рисунок 2

Выведем формулы для нахождения вероятности того, что нормально распределенная случайная величина X принимает значения из некоторого промежутка.

 

 

 

 

 

 

 

1

β a

 

1

 

 

α a

 

P(α < X < β) = F(β) F(α) =

 

+Ф

 

 

 

 

 

 

 

 

+Ф

 

 

 

=

 

 

 

σ

 

2

 

σ

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

β a

 

α a

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

=Ф

 

 

Ф

 

 

 

.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

σ

 

 

σ

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Таким образом,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

β a

 

α a

 

 

 

 

 

 

 

 

 

 

P(α < X < β) =Ф

 

σ

 

Ф

 

 

σ

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

β a

 

 

 

 

 

 

 

 

 

 

 

P( X < β) = F(β) =

 

 

+Ф

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

σ

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

β a

 

 

 

 

 

 

 

 

 

 

P( X > β) =1F(β) =

 

Ф

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

σ

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Пусть промежуток (α; β) является симметричным относительно математического ожидания a , т.е. его концы можно представить в виде

α = a δ

и β = a +δ , где δ – некоторое число,

называемое радиусом

промежутка.

 

Тогда

P(a δ < X < a +δ) равна P(

 

X a

 

<δ)

– вероятности того, что

 

 

нормально распределенная случайная величина X отклоняется от своего математического ожидания меньше чем на δ .

29

Чтобы вывести формулу для нахождения

 

P(

 

X a

 

<δ)

воспользуемся

 

 

 

 

 

 

 

 

 

 

β a

 

α a

, заменив в нем α на (a δ) ,

равенством P(α < X < β) =Ф

σ

 

 

Ф

σ

 

β на (a +δ) . Получаем

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(a +δ) a

 

 

 

(a δ) a

 

 

 

 

 

 

 

 

 

 

 

 

P(

X a

<δ) =Ф

 

 

 

 

 

 

Ф

 

 

 

 

=

 

 

σ

 

σ

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

δ

 

 

δ

 

 

 

δ

 

 

 

δ

 

δ

 

=Ф

 

 

Ф

 

=Ф

 

+Ф

 

= 2Ф

.

 

 

 

σ

 

 

 

σ

 

 

 

σ

 

 

 

σ

σ

 

Таким образом,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

P(

 

X a

 

 

 

 

δ

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

<δ) = 2Ф

.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

σ

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Правило «3σ»: практически все возможные значения случайной величины, распределенной по нормальному закону, принадлежат промежутку (a 3σ;a +3σ), который называют диапазоном этой случайной величины.

Найдем вероятность того, что нормально распределенная случайная величина X принимает значения из диапазона:

 

 

 

 

3σ

 

 

 

 

P(a 3σ < X < a +3σ) = P(

X a

 

< 3σ) = 2Ф

 

 

= 2Ф(3) = 0,9973 1.

 

σ

 

 

 

 

 

 

 

 

 

Так как найденная вероятность очень близка к единице, событие, состоящее в том, что нормально распределенная случайная величина X принимает значения из диапазона, можно считать практически достоверным.

РАЗДЕЛ II. ЭЛЕМЕНТЫ МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ

Математическая статистика это раздел математики, изучающий методы сбора, систематизации и обработки результатов наблюдений массовых случайных явлений с целью выявления статистических закономерностей.

Генеральной совокупностью называют множество всех мыслимо возможных наблюдений, которые могли бы быть сделаны при данном реальном комплексе условий с целью выявления статистических закономерностей. Число таких наблюдений обозначают N и называют

объемом генеральной совокупности.

Если N достаточно велико, то провести сплошное обследование затруднительно в силу различных причин. Тогда случайным образом отбирают из всей совокупности ограниченное число объектов, называемых

выборочной совокупностью или выборкой, и подвергают их изучению.

Количество объектов в выборке обозначают n и называют объемом выборки.

30

Выборка называется повторной, если выбранный объект возвращается в генеральную совокупность перед выбором следующего. Выборка называется бесповторной, если выбранный объект не возвращается в генеральную совокупность.

Метод, состоящий в том, что на основании свойств и характеристик выборки делают заключения о статистических закономерностях в генеральной совокупности, называют выборочным методом.

Вариационный ряд и его числовые характеристики

Пусть X – исследуемый признак (случайная величина), x1, x2 ,…, xk – значения (варианты) признака X , которые в ходе изучения выборки

 

 

 

 

 

 

k

 

 

 

 

наблюдались соответственно n1, n2 ,..., nk раз, ni = n – объем выборки.

 

 

 

 

 

 

i =1

 

 

ni

 

 

Числа n

называются частотами вариант признака, а отношения ω

i

=

 

 

 

 

i

 

 

 

 

 

n

 

 

 

 

 

 

k

 

 

 

 

 

 

 

 

 

 

 

 

относительными частотами. Очевидно, что ωi =1.

 

 

 

 

 

 

 

 

 

 

i =1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x1

 

x2

 

xk

вариационный ряд частот.

 

 

 

 

n1

 

n2

 

nk

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x1

 

x2

 

xk

вариационный ряд относительных

ω1

 

ω2

 

ωk

частот.

 

 

 

 

Часто результаты статистических исследований оформляют в виде интервальных вариационных рядов:

(a1; a2 )

(a2 ; a3 )

(ak ; ak +1)

n1

n2

nk

(a1; a2 )

(a2; a3 )

(ak ; ak +1)

ω1

ω2

ωk

В

этих

таблицах

интервалы

значений

признака

X

(a1; a2 ) ,(a2; a3 ),…,(ak ; ak +1)

называют

частичными. Как правило,

они

имеют

одинаковую длину

 

h .

За

ni (ωi ) принимают суммы

частот

(относительных частот) всех xi

(ai ; ai +1 ).

 

 

 

 

Графически

вариационные

ряды

изображаются

в виде полигона и

гистограммы. Полигоном частот называют ломаную линию, отрезки которой соединяют точки (x1, n1) ,(x2 , n2 ) ,…, (xk , nk ) . Аналогично

определяется полигон относительных частот.

Гистограммой частот называется ступенчатая фигура, состоящая из прямоугольников, основаниями которых служат частичные интервалы

31

(a ; a

2

) ,(a

2

; a

3

),…,(a

k

; a

k +1

) , длиной h , а высоты

равны

ni

. В случае

 

1

 

 

 

 

 

 

h

гистограммы относительных частот высоты равны

ωi .

 

 

 

 

 

 

 

 

 

 

 

h

Основными числовыми характеристиками вариационного ряда являются

выборочная средняя x и выборочная дисперсия s2 . Их находят по формулам:

 

 

 

 

k

 

 

 

k

 

 

 

 

 

 

 

 

 

 

 

 

 

xini

 

 

s2 =

(xi

x

)2 ni

 

 

 

 

=

i =1

 

 

 

i =1

 

 

 

 

x

 

 

n

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Вариационный ряд является статистическим аналогом (реализацией) распределения случайной величины (признака) X , а его числовые

характеристики x и s2 – статистическими аналогами математического ожидания M ( X ) и дисперсии D( X ) =σ 2 . Точно так же понятие относительной частоты ω для вариационного ряда аналогично понятию вероятности p для случайной величины.

Статистические оценки параметров распределения

Основная идея выборочного наблюдения заключается в том, чтобы по данным выборки оценить неизвестные параметры генеральной совокупности: генеральную среднюю признака (математическое ожидание) M ( X ) ,

генеральную дисперсию σ 2 , генеральную долю признака (вероятность) p .

Чтобы по данным выборки можно было бы судить о генеральной совокупности, она должна быть отобрана случайно. Поэтому выборочные

характеристики – средняя x , дисперсия s2 и доля ω – есть величины случайные, в отличие от их аналогов в генеральной совокупности

M ( X ) ,σ2 , p – величин не случайных.

Выборочные характеристики x , s2 и ω являются точечными оценками параметров генеральной совокупности M ( X ) ,σ2 и p , так как выражаются

одним числом.

Основное требование, которое предъявляется к точечной оценке, заключается в том, чтобы ее рассеяние относительно оцениваемого параметра было по возможности меньшим. Это требование отражено в таких свойствах оценок, как несмещенность, состоятельность и эффективность.

Обозначим через θ ( греч. буква «тэта») оцениваемый параметр, а через θn – его оценку, найденную по выборке объема n .

Оценка θn называется несмещенной, если ее математическое ожидание равно оцениваемому параметру: M (θn ) =θ .

32