Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

5196

.pdf
Скачиваний:
5
Добавлен:
13.11.2022
Размер:
1.07 Mб
Скачать

 

b x f (x) dx

2 x

 

 

 

 

 

1

 

 

 

 

 

2

 

4

 

 

М ( Х )

x dx

 

 

x3

 

 

 

 

 

.

 

 

 

 

 

 

 

 

0

 

 

0 2

 

6

 

 

 

3

 

 

a

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

b

 

 

 

 

2

 

 

x

 

 

 

 

 

 

1

 

 

 

 

 

М ( Х 2 )

x 2

f (x) dx

x 2

 

 

 

dx

 

 

x 4

2

2 .

 

 

 

 

 

 

 

 

a

 

 

 

 

0

 

2

 

 

 

 

 

8

 

0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

D(X) = M(Х2)

- [M (Х)]2

=

2 -

 

4 2

=

2

.

 

 

 

 

 

3

 

9

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

( Х )

D( Х )

0,47.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

9

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

F(x)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

f(x)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

1

 

 

2

X

2

X

 

 

 

 

г) для вычисления вероятности попадания непрерывной случайной величины в интервал (α ,β) можно применить одну из формул:

P ( α Х β)

F( )

F(α )

 

или P ( α

Х β)

f(x) dx .

Применим первую формулу

 

 

 

 

 

 

 

 

 

P (–1 < Х < 1) =

F(1) – F(–1) =

12

 

 

0

1

.

 

 

4

 

 

 

4

 

 

 

 

 

 

 

 

 

 

 

Пример 2. Случайная величина Х задана плотностью

распределения:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0,

x

1

 

 

 

 

 

 

 

 

c

 

 

 

 

 

 

 

f (х)

 

, 1

 

x

5

.

 

 

 

 

 

8

 

 

 

 

 

 

 

 

x

5

 

 

 

 

 

 

 

0,

 

 

 

 

 

Требуется: а) найти коэффициент С; б) функцию распределения F(x); Решение:

а) плотность распределения f(x) должна удовлетворять условиям:

f (x) 0,

f (x) dx

1.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Тогда

 

f (x) dx

1

 

0 dx

 

 

 

 

5 c

dx

0 dx

 

 

c

5 dx

c

x

 

 

 

 

 

 

 

 

 

5

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

1 8

 

8

8

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

5

1

 

 

c

 

(5

1)

4 c

 

 

 

1

 

C .

 

 

 

 

 

 

 

 

 

8

 

8

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Так как

f (x) dx

 

1

, следовательно

1

C 1, следовательно С = 2.

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Таким образом,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0,

x

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

f (х)

 

, 1

 

x

5 ;

 

 

 

 

 

 

 

 

 

 

 

 

 

 

4

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x

5

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0,

 

 

 

 

 

 

 

 

 

 

 

 

б) для нахождения функции распределения F(x) воспользуемся формулой

x

F (x) f (x) dx .

 

 

 

 

 

 

 

 

 

 

 

 

x

 

 

 

Если

х ≤ 1 ,

f(x) = 0,

то

 

F (x)

 

 

0 dx

 

 

0.

Если 1 < х ≤ 5,

 

1

 

 

x

1

 

 

x

 

 

х

 

1

 

 

 

 

 

 

 

F(x)

0 dx

 

 

dx

 

(x 1) .

 

 

 

 

1 4

 

4

 

 

1

4

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Если

х > 1,

 

1

 

 

5 1

 

х

 

 

 

 

 

F (x)

0 dx

 

 

 

 

dx

 

 

0 dx

1.

 

1 4

5

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0,

 

 

x

 

 

 

1

 

 

 

 

 

 

 

Итак ,

 

F ( X )

x 1

, 1

 

x

5 .

 

 

 

 

 

 

4

 

 

 

 

 

 

 

 

 

 

 

 

x

 

 

 

5

 

 

 

 

 

 

 

 

 

 

1,

 

 

 

 

 

 

 

 

 

 

 

 

3. Законы распределения непрерывных случайных величин

Равномерное распределение

Непрерывная случайная величина Х распределена равномерно на отрезке [а, b], если на этом интервале её функция плотности имеет вид

 

0,

x

a

 

1

f (x)

, a x b .

 

b a

 

0,

x

b

Функция распределения для равномерного закона

 

 

0,

x

a

 

x

a

F (x)

, a x b .

b

a

 

x

b

 

 

1,

Математическое ожидание и дисперсия вычисляются по формулам

 

b

a

 

 

(b a) 2

М(Х) =

 

 

;

D(Х) =

 

.

 

2

12

 

 

 

 

 

Пример 1. Поезда метро идут строго по расписанию. Интервал движения – 5 минут. Составить f(х) и F(х) случайной величины Х – времени ожидания очередного поезда и построить их графики. Найти М(Х), D(Х).

Решение: Случайная величина Х – время ожидания очередного поезда. Величина Х распределена равномерно на отрезке [0,5], поэтому

 

0,

x

0

 

0,

x

0

 

1

 

 

x

 

f (x)

, 0 x 5 .

F (x)

, 0 x 5

5

5

 

 

x

5

 

 

x

5

 

0,

 

1,

f(x)

 

 

 

 

F(x)

 

 

 

 

 

 

 

 

 

1

 

 

 

 

0,2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

5

X

 

 

5

X

 

 

 

 

 

 

 

 

 

 

М(Х) =

5

0

2,5

D(Х) =

(5

0) 2

 

25

2,08.

 

 

 

 

 

 

 

 

2

 

12

12

 

 

 

 

 

 

 

 

 

 

Нормальное распределение

 

 

 

 

 

Закон нормального распределения должен быть изучен наиболее

основательно, т.к. он часто применяется в теории и практике.

 

 

 

Непрерывная случайная величина Х распределена по нормальному

закону, если её плотность распределения вероятностей выражается

формулой

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

( x

a)2

 

 

 

 

 

 

f(х) =

e

2

 

2

.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Параметры а

и

σ

 

 

имеют следующий вероятностный смысл:

 

 

а = М(Х),

 

σ 2= D(Х),

σ = D(x) .

 

 

 

График плотности нормального распределения называют

нормальной кривой (кривой Гаусса).

 

 

 

 

 

Функция ƒ(х) определена на всей оси Х.

 

 

 

 

При любых значениях Х функция принимает положительные

 

значения, т.е. лежит выше оси ОХ.

 

 

 

 

 

Точка (а,

1

) – точка max.

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Точки перегиба (а-σ,

 

1

) и (а+σ,

1

).

 

 

 

 

 

 

 

 

 

 

 

 

Probability Density Function

2 e

 

 

 

 

 

 

 

 

 

 

2 e

 

 

 

 

 

 

 

 

 

 

 

y=normal(x;0;1)

 

 

 

 

0,60

 

 

 

 

 

 

 

 

 

 

 

 

Y

 

 

 

 

 

 

 

 

 

 

 

 

0,45

 

 

 

 

 

 

 

 

 

 

 

 

0,30

 

 

 

 

 

 

 

 

 

 

 

 

0,15

 

 

 

 

 

 

 

 

 

 

 

 

0,00

 

 

 

 

 

 

 

 

 

 

 

 

-3,50

 

a-1,75

 

 

 

 

a0,00

 

a 1,75

X

3,50

 

 

1

 

x

2

 

Если функция Лапласа задаётся формулой Ф(х) =

 

 

e t

/ 2 dt , то

 

 

 

 

 

 

 

 

2

 

 

 

0

 

 

для нормально распределённой случайной величины

Р (

< Х < ) = Ф

 

 

a

– Ф

a

.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Р(

Х

а

< ) = 2Ф

 

.

 

 

 

 

 

 

 

 

 

Пример 2. Детали, выпускаемые цехом, по размеру диаметра распределены по нормальному закону. Стандартная длина диаметра детали

равна а = 35,

 

среднее квадратическое отклонение σ = 4. Требуется:

а) составить функцию плотности вероятностей;

б) найти вероятность того, что диаметр наудачу взятой детали будет

больше

=34

 

и меньше

 

 

 

= 40;

 

 

 

в) найти вероятность того, что диаметр детали отклонится от

стандартной длины не более чем на

= 2.

 

 

 

 

1

 

 

 

( x 35)2

 

 

 

 

 

 

 

 

а) f(х) =

 

 

е

32

;

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

4

 

2

 

 

 

 

 

 

 

 

 

 

 

 

б) Р(34 < Х < 40 ) = Ф

 

40 35

- Ф

 

34 35

= Ф (1,25) + Ф (0,25) =

 

 

 

4

4

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

= 0,3944 + 0,0987 = 0,4931;

 

 

 

 

в) Р (

 

х

35

 

< 2 ) = 2Ф

2

= 2Ф (0,5) = 0,3829.

 

 

 

 

 

 

 

 

 

4

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ТЕМА 6. ВЫБОРОЧНЫЙ МЕТОД

Проведение экономических исследований связано с изучением свойств различных совокупностей однотипных объектов (людей, предприятий, товаров и т.п.). При этом каждый объект, входящий в состав совокупности, характеризуется некоторым числом — величиной изучаемого признака X. Для обозначения таких совокупностей вводится понятие генеральной совокупности.

Под генеральной совокупностью понимается вся совокупность однотипных объектов, которые изучаются в данном исследовании.

Однако на практике в большинстве случаев мы имеем дело только с частью возможных наблюдений, взятых из генеральной совокупности.

Выборка (выборочная совокупность) — это совокупность случайно отобранных объектов, составляющих лишь часть генеральной совокупности.

Объёмом совокупности (выборочной или генеральной) называют число объектов этой совокупности.

Например, из 1 000 изделий отобрано для обследования 100 изделий, объем генеральной совокупности N=1 000, а объём выборки n=100.

В зависимости от способов отбора объектов из генеральной совокупности различают несколько типов выборок. Их типы, определения, свойства, примеры использования рекомендуется изучить самостоятельно.

Пусть из генеральной совокупности извлечена выборка, причём х1

 

k

наблюдалось n1 раз, x2 – n2 раз,..., хk – nk раз и

ni n – объём выборки.

i

1

Наблюдаемые значения хi называют вариантами, а последовательность вариант, записанных в возрастающем порядке, — вариационным рядом. Числа наблюдений (ni) называют частотами, а их отношения к объёму

выборки

ni

wi

— относительными частотами.

n

 

 

 

Статистическим распределением выборки называют перечень вариант xi и соответствующих им частот ni или относительных частот wi (причем сумма всех частот равна объёму выборки, а сумма всех относительных частот равна 1).

xi

x1

x2

….

xk

ni

n1

n2

….

nk

 

 

или

 

 

xi

x1

x2

….

xk

wi

w1

w2

….

wk

Вариационный ряд, заданный в таком виде, называют дискретным. Геометрической характеристикой дискретного вариационного ряда является полигон частот.

Полигоном частот называют ломаную, отрезки которой соединяют точки (х1,n1), (х2,n2), …, (хk,nk), где хi — варианты выборки, а ni — соответствующие им частоты.

Статистическое распределение можно задать также в виде последовательности интервалов и соответствующих им частот. Для непрерывно распределённого признака весь интервал, в котором заключены все наблюдаемые значения признака, разбивают на ряд частичных интервалов длины h и находят ni — сумму частот вариант попавших в i-й интервал. Такое распределение называют интервальным вариационным рядом.

Геометрической характеристикой интервального вариационного ряда является гистограмма частот.

Гистограммой частот называется ступенчатая фигура, состоящая из прямоугольников, основаниями которых служат частичные интервалы

длины h, а высоты равны отношению nhi .

Пример 1. Из большой группы предприятий одной из отраслей промышленности случайным образом отобрано 30, по которым получены показатели основных фондов в млн руб.:

3; 4; 2; 3; 3; 6; 5; 2; 4; 7; 5; 5; 3; 4; 3; 2; 6; 7; 5; 4; 3; 4; 5; 7; 6; 2; 3; 6; 6; 4.

Составить дискретное статистическое распределение выборки, записать распределение относительных частот, построить полигон частот.

Решение. Различные значения признака запишем в порядке возрастания и под каждым из них запишем соответствующие частоты. Получим дискретное статистическое распределение выборки:

xi

2

3

4

5

6

7

ni

4

7

6

5

5

3

Проверка: сумма всех частот должна быть равна объёму выборки: n=4+7+6+5+5+3=30.

Найдем относительные частоты, для чего разделим частоты на объём выборки

w1

4

 

0,13;

 

w2

 

 

7

 

 

0,23 ;

 

 

 

 

 

 

 

 

 

 

 

30

 

 

30

 

 

 

 

 

 

 

 

 

 

 

 

w3

6

 

0,2 ;

 

w4

 

 

5

 

0,17 ;

 

 

 

 

 

 

 

 

 

 

30

 

30

 

 

 

 

 

 

 

 

 

 

 

 

w5

5

 

0,17 ;

 

w6

 

 

3

 

0,1.

 

 

 

 

 

 

 

 

 

 

 

 

30

 

30

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Напишем распределение относительных частот:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

xi

2

 

 

 

3

4

5

6

 

 

 

 

7

 

 

 

wi

0,13 0,23 0,2 0,17 0,17 0,1

 

Контроль:

wi

0,13

0,23

 

 

0,2

0,17

0,17 0,1 1.

Строим

полигон

частот.

 

 

Для

этого

строим точки с координатами

(xi;ni):(2;4), (3;7), (4;6), (5;5), (6;5), (7;3) и соединяем их последовательно отрезками.

ni

7

6

5

4

3

2

1

1

2

3

4

5

6

7

xi

Пример 2. Выборочно обследовано 26 предприятий лёгкой промышленности по объему валовой продукции. Получены следующие результаты в млн руб.:

15,0; 16,4; 17,8; 18,0; 18,4; 19,2; 19,8; 20,2; 20,6; 20,6; 20,6; 21,3; 21,4; 21,7; 22,0; 22,2; 22,3; 22,7; 23,0; 24,2; 24,2; 25,1; 25,3; 26,0; 26,5; 27,1.

Составить интервальное распределение выборки с началом х0 = 15 и длиной частичного интервала h = 2,5. Построить гистограмму частот.

Решение. Для составления интервального распределения составим таблицу. В первой строке расположим в порядке возрастания интервалы, длина каждого из которых h=2,5. Во второй сроке запишем количество значений признака в выборке, попавших в этот интервал (т.е. сумму частот вариант, попавших в соответствующий интервал).

Частичный интервал

15–17,5

17,5–20

20–22,5

22,5–25

25–27,5

Частота интервала

2

5

10

4

5

Объём выборки n=2+5+10+4+5=26.

Для построения гистограммы частот на оси абсцисс откладываем частичные интервалы на каждом из них строим прямоугольники

высотой nhi .

ni

h

10/2,5

5/2,5

2/2,5

Хi

15 17,5 20 22,5 25 27,5

Площадь каждого прямоугольника равна частоте интервала, на котором он построен. Сумма площадей этих прямоугольников равна объёму выборки.

ТЕМА 7. СТАТИСТИЧКИЕ ОЦЕНКИ ПАРАМЕТРОВ РАСПРЕДЕЛЕНИЯ

Пусть требуется изучить количественный признак генеральной совокупности. Располагая лишь выборочными значениями признака, можно оценить, а не определить точно значения параметров; эти оценки будут случайными и меняться от выборки к выборке. Поэтому важно не только знать оценки параметров, определённые на основе выборочных данных, но и понимать меры их надежности.

Цель любого оценивания — получить как можно более точное значение неизвестной характеристики генеральной совокупности по данным выборочного наблюдения.

Статистической оценкой неизвестного параметра теоретического распределения называют функцию от наблюдаемых случайных величин. В зависимости от способа выражения оценки делятся на точечные оценки, выражаемые одним числом, и интервальные оценки, определяющие числовой интервал, внутри которого может находиться оцениваемый параметр генеральной совокупности.

Генеральная совокупность характеризуется двумя сторонами:

1) видом распределения (например, равномерное, нормальное, Пуассоновское и т.д.); 2) параметрами распределения (например, математическое ожидание, среднее квадратическое отклонение и т.п.). В связи с этим существует два класса оценок: оценки вида распределения и оценки параметров распределения.

Оценка * должна быть несмещённой, эффективной, состоятельной.

Определения несмещённой, эффективной, состоятельной оценок рекомендуется изучить самостоятельно.

Несмещённой, состоятельной и эффективной оценкой генеральной средней (математического ожидания признака X генеральной

совокупности) является выборочная средняя

хв

 

среднее

арифметическое значений признака в выборке:

 

 

 

 

 

 

x1 x2 xк

,

(1)

 

 

xв

 

 

 

 

 

 

 

 

n

 

 

 

где n – объём выборки, xi — значение признака в выборке. Если результаты выборки представлены в виде дискретного распределения:

 

xi

 

 

x1

x2

….

xk

,

 

 

ni

 

 

n1

n2

….

nk

 

 

 

то

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

k

 

 

 

 

 

x1n1

x2 n2

xk nk

 

xi ni

 

 

 

 

 

 

i 1

. (2)

 

 

xв

 

 

 

 

 

n

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

Состоятельной, смещённой оценкой генеральной дисперсии (дисперсия признака X генеральной совокупности) является выборочная дисперсия:

Д в x 2

 

2 ,

(3)

xв

 

 

 

k

x2n

 

 

 

k

 

 

 

 

 

 

 

 

 

 

 

x

 

ni

где x2

i 1

i i

 

 

 

i 1

 

i

 

 

 

,

xв

 

 

 

.

 

n

 

 

n

 

 

 

 

 

 

 

 

 

 

 

Несмещённой, состоятельной оценкой генеральной дисперсии является исправленная выборочная дисперсия

S2

 

n

 

Д в .

(4)

 

 

 

n

 

 

 

 

1

 

Пример 1. При изучении производительности труда X тыс. руб. на одного работника было обследовано 10 предприятий и получены следующие значения:

4,2; 4,8; 4,7; 5,0; 4,9; 4,3; 3,9; 4,1; 4,3; 4,8.

Определить выборочное среднее x в , выборочную дисперсию,

исправленное среднее квадратическое отклонение.

Решение. По формуле (1) находим выборочную среднюю при n=10:

 

4,2

4,8

4,7

5,0

4,9

4,3

3,9

4,1

4,3

4,8

45

 

(тыс. руб)

 

 

xв

 

 

 

 

 

 

 

 

 

 

 

 

4,5

 

 

 

 

10

 

 

 

 

 

10

 

 

 

 

 

 

 

 

 

 

 

 

 

По формуле (3) найдём выборочную дисперсию. Для этого вычислим x 2 и x 2 .

 

 

 

 

 

4,22

4,82

 

4,72

5,02

4,9

2

4,32

3,92

4,12

4,32

4,82

 

 

x2

 

 

20,382

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

10

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

(4,5)2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

xв

 

 

20,25.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Д в

 

 

x 2

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

xв

 

20,382

20,25

 

0,132 .

 

 

 

 

 

Исправленное среднее квадратическое отклонение

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

10

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

S2

 

 

 

 

 

 

 

 

 

0,383.

 

 

 

 

 

S

 

 

 

0,132

0,147

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

10

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Смысл полученных результатов заключается в следующем. Величина

 

 

 

 

 

 

 

 

 

 

x в

 

 

характеризует

среднее

 

значение признака X в пределах

рассматриваемой выборки.

Средняя

производительность труда для

изученных предприятий составила x в =4,5 тыс. руб. на одного работника.

Исправленное среднее квадратическое отклонение S описывает абсолютный разброс значений показателя X и в данном случае составляет

S=0,383 тыс. руб.

Если дано интервальное распределение выборки, то надо перейти к дискретному, взяв за значения вариант середины частичных интервалов.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]