Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Учебное пособие 2055

.pdf
Скачиваний:
67
Добавлен:
30.04.2022
Размер:
4.6 Mб
Скачать

Отметим, что разница между ТФР и ЭФР состоит в том, что ТФР определяет вероятность события (Х<х), а ЭФР определяет относительную частоту этого же события.

ЭФР обладает всеми свойствами ТФР, то есть:

1)значения F*(х) принадлежат отрезку [0,1];

2)F*(х)- неубывающая функция аргумента х;

3)F*(х)=0, если x x1 , и F*(x)=1, если x xn , где x1 -

наименьшее, а xn - наибольшее наблюдаемые значения CВ X .

Из закона больших чисел, а именно из теоремы Бернулли, следует, что при объеме выборки n→∞ ЭФР сходится по вероятности к ТФР. Это означает, что при достаточно большом объеме выборки ЭФР F*(x) и ТФР мало отличаются друг от друга.

Основное значение ЭФР состоит в том, что она используется в качестве оценки ТФР.

Пример 14.4. Построить график ЭФР по выборке примера

14.2.

Решение. ЭФР имеет вид

Полигон

Кумулята

111

 

0

 

x

15;

 

0,02

15

x

25;

 

0,06

25

x

35;

F x

0, 20

35

x

45;

0,56

45

x

55;

 

 

0,80

55

x

65;

 

0,96

65

x

75;

 

1

75

x.

 

График F*(x) имеет вид

 

 

 

 

F*

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

0,8

 

 

 

 

 

 

 

0,6

 

 

 

 

 

 

 

0,4

 

 

 

 

 

 

 

0,2

 

 

 

 

 

 

 

0

25

35

45

55

65

75

x

15

 

Задачи для самостоятельного решения

14.1. В течение суток измеряют напряжение Х тока в электросети в вольтах. В результате опыта получена выборка объема n 30 :

107

108

110

109

110

111

109

110

111

107

108

109

110

108

107

110

109

111

111

110

109

112

113

110

106

110

109

110

108

112

Построить статистический ряд этой выборки. Построить полигон относительных частот. Найти эмпирическую функцию и построить ее график.

14.2. По данному распределению выборки

xi

1

3

6

 

 

 

 

ni

10

25

15

 

 

112

 

найти эмпирическую функцию и построить ее график. 14.3. Дана выборка:

xi

2

4

5

7

10

ni

15

20

10

10

45

Найти эмпирическую функцию распределения, построить ее график. Построить полигон относительных частот выборки.

14.5. Измерен рост n=500 студентов. Результаты измерений представлены в виде интервального статистического ряда:

 

[145;150)

[150;155)

[155;160)

[160;165)

[165;170)

 

1

2

28

90

169

 

[170;175)

[175;180)

[180;185)

[185;190)

[190;195]

 

132

55

16

6

1

Построить гистограмму относительных частот.

 

14.6. По данным выборки построить гистограмму относительных частот:

1.

 

 

Номер интервала

 

Интервал

 

Число вариант в интервале

 

 

1

(1;5)

10

 

 

2

(5;9)

20

 

 

3

(9;13)

50

 

 

4

(13;17)

12

 

 

5

(17;21)

8

 

2.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Номер интервала

 

Интервал

 

Число вариант в интервале

 

 

1

 

(2;5)

 

6

 

 

2

 

(5;8)

 

10

 

 

3

 

(8;11)

 

5

 

 

4

 

(11;14)

 

4

 

 

 

 

113

 

14.7. Дана выборка:

38

60

41

51

33

42

45

21

53

60

68

52

47

46

42

43

57

44

54

59

77

47

28

27

49

49

14

28

61

30

61

35

47

46

58

45

42

21

30

40

67

65

39

35

41

60

54

42

59

60

Построить гистограмму относительных частот.

14.8. Построить полигон относительных частот следующей выборки:

xi

4

6

10

12

ni

10

15

5

20

 

 

 

 

 

ЗАНЯТИЕ №15. СТАТИСТИЧЕСКАЯ ОЦЕНКА НЕИЗВЕСТНЫХ ПАРАМЕТРОВ РАСПРЕДЕЛЕНИЯ. ТОЧЕЧНЫЕ ОЦЕНКИ

15.1. Постановка задачи

При обработке опытных данных часто бывает так, что вид закона распределения генеральной совокупности (ЗРГC) известен, а требуется найти только некоторые параметры, от которых он зависит. Например, если известно, что СВ X распределена по нормальному закону, то на основании опытных данных (по выборке) необходимо "оценить", то есть найти приближенное значение двух параметров - МО и СКО.

Одна из задач математической статистики и состоит в нахождении оценок неизвестных параметров по выборке наблюдений.

114

Пусть из ГС с ФР F(x,θ), где θ - неизвестный параметр, произведена выборка x1, x2,…,xn объемом п. В качестве оценки параметра θ рассматривают функции элементов выборки

U x1, x2 ,..., xn , которые называются статистиками. Задача оценки неизвестного параметра θ сводится к нахож-

дению

таких

статистик

(выборочных

функций)

U

x1, x2 ,..., xn

, которые могут быть использованы для

приближенного определения значения неизвестного параметра

θ.

Оценки параметров подразделяются на точечные и интервальные.

15.2. Основные свойства точечных статистических оценок распределения

Точечная оценка параметра θ определяется одним числом

U x1, x2 ,..., xn .

Качество оценок характеризуется некоторыми свойст-

вами. Сформулируем основные из них.

Свойство 1. Оценка

называется несмещенной, если ее

МО равно оцениваемому параметру, то есть если М( )= . Разность M( )- называется смещением.

Свойство 2. Оценка

n U x1, x2 ,..., xn называется со-

стоятельной, если при увеличении объема выборки п оценка

n

 

сходится

по вероятности к θ, то есть

0

lim P

 

n

 

1.

 

 

 

 

 

 

 

 

115

 

 

 

 

 

 

Свойство 3. Пусть 1 и 2 - две различные несмещен-

ные

оценки параметра θ. Если D( 1 )<D( 2 ), то говорят, что оценка

1 более эффективна, чем оценка 2 .

Требование несмещенности устраняет систематические ошибки в определении оценок, обусловленных ограниченным объемом выборки.

Требование состоятельности гарантирует от совершения грубых ошибок ε в определении θ при достаточно большом объема п выборки.

Свойство эффективности используется для выбора оценки, обладающей наименьшим разбросом.

15.3. Статистическая оценка МО

В качестве статистической оценки МО выбирается выборочное среднее.

Выборочным средним х называется среднее арифметическое элементов выборки

 

 

1

 

n

 

 

 

 

x

 

 

 

 

xi .

(15.1)

 

 

 

 

 

 

 

n i 1

 

 

 

 

 

 

 

 

 

Если xi - варианты выборки, ni

-частоты вариант xi , i 1, k,

k

 

 

 

 

 

 

 

 

 

n

ni - объем выборки, то

 

 

 

i

1

 

 

 

 

 

 

 

 

 

 

 

 

 

1 k

(15.2)

 

 

 

x

 

 

ni xi

 

 

 

 

 

 

 

 

 

 

 

n i 1

 

 

 

Для группированной выборки это соотношение принимает вид

116

x

1 k

xi ni .

(15.3)

 

 

n i

 

1

 

Выборочное среднее x является несмещенной и состоятельной оценкой.

По поводу эффективности x заметим, что если CВ X распределена по нормальному закону, то выборочное среднее является эффективной оценкой МО.

15.4.Статистическая оценка дисперсии

Вкачестве статистической оценки дисперсии D(X) CB X

примем выборочную дисперсию

s2

1

 

n

 

 

 

 

 

2

 

,

(15.4)

 

x

 

x

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i

 

 

 

 

 

 

 

 

 

 

 

n i 1

 

 

 

 

 

 

 

 

 

или

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

s2

1

k

 

 

 

 

 

 

 

2

(15.5)

 

 

 

 

 

n

x

 

x

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i

 

i

 

 

 

 

 

 

 

 

 

n i 1

 

 

 

 

 

 

 

 

 

для группированной выборки

 

 

 

 

 

 

 

 

 

s2

1 k

x

 

 

 

 

2

 

n .

(15.6)

 

 

 

 

 

 

x

 

 

 

 

 

 

 

 

 

 

 

n i

i

 

 

 

 

 

 

 

i

 

 

1

 

 

 

 

 

 

 

 

 

Но оценка s2 является смещенной. Для получения несмещенной оценки дисперсии выборочную дисперсию s2 исправляют, умножая ее на множитель n/(n-1).

Исправленная дисперсия

s2

 

 

n

 

 

s2

1

 

n

 

2

 

 

 

 

 

 

x

x

(15.7)

 

 

 

 

 

 

 

 

 

0

n

1

 

(n

1)

 

i

 

 

 

 

 

 

i 1

 

 

 

Или

 

 

n

 

 

s2

 

 

1

 

n

x

x

 

s2

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

k

 

 

 

0

 

n

1

 

(n

1)

i

i

 

(15.8)

 

 

 

i 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

117

 

 

 

является уже несмещенной оценкой дисперсии. Непосредственно из определений следует, что

s2

1

k

n x 2

 

n

 

x 2.

 

 

 

 

 

 

 

 

 

 

 

(15.9)

 

 

 

 

 

0

(n 1) i 1

i i

n

 

1

 

 

 

 

 

Величина so называется исправленным средним квадратическим отклонением.

Оценка s2 (а вместе с ней и s02 ) состоятельна.

Пример 15.1. Оценить математическое ожидание и дисперсию случайной величины X по результатам ее независимых наблюдений: 7, 3, 4, 8, 4, 6, 3.

Решение. По формулам (15.1) и (15.4) имеем

 

 

M X

 

X

7

3

4

8

4

6

3

5,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

7

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

D X s2

7

5 2

3

 

 

5 2

4

5 2

 

3

5 2

25

4,17.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

6

 

 

 

 

 

 

 

6

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Пример 15.2. Данные 25 независимых наблюдений слу-

чайной величины X представлены в сгруппированном виде:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Границы

 

5-7

 

 

7-9

9-11

11-13

 

13-15

 

 

 

 

 

интервалов

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Число

 

2

 

 

4

9

 

7

 

 

 

3

 

 

 

 

 

наблюдений

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Оценить математическое ожидание и дисперсию этой случайной величины.

Решение. Представителем каждого интервала можно считать его середину. С учетом этого формулы (15.3) и (15.6) дают следующие оценки:

118

M X

x

6 2

 

8 4

10 9

12 7

14 3

260

 

10, 4;

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

25

 

 

 

 

 

 

 

25

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

D X

s2

6

10, 4 2

2

8

 

10, 4

2

4

 

 

14

10, 4 2

3

5.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

24

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Пример 15.3. По выборке признака Х, заданной:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

xi

 

45

50

55

60

 

65

70

75

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ni

 

4

 

6

10

40

 

20

12

8

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

найти выборочное среднее, дисперсию и среднее квадратическое отклонение.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

7

 

 

 

 

 

 

 

 

Решение. Объем выборки n

 

 

 

 

ni 100. По формуле (15.2)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i

1

 

 

 

 

 

 

выборочное среднее

 

 

 

 

 

 

 

 

 

 

 

 

x

45 4

50 6

55 10

60 40

65 20

70 12

75 8

61, 7.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

100

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Для вычисления дисперсии составляем таблицу квадратов

значений СВ Х:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x2

 

 

2025

 

2500

3025

 

3600

4225

4900

 

5625

 

 

 

 

i

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ni

 

 

4

 

 

 

6

 

10

 

 

 

40

20

12

 

8

 

По формуле (15.9) имеем

 

100 (61, 7)2 50,11,

 

 

 

 

 

 

 

 

 

s2

 

 

1

 

n x 2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

7

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0

 

 

99

 

i

i

99

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i 1

 

 

 

 

 

 

 

откуда s0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

50,11

7, 08.

 

 

 

 

 

 

 

 

 

 

 

 

Получили несмещенные оценки для дисперсии и среднего

квадратического отклонения. Соответствующие смещенные

оценки s2 49, 61 и s 7, 04.

Пример 15.4. Проведено несколько измерений расстояния. Результаты измерений в метрах представлены в виде ряда:

119

i

xi

i

xi

i

xi

i

xi

 

 

 

 

 

 

 

 

1

1235,6

5

1238,5

9

1234,5

13

1234,3

 

 

 

 

 

 

 

 

2

1237,5

6

1234,2

10

1236,8

14

1237,5

 

 

 

 

 

 

 

 

3

1232,9

7

1235,9

11

1237,6

15

1235,4

 

 

 

 

 

 

 

 

4

1236,2

8

1233,3

12

1233,1

16

1234,7

 

 

 

 

 

 

 

 

Вычислить оценки математического ожидания, дисперсии и среднего квадратического отклонения измеренного расстояния.

Решение. Так как значение вариант xi большие, то удобно

ввести условные варианты ui

xi

a , где в качестве а возьмем

среднее число 1235, т.е.

а=1235. В итоге получим результат

для условных вариант:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i

ui

i

 

ui

i

ui

i

ui

 

 

 

 

 

 

 

 

 

 

 

 

 

1

0,6

5

 

3,5

9

-0,5

13

-0,7

 

 

 

 

 

 

 

 

 

 

 

 

 

2

2,5

6

 

-0,8

10

1,8

14

2,5

 

 

 

 

 

 

 

 

 

 

 

 

 

3

-2,1

7

 

0,9

11

2,6

15

0,4

 

 

 

 

 

 

 

 

 

 

 

 

 

4

1,2

8

 

-1,7

12

-1,9

16

-0,3

 

 

 

 

 

 

 

 

 

 

 

 

Выборочное среднее в данном случае вычисляется по формуле

x a

1 k

n u 1235

1

(16 8) 1235, 5.

 

 

 

 

 

n i 1

i i

16

 

 

 

 

Статистическая дисперсия

s2

1

7

n u 2

n

(x a)2

1 k

 

 

 

 

)2

 

 

 

 

 

 

 

n (u

i

 

u

,

 

 

 

 

 

 

0

(n 1)

 

i i

n 1

 

n i

i

 

 

 

 

 

i 1

 

 

1

 

 

 

 

 

где u - среднее значение условных вариант. Отсюда

s2

1

(0, 01

4

6, 76

0, 49

9

1, 69

0,16

4, 48

1

 

 

0

15

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1, 69

4, 41

5.76

1, 44

4

0, 01

0,

64)

3, 06,

 

120