Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

4676

.pdf
Скачиваний:
1
Добавлен:
08.01.2021
Размер:
1.35 Mб
Скачать

21

Пусть из генеральной совокупности извлечена выборка, причем значение

x1 наблюдалось n1 раз,

x2

наблюдалось

n2

раз, и т. д., до

xk , которое

наблюдалось nk раз.

 

 

 

 

 

 

 

 

 

Составим таблицу

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

xi

x1

 

x2

 

 

xk

 

 

 

ni

n1

 

n2

 

 

nk

 

 

 

 

 

 

 

 

 

 

которая называется статистическим распределением выборки.

 

 

 

 

 

k

 

 

 

 

 

Здесь xi варианты, ni

частоты, ni

n объем выборки.

 

i 1

Основные выборочные числовые характеристики

1) Выборочная средняя определяется как среднее арифметическое всех значений выборки:

xB 1 k ni xi .

n i 1

2) Выборочная дисперсия представляет собой среднее арифметическое значение квадратов отклонений вариант от выборочной средней:

 

1

k

 

1

k

DB X

xi xB 2 ni

 

xi 2 ni xB 2 .

 

 

 

n i 1

 

n i 1

3)Выборочное среднее квадратическое отклонение определяется формулой:

B X DB X .

4)Исправленная выборочная дисперсия:

S 2

n

D

X .

 

 

 

 

 

n 1

B

 

 

 

 

5) Исправленное выборочное среднее квадратическое отклонение:

22

SS 2 .

6)Коэффициент вариации – выраженное в процентах отношение выборочного среднего квадратического отклонения к выборочной средней:

V B X 100% . xB

7)Мода Mo – значение варианты, имеющей наибольшую частоту.

8)Медиана Me – значение варианты, расположенной в середине вариационного ряда:

 

 

xn 1 ,

n нечетное,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

M e

xn xn

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

2

 

, n четное.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

Выборочный коэффициент корреляции

Рассмотрим выборку объема

n

для двух случайных величин X и Y .

Пусть x1 , x2 , ..., xn – значения случайной величины X на объектах выборки

объема,

y1 , y2 , ..., yn – соответствующие значения случайной величины Y на

объектах данной выборки.

 

 

 

 

Выборочным коэффициентом корреляции называется величина

 

 

 

 

 

 

 

 

rxy

 

xy

,

 

 

 

 

 

 

 

 

B

X B Y

 

 

 

 

 

 

 

 

 

 

 

 

1

n

 

 

 

 

где xy

 

xi yi

 

B

 

B

– выборочный корреляционный момент, B X и

x

y

 

 

 

n i1

 

 

 

 

B Y – выборочные средние квадратические отклонения случайных величин

X и Y

соответственно.

 

 

 

 

Свойства выборочного коэффициента корреляции

1. Абсолютная величина выборочного коэффициента корреляции rxy не превышает единицы, то есть 1 rxy 1.

 

 

 

 

 

23

 

2.

Если

rxy 1

или

rxy

1, то между наблюдаемыми

значениями

случайных величин

X

и

Y имеется точная линейная

зависимость

( yi k xi

b,

i 1, 2, ..., n ).

 

 

 

Выборочный коэффициент корреляции представляет собой меру линейной зависимости между наблюдаемыми значениями случайных величин X и Y . Чем rxy ближе к единице, тем зависимость между xi и yi , i 1, 2, ..., n , ближе к линейной.

Коэффициент корреляции rxy является безразмерной величиной, то есть его значение не зависит от единиц измерения случайных величин X и Y .

Доверительным интервалом статистической оценки истинного значения коэффициента корреляции нормально распределенных случайных величин X и Y является интервал

 

 

1 r

2

 

 

1 r2

 

 

 

r

t

 

xy

r

t

 

xy

.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

xy

 

 

 

 

xy

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

n

 

 

 

Здесь rxy – выборочный коэффициент корреляции, величина t

находится по

таблице значений функции Лапласа (приложение) из условия t

 

 

, где

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

– заданный доверительный уровень.

Уравнения линейных среднеквадратических регрессий

Уравнением линейной среднеквадратической регрессии величины X

на величину Y называется уравнение

x xB

 

r

y yB

.

B X

 

 

xy B Y

Уравнением линейной среднеквадратической регрессии величины Y

на величину X называется уравнение

24

y yB

r

x xB

 

.

 

 

Y

 

 

X

 

B

xy

B

 

 

 

 

 

 

 

 

2.2. Практическая часть

Пример 1. Из генеральной совокупности извлечена выборка объема n . Найти следующие выборочные числовые характеристики:

1)выборочную среднюю;

2)выборочную дисперсию;

3)выборочное среднее квадратическое отклонение;

4)исправленную выборочную дисперсию;

5)коэффициент вариации;

6)моду;

7)медиану.

Решить задачу методом условных вариант.

xi

156

160

164

168

172

176

180

 

 

 

 

 

 

 

 

ni

10

14

23

28

12

8

5

 

 

 

 

 

 

 

 

Решение. Объем выборки

k

n ni 10 14 23 28 12 8 5 100.

i 1

1) Выборочная средняя:

xB 1 k ni xi

n i 1

10 156 14 160 23 164 28 168 12 172 8 176 5 180 100

16648100 166,48.

25

2) Выборочная дисперсия представляет собой среднее арифметическое квадратов отклонений вариант от выборочной средней:

DB X 1 k xi xB 2 ni

n i 1

(156 166,48 )2 10 (160 166,48 )2 14 (164 166,48 )2 23 100

(168 166,48 )2 28 (172 166,48 )2 12 (176 166,48 )2 8 (180 166,48 )2 5 100

3896,96 38,97. 100

3)Выборочное среднее квадратическое отклонение:

B DB 38,97 6,24.

4)Исправленная выборочная дисперсия:

S 2

n

D

 

100

38,97 39,36.

 

 

 

 

n 1

B

99

 

 

 

 

5) Коэффициент вариации:

V

B 100%

6,24

100% 3,75%.

 

 

 

xB

166,48

 

6) Мода:

Так как max ni 28, то M0 = 168.

i

7) Медиана:

Так как n 100 (четное число), то

 

 

 

x100 x100

1

 

x50 x51

 

168 168

 

M

 

 

 

2

 

2

 

 

168.

e

 

 

 

 

 

 

 

 

 

 

 

2

 

 

2

2

 

 

 

 

 

 

 

 

 

26

Решим задачу методом условных вариант. Метод условных вариант заключается в том, что сначала вычисляют выборочную среднюю и выборочную дисперсию для условных вариант:

u

xi u0

( i 1,2,...,k ).

 

i

h

 

 

 

При этом u0 и h подбирают так, чтобы условные варианты ui были небольшими. Чаще всего за u0 берут моду M 0 , особенно простыми получаются вычисления, когда числа xi образуют арифметическую прогрессию с разностью h .

Затем вычисляют выборочную среднюю и выборочную дисперсию для исходной варианты x по формулам:

xB u0 h uB , DB ( X ) h2 DB (U ).

Введем условные варианты:

 

u

 

xi u0

,

 

 

 

i

 

h

 

 

 

где u0 M0 ( X ) 168,

h = 4

(разность между соседними значениями

вариант xi ).

 

 

 

 

Составим таблицу:

 

 

 

 

27

xi

ni

ui

xi 168

 

ni ui

 

n u 2

 

 

 

 

 

 

i i

 

 

 

4

 

 

 

 

 

 

 

 

 

 

 

156

10

 

– 3

 

– 30

90

 

 

 

 

 

 

 

160

14

 

– 2

 

– 28

56

 

 

 

 

 

 

 

164

23

 

– 1

 

– 23

23

 

 

 

 

 

 

 

 

168

28

 

0

 

0

 

0

 

 

 

 

 

 

 

 

172

12

 

1

 

12

 

12

 

 

 

 

 

 

 

 

176

8

 

2

 

16

 

32

 

 

 

 

 

 

 

 

180

5

 

3

 

15

 

45

 

 

 

 

 

 

 

 

 

 

k

 

k

 

 

 

 

 

ni ui

 

ni ui 2

 

 

 

 

 

i 1

 

i 1

 

 

 

 

 

38

 

258

 

 

 

 

 

 

 

 

Вычисляем выборочные величины для условных вариант:

 

 

 

 

 

1

 

 

k

38

 

 

 

 

 

B

 

 

ni ui

 

0,38;

u

 

 

 

 

 

 

 

 

 

 

 

n

i 1

100

 

 

 

 

 

 

 

 

1

k

 

258

 

 

uB2

ni ui2

2,58.

 

n

100

 

 

 

 

 

 

i 1

 

Выборочные величины для исходных вариант находим по формулам:

xB u0 h uB 168 4 0,38 168 1,52 166,48;

DB X h2 DB U 42 2,4356 16 2,4356 38,97.

Пример 2. Дана таблица значений температуры смазочного масла заднего моста автомобиля Y в зависимости от температуры окружающего воздуха X .

28

Т а б л и ц а 2.1

Y

4

8

12

16

12

12

12

12

16

4

12

12

12

4

8

8

4

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

X

5

15

15

15

35

15

35

15

35

5

15

35

25

25

25

25

25

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Y

12

16

8

12

8

24

12

12

12

16

12

16

12

16

16

20

12

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

X

25

55

25

25

25

65

35

35

35

45

35

45

35

15

35

45

35

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Y

16

12

20

16

16

20

16

20

16

20

16

20

20

20

24

20

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

X

45

35

45

55

55

45

55

45

55

45

55

55

55

55

55

55

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Требуется:

1)на основе опытных данных вычислить выборочный коэффициент корреляции;

2)определить доверительный интервал коэффициента корреляции с надежностью (доверительным уровнем) =0,95;

3)составить уравнение линейной среднеквадратической регрессии величины Y на величину X;

4)построить корреляционное поле и график линейной регрессии.

Решение. Данные табл. 2.1 сведем в корреляционную таблицу (табл. 2.2).

 

 

 

 

 

 

 

Т а б л и ц а 2.2

 

 

 

 

 

 

 

 

 

 

X

5

15

25

35

45

55

 

65

 

Y

 

 

 

 

 

 

 

 

n j

 

 

 

 

 

 

 

 

 

 

4

2

 

2

 

 

 

 

 

4

 

 

 

 

 

 

 

 

 

 

8

 

1

4

 

 

 

 

 

5

 

 

 

 

 

 

 

 

 

 

12

 

4

3

10

 

 

 

 

17

 

 

 

 

 

 

 

 

 

 

16

 

2

 

2

3

6

 

 

13

 

 

 

 

 

 

 

 

 

 

20

 

 

 

 

5

4

 

 

9

 

 

 

 

 

 

 

 

 

 

24

 

 

 

 

 

1

 

1

2

 

 

 

 

 

 

 

 

 

ni

2

7

9

12

8

11

1

n = 50

 

 

 

 

 

 

 

 

 

 

29

Для упрощения вычислений перейдем к условным вариантам ui и v j (при этом величина коэффициента корреляции rxy не изменится):

u

x u

0

 

 

 

y j

v0

 

i

, v

 

 

 

.

 

 

j

 

 

i

hx

 

 

 

 

hy

 

 

 

 

 

 

 

 

В качестве u0 выберем моду вариационного ряда случайной величины X , а в

качестве v0

 

– моду вариационного ряда случайной величины Y.

 

 

 

 

 

u

o

= М

 

 

( Х ) = 35,

h

x

 

x

 

= 10, тогда

u

xi uo

 

xi 35

;

o

 

 

 

 

 

 

 

 

 

 

x

i

i 1

 

 

 

 

i

 

 

hx

10

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

v

 

= М

 

 

( Y )= 12,

h

y

y

j

y

j 1

= 4, тогда

v

j

 

 

y j vo

 

 

y j 12

.

 

o

 

 

 

o

 

 

 

 

 

 

 

 

 

 

 

 

hy

4

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Составим таблицу для условных вариант (табл. 2.3).

 

 

 

 

 

 

 

Т а б л и ц а 2.3

 

 

 

 

 

 

 

 

 

 

U

-3

-2

-1

0

1

2

 

3

 

V

 

 

 

 

 

 

 

 

n j

 

 

 

 

 

 

 

 

 

 

-2

2

 

2

 

 

 

 

 

4

 

 

 

 

 

 

 

 

 

 

-1

 

1

4

 

 

 

 

 

5

 

 

 

 

 

 

 

 

 

 

0

 

4

3

10

 

 

 

 

17

 

 

 

 

 

 

 

 

 

 

1

 

2

 

2

3

6

 

 

13

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

5

4

 

 

9

 

 

 

 

 

 

 

 

 

 

3

 

 

 

 

 

1

 

1

2

 

 

 

 

 

 

 

 

 

ni

2

7

9

12

8

11

1

n = 50

Вычислим необходимые выборочные величины. В таблице 2.4 приведены результаты вычислений, которые при этом нужно использовать.

30

 

 

 

 

 

 

 

 

 

 

 

Т а б л и ц а 2.4

 

 

 

 

 

 

 

 

 

 

 

 

 

 

U

 

-3

-2

-1

0

1

2

3

 

 

 

 

V

 

 

 

 

 

 

 

 

n j

nj v j

nj v2j

 

 

 

 

 

 

 

 

 

 

 

 

 

 

-2

 

2

 

2

 

 

 

 

4

-8

16

 

 

 

 

 

 

 

 

 

 

 

 

 

 

-1

 

 

1

4

 

 

 

 

5

-5

5

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0

 

 

4

3

10

 

 

 

17

0

0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

2

 

2

3

6

 

13

13

13

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

5

4

 

9

18

36

 

 

 

 

 

 

 

 

 

 

 

 

 

 

3

 

 

 

 

 

 

1

1

2

6

18

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ni

 

2

7

9

12

8

11

1

n = 50

= 24

= 88

 

ni ui

-6

-14

-9

0

8

22

3

= 4

 

 

 

n u

2

18

28

9

0

8

44

9

= 116

 

 

 

i

i

 

 

 

 

 

 

 

 

 

 

 

nij ui v j

12

-2

8

0

13

34

9

= 74

 

 

Подставляя эти результаты в формулы, получим

 

 

 

 

 

7

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

6

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

ni ui

 

1

 

 

 

4

 

 

 

 

 

1

 

nj v j

1

 

 

24

0,48;

uB

 

 

4

 

0,08,v

B

 

24

 

 

50

50

n

50

50

 

 

 

 

 

 

n i 1

 

 

 

 

 

 

 

 

 

j 1

 

 

 

 

 

 

 

 

1

7

 

1

 

 

 

 

116

 

 

 

 

 

 

 

1

6

 

1

 

 

88

 

uB2

 

ni ui2

 

 

116

2,32,vB2

 

nj v2j

 

88

1,76.

 

 

 

50

 

 

50

 

n

50

 

 

 

 

 

n i 1

 

 

 

 

 

 

 

 

 

 

 

 

j 1

 

 

50

 

DB U uB2 uB 2 2,32 0,08 2 2,3136,

DB V vB2 vB 2 1,76 0,48 2 1,5296,

B U DB U 2,3136 1,5211, B V DB V 1,5296 1,2368.

Тогда выборочный корреляционный момент uv для условных вариант будет равен

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]