4676
.pdf21
Пусть из генеральной совокупности извлечена выборка, причем значение
x1 наблюдалось n1 раз, |
x2 |
наблюдалось |
n2 |
раз, и т. д., до |
xk , которое |
|||||
наблюдалось nk раз. |
|
|
|
|
|
|
|
|
|
|
Составим таблицу |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
xi |
x1 |
|
x2 |
|
… |
|
xk |
|
|
|
ni |
n1 |
|
n2 |
|
… |
|
nk |
|
|
|
|
|
|
|
|
|
|
|||
которая называется статистическим распределением выборки. |
|
|||||||||
|
|
|
|
k |
|
|
|
|
|
|
Здесь xi – варианты, ni |
– частоты, ni |
n – объем выборки. |
|
i 1
Основные выборочные числовые характеристики
1) Выборочная средняя определяется как среднее арифметическое всех значений выборки:
xB 1 k ni xi .
n i 1
2) Выборочная дисперсия представляет собой среднее арифметическое значение квадратов отклонений вариант от выборочной средней:
|
1 |
k |
|
1 |
k |
|
DB X |
xi xB 2 ni |
|
xi 2 ni xB 2 . |
|||
|
|
|||||
|
n i 1 |
|
n i 1 |
3)Выборочное среднее квадратическое отклонение определяется формулой:
B X DB X .
4)Исправленная выборочная дисперсия:
S 2 |
n |
D |
X . |
|
|
|
|||
|
|
|||
|
n 1 |
B |
|
|
|
|
|
5) Исправленное выборочное среднее квадратическое отклонение:
22
SS 2 .
6)Коэффициент вариации – выраженное в процентах отношение выборочного среднего квадратического отклонения к выборочной средней:
V B X 100% . xB
7)Мода Mo – значение варианты, имеющей наибольшую частоту.
8)Медиана Me – значение варианты, расположенной в середине вариационного ряда:
|
|
xn 1 , |
n нечетное, |
|||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
2 |
|
|
|
|
||
|
|
|
|
|
|
|
|
|
|
|
M e |
xn xn |
|
|
|||||||
|
|
|
|
|
|
|
|
1 |
||
|
|
|
|
|
|
|
|
|
||
|
|
|
2 |
|
|
2 |
|
, n четное. |
||
|
|
|
|
|
|
|
|
|
||
|
|
|
|
|
2 |
|
|
|
||
Выборочный коэффициент корреляции |
||||||||||
Рассмотрим выборку объема |
n |
для двух случайных величин X и Y . |
Пусть x1 , x2 , ..., xn – значения случайной величины X на объектах выборки
объема, |
y1 , y2 , ..., yn – соответствующие значения случайной величины Y на |
|||||||||||
объектах данной выборки. |
|
|
|
|
||||||||
Выборочным коэффициентом корреляции называется величина |
||||||||||||
|
|
|
|
|
|
|
|
rxy |
|
xy |
, |
|
|
|
|
|
|
|
|
|
B |
X B Y |
|||
|
|
|
|
|
|
|
|
|
|
|||
|
|
1 |
n |
|
|
|
|
|||||
где xy |
|
xi yi |
|
B |
|
B |
– выборочный корреляционный момент, B X и |
|||||
x |
y |
|||||||||||
|
||||||||||||
|
|
n i1 |
|
|
|
|
||||||
B Y – выборочные средние квадратические отклонения случайных величин |
||||||||||||
X и Y |
соответственно. |
|
|
|
|
Свойства выборочного коэффициента корреляции
1. Абсолютная величина выборочного коэффициента корреляции rxy не превышает единицы, то есть 1 rxy 1.
|
|
|
|
|
23 |
|
2. |
Если |
rxy 1 |
или |
rxy |
1, то между наблюдаемыми |
значениями |
случайных величин |
X |
и |
Y имеется точная линейная |
зависимость |
||
( yi k xi |
b, |
i 1, 2, ..., n ). |
|
|
|
Выборочный коэффициент корреляции представляет собой меру линейной зависимости между наблюдаемыми значениями случайных величин X и Y . Чем rxy ближе к единице, тем зависимость между xi и yi , i 1, 2, ..., n , ближе к линейной.
Коэффициент корреляции rxy является безразмерной величиной, то есть его значение не зависит от единиц измерения случайных величин X и Y .
Доверительным интервалом статистической оценки истинного значения коэффициента корреляции нормально распределенных случайных величин X и Y является интервал
|
|
1 r |
2 |
|
|
1 r2 |
|
|
|
||||
r |
t |
|
xy |
r |
t |
|
xy |
. |
|
|
|
||
|
|
|
|
|
|
|
|
|
|||||
|
|
|
|
|
|
||||||||
xy |
|
|
|
|
xy |
|
|
|
|
|
|
|
|
|
|
|
n |
|
|
|
|
n |
|
|
|
||
Здесь rxy – выборочный коэффициент корреляции, величина t |
находится по |
||||||||||||
таблице значений функции Лапласа (приложение) из условия t |
|
|
, где |
||||||||||
|
|
|
|
|
|
|
|
|
|
|
2 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
– заданный доверительный уровень.
Уравнения линейных среднеквадратических регрессий
Уравнением линейной среднеквадратической регрессии величины X
на величину Y называется уравнение
x xB |
|
r |
y yB |
. |
B X |
|
|
||
xy B Y |
Уравнением линейной среднеквадратической регрессии величины Y
на величину X называется уравнение
24
y yB |
r |
x xB |
|
. |
||||
|
|
Y |
|
|
X |
|
||
B |
xy |
B |
|
|||||
|
|
|
|
|
|
|
2.2. Практическая часть
Пример 1. Из генеральной совокупности извлечена выборка объема n . Найти следующие выборочные числовые характеристики:
1)выборочную среднюю;
2)выборочную дисперсию;
3)выборочное среднее квадратическое отклонение;
4)исправленную выборочную дисперсию;
5)коэффициент вариации;
6)моду;
7)медиану.
Решить задачу методом условных вариант.
xi |
156 |
160 |
164 |
168 |
172 |
176 |
180 |
|
|
|
|
|
|
|
|
ni |
10 |
14 |
23 |
28 |
12 |
8 |
5 |
|
|
|
|
|
|
|
|
Решение. Объем выборки
k
n ni 10 14 23 28 12 8 5 100.
i 1
1) Выборочная средняя:
xB 1 k ni xi
n i 1
10 156 14 160 23 164 28 168 12 172 8 176 5 180 100
16648100 166,48.
25
2) Выборочная дисперсия представляет собой среднее арифметическое квадратов отклонений вариант от выборочной средней:
DB X 1 k xi xB 2 ni
n i 1
(156 166,48 )2 10 (160 166,48 )2 14 (164 166,48 )2 23 100
(168 166,48 )2 28 (172 166,48 )2 12 (176 166,48 )2 8 (180 166,48 )2 5 100
3896,96 38,97. 100
3)Выборочное среднее квадратическое отклонение:
B DB 38,97 6,24.
4)Исправленная выборочная дисперсия:
S 2 |
n |
D |
|
100 |
38,97 39,36. |
|
|
|
|
||||
|
n 1 |
B |
99 |
|
||
|
|
|
5) Коэффициент вариации:
V |
B 100% |
6,24 |
100% 3,75%. |
|
|
|
|||
|
xB |
166,48 |
|
6) Мода:
Так как max ni 28, то M0 = 168.
i
7) Медиана:
Так как n 100 (четное число), то
|
|
|
x100 x100 |
1 |
|
x50 x51 |
|
168 168 |
|
|||
M |
|
|
|
2 |
|
2 |
|
|
168. |
|||
e |
|
|
|
|
|
|
|
|||||
|
|
|
|
2 |
|
|
2 |
2 |
|
|||
|
|
|
|
|
|
|
|
26
Решим задачу методом условных вариант. Метод условных вариант заключается в том, что сначала вычисляют выборочную среднюю и выборочную дисперсию для условных вариант:
u |
xi u0 |
( i 1,2,...,k ). |
|
||
i |
h |
|
|
|
При этом u0 и h подбирают так, чтобы условные варианты ui были небольшими. Чаще всего за u0 берут моду M 0 , особенно простыми получаются вычисления, когда числа xi образуют арифметическую прогрессию с разностью h .
Затем вычисляют выборочную среднюю и выборочную дисперсию для исходной варианты x по формулам:
xB u0 h uB , DB ( X ) h2 DB (U ).
Введем условные варианты:
|
u |
|
xi u0 |
, |
|
|
|||
|
i |
|
h |
|
|
|
|
||
где u0 M0 ( X ) 168, |
h = 4 |
(разность между соседними значениями |
||
вариант xi ). |
|
|
|
|
Составим таблицу: |
|
|
|
|
27
xi |
ni |
ui |
xi 168 |
|
ni ui |
|
n u 2 |
|
|
|
|
|
|
i i |
|
|
|
|
4 |
|
|
|
|
|
|
|
|
|
|
|
|
156 |
10 |
|
– 3 |
|
– 30 |
90 |
|
|
|
|
|
|
|
|
|
160 |
14 |
|
– 2 |
|
– 28 |
56 |
|
|
|
|
|
|
|
|
|
164 |
23 |
|
– 1 |
|
– 23 |
23 |
|
|
|
|
|
|
|
|
|
168 |
28 |
|
0 |
|
0 |
|
0 |
|
|
|
|
|
|
|
|
172 |
12 |
|
1 |
|
12 |
|
12 |
|
|
|
|
|
|
|
|
176 |
8 |
|
2 |
|
16 |
|
32 |
|
|
|
|
|
|
|
|
180 |
5 |
|
3 |
|
15 |
|
45 |
|
|
|
|
|
|
|
|
– |
– |
|
– |
|
k |
|
k |
|
|
|
|
|
ni ui |
|
ni ui 2 |
|
|
|
|
|
i 1 |
|
i 1 |
|
|
|
|
|
38 |
|
258 |
|
|
|
|
|
|
|
|
Вычисляем выборочные величины для условных вариант:
|
|
|
|
|
1 |
|
|
k |
38 |
|
|
||
|
|
|
B |
|
|
ni ui |
|
0,38; |
|||||
u |
|||||||||||||
|
|
|
|
|
|
||||||||
|
|
|
|
|
n |
i 1 |
100 |
|
|
||||
|
|
|
|
|
|
1 |
k |
|
258 |
|
|||
|
uB2 |
ni ui2 |
2,58. |
||||||||||
|
n |
100 |
|||||||||||
|
|
|
|
|
|
i 1 |
|
Выборочные величины для исходных вариант находим по формулам:
xB u0 h uB 168 4 0,38 168 1,52 166,48;
DB X h2 DB U 42 2,4356 16 2,4356 38,97.
Пример 2. Дана таблица значений температуры смазочного масла заднего моста автомобиля Y в зависимости от температуры окружающего воздуха X .
28
Т а б л и ц а 2.1
Y |
4 |
8 |
12 |
16 |
12 |
12 |
12 |
12 |
16 |
4 |
12 |
12 |
12 |
4 |
8 |
8 |
4 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
X |
5 |
15 |
15 |
15 |
35 |
15 |
35 |
15 |
35 |
5 |
15 |
35 |
25 |
25 |
25 |
25 |
25 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Y |
12 |
16 |
8 |
12 |
8 |
24 |
12 |
12 |
12 |
16 |
12 |
16 |
12 |
16 |
16 |
20 |
12 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
X |
25 |
55 |
25 |
25 |
25 |
65 |
35 |
35 |
35 |
45 |
35 |
45 |
35 |
15 |
35 |
45 |
35 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Y |
16 |
12 |
20 |
16 |
16 |
20 |
16 |
20 |
16 |
20 |
16 |
20 |
20 |
20 |
24 |
20 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
X |
45 |
35 |
45 |
55 |
55 |
45 |
55 |
45 |
55 |
45 |
55 |
55 |
55 |
55 |
55 |
55 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Требуется:
1)на основе опытных данных вычислить выборочный коэффициент корреляции;
2)определить доверительный интервал коэффициента корреляции с надежностью (доверительным уровнем) =0,95;
3)составить уравнение линейной среднеквадратической регрессии величины Y на величину X;
4)построить корреляционное поле и график линейной регрессии.
Решение. Данные табл. 2.1 сведем в корреляционную таблицу (табл. 2.2).
|
|
|
|
|
|
|
Т а б л и ц а 2.2 |
||
|
|
|
|
|
|
|
|
|
|
X |
5 |
15 |
25 |
35 |
45 |
55 |
|
65 |
|
Y |
|
|
|
|
|
|
|
|
n j |
|
|
|
|
|
|
|
|
|
|
4 |
2 |
|
2 |
|
|
|
|
|
4 |
|
|
|
|
|
|
|
|
|
|
8 |
|
1 |
4 |
|
|
|
|
|
5 |
|
|
|
|
|
|
|
|
|
|
12 |
|
4 |
3 |
10 |
|
|
|
|
17 |
|
|
|
|
|
|
|
|
|
|
16 |
|
2 |
|
2 |
3 |
6 |
|
|
13 |
|
|
|
|
|
|
|
|
|
|
20 |
|
|
|
|
5 |
4 |
|
|
9 |
|
|
|
|
|
|
|
|
|
|
24 |
|
|
|
|
|
1 |
|
1 |
2 |
|
|
|
|
|
|
|
|
|
|
ni |
2 |
7 |
9 |
12 |
8 |
11 |
1 |
n = 50 |
|
|
|
|
|
|
|
|
|
|
|
29
Для упрощения вычислений перейдем к условным вариантам ui и v j (при этом величина коэффициента корреляции rxy не изменится):
u |
x u |
0 |
|
|
|
y j |
v0 |
|
i |
, v |
|
|
|
. |
|||
|
|
j |
|
|
||||
i |
hx |
|
|
|
|
hy |
|
|
|
|
|
|
|
|
|
В качестве u0 выберем моду вариационного ряда случайной величины X , а в
качестве v0 |
|
– моду вариационного ряда случайной величины Y. |
|
|
|
|
|
||||||||||||||||||||
u |
o |
= М |
|
|
( Х ) = 35, |
h |
x |
|
x |
|
= 10, тогда |
u |
xi uo |
|
xi 35 |
; |
|||||||||||
o |
|
|
|
|
|
||||||||||||||||||||||
|
|
|
|
|
x |
i |
i 1 |
|
|
|
|
i |
|
|
hx |
10 |
|
|
|||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||
v |
|
= М |
|
|
( Y )= 12, |
h |
y |
y |
j |
y |
j 1 |
= 4, тогда |
v |
j |
|
|
y j vo |
|
|
y j 12 |
. |
||||||
|
o |
|
|
|
|||||||||||||||||||||||
o |
|
|
|
|
|
|
|
|
|
|
|
|
hy |
4 |
|
|
|||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Составим таблицу для условных вариант (табл. 2.3).
|
|
|
|
|
|
|
Т а б л и ц а 2.3 |
||
|
|
|
|
|
|
|
|
|
|
U |
-3 |
-2 |
-1 |
0 |
1 |
2 |
|
3 |
|
V |
|
|
|
|
|
|
|
|
n j |
|
|
|
|
|
|
|
|
|
|
-2 |
2 |
|
2 |
|
|
|
|
|
4 |
|
|
|
|
|
|
|
|
|
|
-1 |
|
1 |
4 |
|
|
|
|
|
5 |
|
|
|
|
|
|
|
|
|
|
0 |
|
4 |
3 |
10 |
|
|
|
|
17 |
|
|
|
|
|
|
|
|
|
|
1 |
|
2 |
|
2 |
3 |
6 |
|
|
13 |
|
|
|
|
|
|
|
|
|
|
2 |
|
|
|
|
5 |
4 |
|
|
9 |
|
|
|
|
|
|
|
|
|
|
3 |
|
|
|
|
|
1 |
|
1 |
2 |
|
|
|
|
|
|
|
|
|
|
ni |
2 |
7 |
9 |
12 |
8 |
11 |
1 |
n = 50 |
Вычислим необходимые выборочные величины. В таблице 2.4 приведены результаты вычислений, которые при этом нужно использовать.
30
|
|
|
|
|
|
|
|
|
|
|
Т а б л и ц а 2.4 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
U |
|
-3 |
-2 |
-1 |
0 |
1 |
2 |
3 |
|
|
|
|
V |
|
|
|
|
|
|
|
|
n j |
nj v j |
nj v2j |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
-2 |
|
2 |
|
2 |
|
|
|
|
4 |
-8 |
16 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
-1 |
|
|
1 |
4 |
|
|
|
|
5 |
-5 |
5 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
0 |
|
|
4 |
3 |
10 |
|
|
|
17 |
0 |
0 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
|
|
2 |
|
2 |
3 |
6 |
|
13 |
13 |
13 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
2 |
|
|
|
|
|
5 |
4 |
|
9 |
18 |
36 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
3 |
|
|
|
|
|
|
1 |
1 |
2 |
6 |
18 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
ni |
|
2 |
7 |
9 |
12 |
8 |
11 |
1 |
n = 50 |
= 24 |
= 88 |
|
ni ui |
-6 |
-14 |
-9 |
0 |
8 |
22 |
3 |
= 4 |
|
|
|
|
n u |
2 |
18 |
28 |
9 |
0 |
8 |
44 |
9 |
= 116 |
|
|
|
i |
i |
|
|
|
|
|
|
|
|
|
|
|
nij ui v j |
12 |
-2 |
8 |
0 |
13 |
34 |
9 |
= 74 |
|
|
Подставляя эти результаты в формулы, получим
|
|
|
|
|
7 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
6 |
|
|
|
|
|
|
|
|
|
|||
|
|
|
|
|
1 |
ni ui |
|
1 |
|
|
|
4 |
|
|
|
|
|
1 |
|
nj v j |
1 |
|
|
24 |
0,48; |
||||||||||
uB |
|
|
4 |
|
0,08,v |
B |
|
24 |
|||||||||||||||||||||||||||
|
|
50 |
50 |
n |
50 |
50 |
|||||||||||||||||||||||||||||
|
|
|
|
|
|
n i 1 |
|
|
|
|
|
|
|
|
|
j 1 |
|
|
|
|
|||||||||||||||
|
|
|
|
1 |
7 |
|
1 |
|
|
|
|
116 |
|
|
|
|
|
|
|
1 |
6 |
|
1 |
|
|
88 |
|
||||||||
uB2 |
|
ni ui2 |
|
|
116 |
2,32,vB2 |
|
nj v2j |
|
88 |
1,76. |
||||||||||||||||||||||||
|
|
|
50 |
|
|
50 |
|
n |
50 |
|
|||||||||||||||||||||||||
|
|
|
|
n i 1 |
|
|
|
|
|
|
|
|
|
|
|
|
j 1 |
|
|
50 |
|
DB U uB2 uB 2 2,32 0,08 2 2,3136,
DB V vB2 vB 2 1,76 0,48 2 1,5296,
B U DB U 2,3136 1,5211, B V DB V 1,5296 1,2368.
Тогда выборочный корреляционный момент uv для условных вариант будет равен