Задание 1: Сравнение 2 выборок
Зависимость урожайности сорта vega от внесения полной нормы удобрений:
Зависит ли урожайность сорта vega внесение полной нормы удобрений?
Выборка:
(kt<-sort(c(37,37,38,38,39,39,38,38,40,41,42,52,41,45,46,47,48,28,31,33,31,32,35,37,37,39)));kt
(f<-sort(c(60,61,62,60,61,61,61,63,64,68,63,65,66,73,74,75,41,44,46,46,50,53,52,53,56)));f
min(kt)= 28
max(kt) = 52
mean(kt)= 38.81
sd(kt) (S)= 5.607275
median(kt) = 38
min(f) =41
max(f) =75
mean(f) = 59.12
sd(f)( S) =9.18477
median(f) = 61
Тест на нормальность:
Нулевая гипотеза:
Отличия распределений незначимы
Shapiro-Wilk normality test
data: kt
W = 0.96553, p-value = 0.5119 (отличия распределений незначимы, распределение нормальное, т.к. p больше 0,05)
data: f
W = 0.95953, p-value = 0.4053 (отличия распределений незначимы, распределение нормальное, т.к. p больше 0,05)
Сравнение дисперсий:
Нулевая гипотеза:
Отличие дисперсий незначимо, дисперсии однородны.
data: kt and f
F = 0.37271, num df = 25, denom df = 24, p-value = 0.01724
alternative hypothesis: true ratio of variances is not equal to 1
95 percent confidence interval:
0.1651035 0.8356912
sample estimates:
ratio of variances
0.3727067
Статистические выводы: Отличие дисперсий незначимо, т.е. дисперсии однородны, поскольку F = 0.37271 меньше табличного (F =3,84) при уровне значимости p-value = 0.01724. Тогда используем критерий Стьюдента для определения значимости критериев между средними:
Нулевая гипотеза:
Отличия между средними арифметическими достоверны
data: kt and f
t = -9.4875, df = 39.424, p-value = 9.966e-12
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
-24.64131 -15.98330
sample estimates:
mean of x mean of y
38.80769 59.12000
Статистические выводы: Полученное значение t = -9.4875 меньше, чем t(табл.) = 2.13 при уровне значимости p-value = 9.966e-12, следовательно, различия между средними арифметическими достоверны при уровне значимости p < 0.01.
Интерпретация: Поскольку F = 0.37271 меньше табличного значения (F =3,84) при уровне значимости p-value = 0.01724, отличие дисперсий незначимо, значит, дисперсии однородны. И урожайность сорта vega зависит от внесения полной нормы удобрений.
Задание 2: Дисперсионный анализ
Однофакторный анализ
Влияние внесения удобрений на урожайность кукурузы: Влияет ли внесение удобрений (Op) на урожайность кукурузы (Ur)?
Kt - контроль
h - половина нормы удобрений
f – норма удобрений
Нулевая гипотеза:
Отличие дисперсий незначимо, факториальная дисперсия не больше случайной.
Выборка:
Ur Op
1 37 kt
2 37 kt
3 38 kt
4 38 kt
5 39 kt
6 39 kt
7 38 kt
8 38 kt
9 40 kt
10 41 kt
11 42 kt
12 52 kt
13 41 kt
14 45 kt
15 46 kt
16 47 kt
17 48 kt
18 28 kt
19 31 kt
20 33 kt
21 31 kt
22 32 kt
23 35 kt
24 37 kt
25 37 kt
26 39 kt
27 44 h
28 45 h
29 45 h
30 45 h
31 46 h
32 46 h
33 47 h
34 47 h
35 48 h
36 49 h
37 50 h
38 46 h
39 47 h
40 49 h
41 53 h
42 54 h
43 38 h
44 38 h
45 39 h
46 35 h
47 39 h
48 40 h
49 42 h
50 60 f
51 61 f
52 62 с
53 60 f
54 61 f
55 61 f
56 61 f
57 63 f
58 64 f
59 68 f
60 63 f
61 65 f
62 66 f
63 73 f
64 74 f
65 75 f
66 41 f
67 44 f
68 46 f
69 46 f
70 50 f
71 53 f
72 52 f
73 53 f
74 56 f
Тест на нормальность:
$f W = 0.95953, p-value = 0.4053 (отличия незначимы, распределение нормальное, т.к. больше 0,05)
$h W = 0.96225, p-value = 0.5102(отличия незначимы, распределение нормальное, т.к. больше 0,05)
$kt W = 0.96553, p-value = 0.5119(отличия незначимы, распределение нормальное, т.к. больше 0,05) ANOVA
Нулевая гипотеза:
Отличие дисперсий незначимо, факториальная дисперсия не больше случайной.
Df Sum Sq Mean Sq F value Pr(>F)
kuk$Op 2 5499 2749.5 58.42 9.99e-16 ***
Residuals 71 3341 47.1
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Внесение удобрений значительно влияет на урожайность кукурузы, поскольку F = 58.42 больше табличного значения при уровне значимости p-value = 9.99e-16. Факториальная дисперсия больше остаточной.
Попарное сравнение средних (критерий Тьюки):
Нулевая гипотеза:
Различия между средними арифметическими достоверно.
Tukey multiple comparisons of means
95% family-wise confidence level
Fit: aov(formula = kuk$Ur ~ kuk$Op, data = kuk)
$`kuk$Op`
diff lwr upr p adj
h-f -14.250435 -18.99513 -9.505741 0.0000000 различия между средними арифметическими достоверны при уровне значимости p < 0.01.
kt-f -20.312308 -24.91222 -15.712392 0.0000000 различия между средними арифметическими достоверны при уровне значимости p < 0.01.
kt-h -6.061873 -10.76264 -1.361104 0.0080176 различия между средними арифметическими достоверны при уровне значимости p < 0.01.
Многофакторный анализ
Влияние условий внесения удобрений, увлажненности почвы и сорта кукурузы на ее урожайность:
Влияют ли условия внесение удобрений (Op), увлажненность почвы на площадке (Ms) и сорт кукурузы (Sp) на урожайность кукурузы (Ur)?
Kt - контроль
h - половина нормы удобрений
f – норма удобрений
Нулевая гипотеза: 1) для описания влияния трех факторов - отличие дисперсий незначимо, факториальная дисперсия не больше случайной.
для описания влияния каждого отдельного фактора, попарного и совместного действия факторов - отличие дисперсий незначимо, факториальная дисперсия не больше случайной.
Выборка:
Ur |
Op |
Ms |
Sp |
37 |
kt |
dr |
Ar |
37 |
kt |
dr |
Ar |
38 |
kt |
dr |
Ar |
38 |
kt |
dr |
Vg |
39 |
kt |
dr |
Vg |
39 |
kt |
dr |
Vg |
38 |
kt |
dr |
Tl |
38 |
kt |
dr |
Tl |
40 |
kt |
dr |
Tl |
41 |
kt |
opt |
Ar |
42 |
kt |
opt |
Ar |
52 |
kt |
opt |
Ar |
41 |
kt |
opt |
Vg |
45 |
kt |
opt |
Vg |
46 |
kt |
opt |
Vg |
47 |
kt |
opt |
Tl |
48 |
kt |
opt |
Tl |
28 |
kt |
wt |
Ar |
31 |
kt |
wt |
Ar |
33 |
kt |
wt |
Ar |
31 |
kt |
wt |
Vg |
32 |
kt |
wt |
Vg |
35 |
kt |
wt |
Vg |
37 |
kt |
wt |
Tl |
37 |
kt |
wt |
Tl |
39 |
kt |
wt |
Tl |
44 |
h |
dr |
Ar |
45 |
h |
dr |
Ar |
45 |
h |
dr |
Vg |
45 |
h |
dr |
Vg |
46 |
h |
dr |
Vg |
46 |
h |
dr |
Tl |
47 |
h |
dr |
Tl |
47 |
h |
dr |
Tl |
48 |
h |
opt |
Ar |
49 |
h |
opt |
Ar |
50 |
h |
opt |
Ar |
46 |
h |
opt |
Vg |
47 |
h |
opt |
Vg |
49 |
h |
opt |
Tl |
53 |
h |
opt |
Tl |
54 |
h |
opt |
Tl |
38 |
h |
wt |
Ar |
38 |
h |
wt |
Ar |
39 |
h |
wt |
Ar |
35 |
h |
wt |
Vg |
39 |
h |
wt |
Vg |
40 |
h |
wt |
Tl |
42 |
h |
wt |
Tl |
60 |
f |
dr |
Ar |
61 |
f |
dr |
Ar |
62 |
f |
dr |
Ar |
60 |
f |
dr |
Vg |
61 |
f |
dr |
Vg |
61 |
f |
dr |
Tl |
61 |
f |
dr |
Tl |
63 |
f |
dr |
Tl |
64 |
f |
opt |
Ar |
68 |
f |
opt |
Ar |
63 |
f |
opt |
Vg |
65 |
f |
opt |
Vg |
66 |
f |
opt |
Vg |
73 |
f |
opt |
Tl |
74 |
f |
opt |
Tl |
75 |
f |
opt |
Tl |
41 |
f |
wt |
Ar |
44 |
f |
wt |
Ar |
46 |
f |
wt |
Ar |
46 |
f |
wt |
Vg |
50 |
f |
wt |
Vg |
53 |
f |
wt |
Vg |
52 |
f |
wt |
Tl |
53 |
f |
wt |
Tl |
56 |
f |
wt |
Tl |
MANOVA
summary(aov(Ur~Op+Ms+Sp,data=kuk))
Df Sum Sq Mean Sq F value Pr(>F)
Op 2 5499 2749.5 287.36 < 2e-16 ***
Ms 2 2435 1217.4 127.23 < 2e-16 ***
Sp 2 266 132.8 13.88 9.08e-06 ***
Residuals 67 641 9.6
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Статистические выводы и интерпретация: Остаточная дисперсия составляет 9.6 от общей, а F value для всех трех факторов больше табличного, что свидетельствует о значимом влиянии всех трех факторов на урожайность кукурузы. Внесение удобрений(Op) влияет на урожайность кукурузы в большей степени, чем увлажненность почвы(Ms) и сорт(Sp) из-за самого большого значения факториальной дисперсии (2749.5), описывающей наибольшую долю влияния фактора при уровне значимости р value = 2e-16 и F value=287.36 .
summary(aov(Ur~Op*Ms*Sp,data=kuk))
Df Sum Sq Mean Sq F value Pr(>F)
Op 2 5499 2749.5 611.481 < 2e-16 ***
Ms 2 2435 1217.4 270.736 < 2e-16 ***
Sp 2 266 132.8 29.525 4.95e-09 ***
Op:Ms 4 233 58.2 12.942 3.51e-07 ***
Op:Sp 4 34 8.4 1.864 0.132532
Ms:Sp 4 109 27.3 6.070 0.000506 ***
Op:Ms:Sp 8 54 6.8 1.509 0.179880
Residuals 47 211 4.5
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Статистические выводы и интерпретация: Внесение удобрений(Op) влияет на урожайность кукурузы в большей степени, чем увлажненность почвы(Ms) и сорт(Sp) из-за самого большого значения факториальной дисперсии (2749.5), описывающей наибольшую долю влияния фактора при уровне значимости р value = 2e-16 и F value=611.481. Совместное влияние факторов условия внесения удобрений и сорта незначительно, поскольку F value =1.864 меньше табличного при уровне значимости р value=0.132532>0.01. Суммарное влияние всех трех факторов так же незначительно, поскольку F value =1.509 меньше табличного при уровне значимости р value=0.179880>0.01.
Задание 3: Регрессионный и корреляционный анализ
Зависимость температуры тела ящерицы от температуры среды:
Зависит ли температура тела ящерицы от температуры воздуха?
Выборка:
x y
r9 28 18
r10 30 24
r11 31 21
r12 31 25
r13 32 24
r14 32 25
r15 32 25
r1 33 28
r16 33 27
r17 33 29
r2 34 29
r3 34 28
r4 35 30
r5 35 31
r6 36 28
r7 37 28
r8 38 29