Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Теория для тестов по МС.doc
Скачиваний:
42
Добавлен:
26.05.2015
Размер:
858.11 Кб
Скачать

7.12. Обнаружение интересующего исследователя эффекта в одной или разных выборках испытуемых.

7.12.1. Биномиальный критерий m. Это самый простой из всех статистических критериев, который позволяет оценить, насколько эмпирическая частота какого-либо признака в одной выборке (от 5 до 300 наблюдений) отличается от заданной теоретической, среднестатистической и т.д. Эмпирическая частота и является эмпирическим значением биномиального критерия m, которое сравнивается с табличным для соответствующего числа наблюдений при заданной вероятности проявления интресующего исследователя эффекта.

Например, если в некотором эксперименте испытуемые решают анаграммы слов с двумя равновероятными исходами (типа ''борза'' – анаграмма слов ''образ'' и ''забор''), но, при этом, один вариант решения встречается гораздо чаще и его частота статистически отличается от теоретической, то можно предположить, что здесь проявляется эффект связанный с влиянием некоторого фактора (например, дефицита времени или опыта решения предыдущих задач).

7.12.2. -критерий Фишера с угловым преобразованием. Данный критерий является многофункциональным критерием, т.е. он применим по отношению к самым разнообразным задачам и самым различным типам данных. Он вычисляется по формуле:

,

где угол, соответствующей большей процентной доле, выраженный в радианах

–угол, соответствующей меньшей процентной доле, выраженный в радианах

n1 количество наблюдений в выборке 1

n2 количество наблюдений в выборке 2

Он имеет следующие особенности:

  1. Позволяет сравнивать две выборки или одну и ту же выборку в разных условиях по степени выраженности интересующего исследователя эффекта;

  2. Позволяет определить сдвиг значений признака под влиянием фактора;

  3. Позволяет сопоставить выборки как по качественному, так и по количественно определяемому признаку;

  4. Минимальный объем одной из выборок может быть равен 2, но максимальный – не ограничен, хотя в тех случаях когда выборки очень малы, достоверные различия обнаружить скорее всего не удастся.

Группы

Есть эффект

Нет эффекта

Количество испытуемых

Процентная д доля

Количество испытуемых

Процентная д доля

1 группа

13

54.2 %

11

45.8 %

2 группа

9

75.0 %

3

25.0 %

, n1= 12

, n2= 24

=1.242, = 1.64

Вывод: группы испытуемых не различаются достоверно по проявлению эффекта, т.к. <

Перечисленные выше статистические критерии предназначены только для сопоставления двух распределений, вне зависимости от решаемой исследователем задачи. Помимо этих критериев существует еще и те, которые позволяют сопоставлять три, четыре и большее количество распределений, а также решать более сложные задачи. Многие ответы на вопросы могут быть получены и при комбинированном применении статистических критериев, а также в совокупности с другими методами математической статистики, что, как правило, рассматривается в специальных руководствах.

7.13. Единицы измерения статистических мер. При описании результатов своих исследований любому специалисту важно понимать не только в какой шкале и в каких единицах измерялся признак, но и в каких единицах измеряются статистические меры, чтобы перевести полученные результаты с языка математической статистики на язык своей науки. Ниже приводится таблица единиц измерения описанных в пособии статистических мер.

Таблица 7.2. Единицы измерения статистических мер

Статистические меры

Единицы измерения

Среднее арифметическое

Единицы признака

Медиана

Единицы признака

Мода

Единицы признака

Квантили распределения

Единицы признака

Размах

Единицы признака

Среднее отклонение

Единицы признака

Дисперсия

Квадрат единицы признака

Стандартное отклонение

Единицы признака

Стандартная оценка

Условные единицы

Асимметрия

Условные единицы

Эксцесс

Условные единицы

Коэффициенты корреляции

Все в условных единицах

Коэффициент регрессии

Условные единицы

Статистические критерии

Все в условных единицах

Пример 25. Необходимо проверить точность работы двух агрегатов А и В по контролируемому признаку. Для этого были взяты две выборки nA=9, nB=12соответственно, по которым найдено. Требуется проверить гипотезу о том, что точность работы агрегатов одинакова, если известна, что контролируемый признак имеет нормальное распределение.

Решение: Проверку проведем по F-критерию: , здесь

m1=nA-1=9-1=8, т.к. А имеет большую дисперсию

m2=nВ-1=12-1=11. По таблице 6 приложения, находим при =0,1 Fкр=F(/2=0,05;8;11)=2,95. Т.к. Fнаб.<Fкр., то нет основания считать, что точность работы агрегатов разная.

Пример 26. Нужно проверить влияние двух различных кормовых добавок на увеличение веса свиней. Для этого 10 свиней кормили с добавкой А, а других 8 с добавкой В. По выборочным данным вычислим

Решение. Уровень значимости возьмем =0,1.

Первый этап. Проверим гипотезу о равенстве дисперсии .

Т.к. Fнаб<Fкр, то гипотезу о равенстве дисперсий принимаем.

Второй этап. Проверим гипотезу о равенстве увеличения веса для двух добавок (Н0:МХ=МУ). Используем t – критерий:

Выберем =0,05. Найдем для k=n1+n2-2=10+8-2=16 степеней свободы по таблице 5 приложения tкр=t(0,05;16)=2,12. Т.к.tнаб>tкр, то различия признаются существенными. Следовательно добавка В дает больший привес в весе.

Пример 27. Фактический сбыт в шести районах характеризуется таблицей (выборкой).

Район

1

2

3

4

5

6

Объем сбыта

90

130

110

85

75

110

Согласуются ли эти результаты с предложением о том, что сбыт продукции в этих районах одинаков?

Решение: Выберем уровень значимости =0,05. Если гипотеза Н0: сбыт одинаков - верна, то теоретически объем сбыта в 600 у.е. (90+130+110+85+75+110=600) должен распределиться одинаково по шести районам, т.е. по 100 у.е. на каждый район. Дальнейшие вычисления сведем в таблицу.

Район

1

2

3

4

5

6

90

130

110

85

75

110

100

100

100

100

100

100

100

900

100

225

625

100

1

9

1

2,25

6,25

1

20,5

Таким образом:

Т.к. мы не оценивали ни один параметр, то по числу степеней свободы k=6-1=5 и уровню значимости =0,05 по таблице 7 приложения находим , то различие в сбыте по районам признается значимым и не может быть объяснено действием случайного фактора.

Пример. Проверить гипотезу о нормальном распределении выборки:

Интервал

10-12

12-14

14-16

16-18

18-20

20-22

22-24

Частота

2

4

8

12

16

10

3

Решение: Для проверки гипотезы будем использовать критерий Пирсона. Уровень значимости выберем =0,1. Т.к. нормальное распределение определяется двумя параметрами а и 2, то оценим их по выборке, объем которой равен:

n=2+4+8+12+16+10+3=55.

Итак:

Для удобства вычисления статистики будем промежуточные результаты вносить в таблицу. Объединим крайние интервалы с соседними, так, чтобы выполнилось условие

I

II

III

IV

V

VI

интервала

Интервал

Pi

1

2

3

4

5

-;14

14;16

16;18

18;20

20;+

6

8

12

16

13

0,0959

0,1686

0,2576

0,2484

0,2295

5,274

9,273

14,168

13,662

12,623

0,010

0,175

0,332

0,400

0,011

n=55

1

0,928

Здесь Рi- вероятность того, что с.в. Х попадает в соответствующий интервал i при условии, что она имеет нормальное распределение с параметрами а=17,84; 2=8,53 (=2,92). Например, используя таблицу 4 приложения, находим:

Значения в V столбце вычисляются так:

и т.д.

Значения в VI столбце вычисляются так:

Тогда сумма VI столбца даст значение

Теперь найдем по таблице 7 приложения при уровне значимости=0,1. Т.к. после объединения интервалов у нас осталось r=5- интервалов и по выборке мы оценили два (S=2) параметра а и , то для нахождения параметр число степеней свободы будет равен k=r-s-1=5-2-1=2.

Тогда

Так как (т.е. 0,928<4,61), то гипотезу о нормальном распределении можно принять.

Пример. Построить линию регрессии в виде Можно ли использовать ее в дальнейших прогнозах?

xi

4

5

8

8

10

12

yi

0,5

4,2

12,7

13,6

19,2

24,8

Решение: Выборочное уравнение линейной регрессии Y на X имеет вид , где

-условная средняя (при фиксированным х);

-выборочные средние;

-несмещенные оценки дисперсии;

rB- выборочный коэффициент корреляции:

Приступим к вычислениям

n=6, т.к. наблюдалось 6 точек вида (xi;yi);

Sx=3 ; Sy=9,06

=40,5+54,2+812,7+813,6+1019,2+1224,8=723

rB=(723-67,8312,5)/(639,06)=0,832.

Уравнение регрессии: .

Проверим гипотезу о значимости коэффициента корреляции, т.е. H0: r=0, H1:r0.

Вычислим статистику критерия:

По уровню значимости =0,05 и числу степеней свободы k=n-2=6-2=4 из таблицы 5 приложения находим двухстороннюю критическую область tкр=2,776. Так как tнаб>tкр , то гипотезу о равенстве нулю коэффициента корреляции отвергаем, т.е. считаем, что r0.

Найдем, коэффициент детерминации

Так как R2<0,75 (0,75-шаблонное значение), то уравнением регрессии пользоваться не рекомендуется.

В дальнейшим, т.к. зависимость между X и Y существует (r0), следует либо изменить вид зависимости, либо увеличить число наблюдений и провести анализ зависимости снова.

ПРИЛОЖЕНИЕ

Вероятность того, что случайная величина попадает в интервал симметричный относительно математического ожидания вычисляется по формуле: ();,

Правило (трех сигма). Если случайная величинаX имеет нормальный закон распределения с параметрами a и , то отклонение этой величины от математического ожидания по абсолютной величине практически не превышает утроенного среднего квадратического отклонения () и вычисляется по формуле, т.е. практически все значения случайной величины попадают в интервал. Вероятность того, что значение с.в. попадают в интервал.

Доказательство: пусть . Подставим в формулу (3) вместо-..

Пусть ;.

Пусть ;.

Вероятность того, что величина не попадет в интервал будет = 0,0027.

Пример: Пусть X – нормальная распределенная случайная величина с параметрами N(20;1). Случайная величина описывает длину детали. Деталь считается стандартной, если её размеры попадают в диапазон от 19,85 до 20,15. Найти числовые характеристики, функцию плотности и функцию распределения, интервал за пределы которого практически не выйдут значения случайной величины. Вычислить процент бракованных деталей. Найти интервал изменения случайной величины, для которого вероятность равна 0,95 (т.е. ).

Функция распределения имеет вид

Вероятность того, что величина попадает в интервал от 19,85 до 20,15:

=. По таблице функции Лапласа это будет(86,64% д.ст.). Вероятность того, что д.бр.: 0,1336. Интервал за пределы которого практически не выйдут значения случайно величины определяется по правилу...

Корреляция.

Определение: корреляцией двумерной случайной величины называется величина равная отношению ковариации x,y к произведению их средних квадратических отклонений.

Свойства корреляции:

  1. если x, y – независимые случайные величины, т коэффициент корреляции равен нулю, обратное утверждение не верно, т.е. из того, что коэффициент корреляции равен нулю не следует, что x, y независимые.

Случайные величины называются не коррелированны, если их коэффициент корреляции равен нулю. Из независимости случайных величин следует их некоррелированность.

  1. если коэффициент корреляции равен единице (по модулю), то случайные величины x, y связаны между собой линейной зависимостью, т.е. или.

  2. В общем случае уравнение зависимости одной случайной величины от другой (уравнение регрессии): ;;;- это условные математические ожидания. Аналогично вводятся числовые характеристики, еслиx и y – непрерывные случайные величины.

Не все точки на прямой: