Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
stat_umk.doc
Скачиваний:
173
Добавлен:
13.03.2015
Размер:
10.64 Mб
Скачать

Глава 3. Анализ статданных.

Тема 7. Дисперсионный анализ статданных. Однофакторный дисперсионный анализ статистических данных. F- тест для для дисперсий. Компьютерные технологии анализа.

Задачей дисперсионного анализа является изучение влияния одного или не­скольких факторов на рассматриваемый признак. Факторами могут быть внеш­ние условия, влияющие на результаты эксперимента, например, температура, атмо­сферное давление, тип оборудования, качество сырья и т.д. В зависимости от количе­ства факторов, включенных в анализ, различают однофакторный анализ, двухфакторный и многофакторный анализ. Рассмотрим основы дисперсионного анализа на основе однофакторного анализа.

В тех случаях, когда есть несколько (три или более) независимых выборок, полу­ченных из одной генеральной совокупности путем изменения какого-либо независи­мого фактора, для которого по каким-либо причинам нет количественных измерений (например, этот фактор - тип упаковки), используется однофакторный дисперсион­ный анализ. Для полученных выборок предполагается, что они имеют различные выборочные средние и одинаковые выборочные дисперсии. Поэтому необходимо ответить на вопрос, оказал ли изменяемый независимый фактор существенное влияние на раз­брос выборочных средних или же разброс является следствием случайностей, вы­званных небольшими объемами выборок. Другими словами, если выборки принад­лежат одной и той же генеральной совокупности, то разброс данных между выбор­ками (между группами) должен быть не больше, чем разброс данных внутри этих выборок (внутри групп).

Для сравнения средних значений нескольких выборок строится F-статистика. Ну­левая гипотеза записывается следующим образом:

,

где - среднееi-й группы.

Проверить гипотезу о равенстве средних значений выборок можно, следуя пред­ставленным ниже требованиям при каждом уровне фактора:

- наблюдения независимы и проводятся в одинаковых условиях;

- все совокупности нормально распределены;

- дисперсии всех совокупностей равны.

Пусть - i-й элемент ( ) k-й выборки (k),где т - число выборок и nk -число данных в k-й выборке. Тогда - выборочное среднее k-й выборки - определяется по формуле:

Общее среднее вычисляется по формуле:

, где .

Основное тождество дисперсионного анализа имеет следующий вид:

Q= Q1+ Q2 ,

где Q1- сумма квадратов отклонений выборочных средних от общего среднего (сумма квадратов отклонений между группами); Q2 - сумма квадратов отклонений наблюдаемых значений xik от выборочного среднего (сумма квадратов отклонений внутри групп); Q - общая сумма квадратов отклонений наблюдаемых значений xik от общего среднего .

Расчет этих сумм квадратов отклонений осуществляется по следующим формулам:

,

В качестве статистического критерия необходимо воспользоваться критерием Фишера:

F=.

Если расчетное значение критерия Фишера будет меньше табличного значения F < нулевая гипотеза принимается и нет оснований считать, что независи­мый фактор оказывает влияние на разброс средних значений В противном случае не­зависимый фактор оказывает существенное влияние на разброс средних значений и нулевая гипотеза отвергается (здесь - уровень значимости или уровень риска, обычно длябольшинства задач принимается = 0,05).

В зависимости от структуры статистических данных и целей анализа возможны следующие варианты, например, двухфакторный дисперсионный анализ без повторений, двухфакторный дисперсионный анализ с повторениями, двухвыборочный F-тест для дисперсий.

В MS Excel и других статистических пакетах имеются специальные функции и процедуры для реализации рассмотренных процедур дисперсионного анализа.

Литература:

1осн. [231-267], 4доп. [114-126], 6доп. [197-200].

Контрольные вопросы

1. Каковы основные статистические задачи дисперсионного анализа статданных?

2. Как вычисляется F-статистика ?

3. Какова в общем случае ну­левая гипотеза в задачах дисперсионного анализа?

4. Каковы возможные требования к выборочным данным при проверке гипотезы о равенстве средних значений выборок?

5. Что отражает основное тождество дисперсионного анализа?

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]