- •1. Статистическое оценивание характеристик случайных величин
- •1.1. Общие сведения
- •1.2. Предварительная обработка результатов наблюдений
- •1.3. Критерий для неприятия резко выделяющихся наблюдений
- •1.4. Интервальное оценивание
- •2. Определение законов распределения случайных величин по опытным данным
- •2.1. Статистическая оценка гипотез. Уровень значимости
- •2.2. Критерии статистической оценки гипотез
- •2.3. Проверка гипотезы о нормальном распределении случайной величины
- •2.4. Проверка гипотезы о принадлежности опытных данных к показательному закону распределения
- •2.5. Проверка гипотезы о принадлежности опытных данных закону Пуассона
- •2.6. Проверка гипотезы о принадлежности опытных данных к закону Вейбулла
- •2.7. Выравнивание экспериментальных данных логарифмически нормальным законом
- •2.8. Статистическая проверка гипотезы о принадлежности опытных данных к гамма-распределению
- •2.9. Статистическая проверка гипотезы о принадлежности опытных данных к закону Эрланга
- •2.10. Блок-схема алгоритма предварительной обработки экспериментальных данных
1.3. Критерий для неприятия резко выделяющихся наблюдений
Слишком большие или слишком малые значения внутри ряда умеренно различающихся измерений при известных обстоятельствах могут не приниматься во внимание. Ошибка измерения, ошибка при оценке, ошибка в расчетах могут привести к экстремальным значениям, выбросам, которые должны быть исключены из рассматриваемой выборки.
Общее правило гласит, что одно по меньшей мере из 10 отдельных значений может быть отброшено как выброс, если оно лежит вне области ± 4S, причем среднее значение и стандартное отклонение S рассчитываются без учета этих экстремальных значений, рассматриваемых как выбросы. При объемах выборки N > 25 экстремальные значения могут быть проверены с помощью табл. 1.3 на основании статистики
, (1.10)
где xi - подозреваемый выброс.
Если статистика tоп равна или превосходит табличное значение границы tкрит (α, N), соответствующее уровню значимости α и объему выборки N, то принимается, что проверяемее экстремальное значение для данного ряда измерения является излишки и отбрасывается [8].
Покажем на примере порядок указанной проверки. Пусть в результате наблюдений было получено 11 значений случайной величины
xi = 3; 6; 8; 7; 4; 5; 3; 12; 4; 3; 7.
Значение x8 = 12 является экстремальным, оно существенно отличается от остальных.
Для решения поставленной задачи отбросим x8 = 12 и для оставшегося ряда значений вычислим числовые характеристики. Математическое ожидание
.
Исправленное среднее квадратическое отклонение
Находим величину
Согласно данным табл. 1.3 для уровня значимости α = 0,01 и объема, выборки N = 10
tкрит (0,01; 10) » 3,089.
Так как tоп = 3,5 > tкрит = 3,089, т.е. при заданном уровне значимости α = 0,01 значение x8 = 12 следует считать грубой ошибкой и, следовательно, его надо отбросить.
Таблица 1.3
Верхние границы значимости стандартизированного экстремального отклонения
N |
α = 0,05 |
α = 0,01 |
I |
1,645 |
2,326 |
2 |
1,955 |
2,575 |
3 |
2,121 |
2,712 |
4 |
2,234 |
2,806 |
5 |
2,319 |
2,877 |
6 |
2,386 |
2,934 |
8 |
2,490 |
3,022 |
10 |
2,568 |
3,089 |
15 |
2,705 |
3,207 |
20 |
2,799 |
3,289 |
30 |
2,929 |
3,402 |
50 |
3,082 |
3,539 |
100 |
3,283 |
3,716 |
2000 |
3,884 |
4,264 |
Также отметим, что для практических целей можно использовать правило трех средних квадратических отклонений, и если резко отличающиеся наблюдение лежит за пределами интервала (x - 3 S; x + 3 S), то оно должно быть исключено из вариационного ряда.
В заключении определим границы экстремальных значений для скоростей движения автомобилей в транспортном потоке. Согласно проведенным выше исследованиям были получены следующие значения математического ожидания и стандартного отклонения:
= 44,35 км/ч,
S = 8,81 км/ч.
Значение tкрит для уровня значимости α = 0,05 и объема выборки N = 100 определится следующим образом:
tкрит = 3,283 > . (1.11)
Следовательно, наблюдаемые значения скоростей должны находиться в пределах
- tкрит S < V < tкрит + tкрит S , т.е. (1.12)
44,35 - 3,283 ∙ 8,81 < V < 44,35 + 3,283 ∙ 8,81 , или
15,43 < V < 73,27.
В рассматриваемом примере Vmax = 70 км/ч, Vmin = 28 км/ч, следовательно, все зарегистрированные значения скоростей попадают в критический интервал и являются значимыми.