- •Фгбоу впо «Воронежский государственный технический университет» в.А. Шунина в.В. Пешков с.А. Кострюков элементы математического анализа, теории вероятности и статистики
- •Воронеж 2014
- • Шунина в.А., Пешков в.В., Кострюков с.А., 2014
- •Введение
- •1 Основhыe понятия математического анализа
- •1.1 Математика как часть общечеловеческой культуры. Основные этапы становления современной математики. Аксиоматический подход
- •Период элементарной математики
- •Период математики переменных величин
- •Период современной математики
- •1.2 Множества и подмножества. Операции над множествами. Мощность множества
- •Операции на множествах
- •Множества и отношения
- •Мощность множества
- •1.3 Множество действительных и комплексных чисел
- •1.4 Линейные пространства Rn. Векторы и операции над ними. Координаты вектора в заданном базисе
- •1.5 Понятие матрицы. Квадратные матрицы и их определители. Формулы крамера
- •Действия над матрицами
- •1.6 Топологические понятия. Последовательности. Предел и непрерывность функции
- •Арифметические свойства предела
- •1.7 Производная и дифференциал функции. Экстремум функции
- •Дифференциал
- •1.8 Первообразная, неопределенный и определенный интегралы. Формула ньютона – лейбница
- •Определенный интеграл и его свойства
- •1.9 Понятие о дифференциальных уравнениях. Задача коши
- •2 Элементарная теория вероятности
- •2.1 Предмет теории вероятности. Случайные события. Действия над случайными событиями.
- •Вероятностное пространство
- •2.2 Классическое определения вероятности. Комбинаторика
- •2.3 Статистическое определения вероятности. Частота и вероятность
- •2.4 Геометрическое определение вероятности
- •2.5 Теоремы сложения и умножения вероятностей. Условная вероятность. Независимость событий
- •Условные вероятности. Теорема умножения вероятностей (вероятность произведения событий)
- •2.6 Формула полной вероятности
- •2.7 Формула Байеса
- •2.8 Схема испытаний Бернулли
- •2.9 Понятие случайной величины. Числовые характеристики дискретных случайных величин
- •Математическое ожидание дискретной случайной величины
- •Свойства математического ожидания
- •Свойства дисперсии
- •2.10 Основные законы распределения дискретных случайных величин
- •2.11 Числовые характеристики непрерывных случайных величин
- •2.12 Основные законы распределения непрерывных случайных величин. Нормальное распределение
- •2.13 Зависимость двух случайных величин. Коэффициент корреляции
- •2.14 Предельные теоремы теории вероятностей
- •3 Основы математической статистики
- •3.1 Предмет математической статистики. Генеральная и выборочные совокупности
- •3.2 Эмпирическое распределение. Точечные оценки параметров распределения генеральной совокупности
- •3.3 Интервальные оценки. Доверительные интервалы для параметров нормального распределения
- •3.4 Проверка статистических гипотез. Проверка гипотез о законе распределения
- •4 Принципы построения математических моделей
- •5 Исследование операций и принятие решений
- •Учебное издание
- •394026 Воронеж, Московский просп., 14
3.3 Интервальные оценки. Доверительные интервалы для параметров нормального распределения
Точечные оценки параметров генеральной совокупности могут быть приняты в качестве ориентировочных, первоначальных результатов обработки выборочных данных. Их недостаток заключается в том, что неизвестно, с какой точностью оценивается параметр. Если для выборок большого объема точность обычно бывает достаточной (при условии несмещенности, эффективности и состоятельности оценок), то для выборок небольшого объема вопрос точности оценок становится очень важным.
Введем понятие интервальной оценки неизвестного параметра генеральной совокупности (или случайной величины , определенной на множестве объектов этой генеральной совокупности). Обозначим этот параметр через .
По сделанной выборке по определенным правилам найдем числа 1 и 2, так чтобы выполнялось условие:
P(1< < 2) =P((1; 2)) = .
Числа 1 и 2 называются доверительными границами, интервал (1, 2) – доверительным интервалом для параметра . Число называется доверительной вероятностью или надежностью сделанной оценки.
Сначала задается надежность. Обычно ее выбирают равной 0.95, 0.99 или 0.999. Тогда вероятность того, что интересующий нас параметр попал в интервал (1, 2) достаточно высока.
Число (1 + 2)/2 – середина доверительного интервала – будет давать значение параметра с точностью (2 – 1)/2, которая представляет собой половину длины доверительного интервала.
Границы 1 и 2 определяются из выборочных данных и являются функциями от случайных величин x1, x2, ... , xn , а следовательно – сами случайные величины.
Отсюда – доверительный интервал (1, 2) тоже случаен. Он может покрывать параметр или нет. Именно в таком смысле нужно понимать случайное событие, заключающееся в том, что доверительный интервал покрывает число .
Доверительный интервал для математического ожидания нормального распределения при известной дисперсии
Пусть случайная величина (определенная на множестве объектов генеральной совокупности) распределена по нормальному закону, для которого известна дисперсия D[] = 2 ( > 0). Из генеральной совокупности делается выборка объема n: Чтобы подчеркнуть случайный характер величин , будем рассматривать их как совокупность n независимых случайных величин, распределенных так же, как ξ:
Можно доказать, что случайная величина (выборочное среднее) также распределена по нормальному закону с математическим ожиданием M = M = a и дисперсией , т.е.
Обозначим неизвестную величину M через a и подберем по заданной надежности число Δ > 0 так, чтобы выполнялось условие:
P ( – a < Δ) = . (7)
Как известно, вероятность того, что случайная величина принимает значение в интервале (a–l, a+l), симметричном относительно центра рассеяния a, вычисляется по формуле:
Используя вышеприведенную формулу, получаем
Осталось подобрать Δ так, чтобы выполнялось равенство
Для любого [0; 1] по таблице «Значение функции Лапласа» можно найти аргумент (число t), чтобы 0(t) = /2.
Теперь из равенства определим значение Δ:
.
Окончательный результат получим, представив формулу (7) в виде:
.
Смысл последней формулы состоит в следующем: с надежностью доверительный интервал
покрывает неизвестный параметр a = M генеральной совокупности.
Можно сказать иначе: точечная оценка определяет значение параметра M с точностью и надежностью .
Пример 29. Среднее содержание вредных примесей, определенных на основании выборки, равно 18,307 мг; найти доверительный интервал для а – истинного содержания вредных примесей с надежностью (1–α)=0,95. Среднее квадратическое отклонение известно и равно σ = 0,0029 мг. Объем выборки n=5.
Решение. Учитывая, что = (1–α) = 0,95 и 0(t) = /2 = 0.475, по таблице «значение функции Лапласа» выясняем, что t=1,96. Тогда предельная погрешность интервального оценивания
Искомый доверительный интервал равен
18.307–0.0025 < а < 18.307+0.0025, или 18.3015 < а < 18.3095.
Следуя полученному результату, можно утверждать, что если будет произведено достаточно большое число выборок, то только в 5 случаях из 100 содержание вредных примесей может выйти за границы доверительного интервала.
Доверительный интервал для математического ожидания нормального распределения при неизвестной дисперсии
Пусть – случайная величина, распределенная по нормальному закону с неизвестным математическим ожиданием M (которое обозначим буквой a) и неизвестным σ. Произведем выборку объема n. Определим среднюю выборочную и исправленную выборочную дисперсию
Рассмотрим случайную величину , которая (доказывается) будет распределена по закону Стьюдента с (n – 1) степенями свободы.
Задача заключается в том, чтобы по заданной надежности и по числу степеней свободы (n – 1) найти такое число T, чтобы выполнялось равенство
или , (8)
или эквивалентное равенство
Здесь в скобках – условие того, что значение неизвестного параметра a принадлежит некоторому промежутку, который и является доверительным интервалом. Его границы зависят от надежности , а также от параметров выборки и S.
Чтобы определить значение t по величине , равенство (8) преобразуем к виду:
Теперь по таблице «Квантили распределения Стьюдента» для случайной величины t, распределенной по закону Стьюдента, по вероятности 1 – и числу степеней свободы n – 1 находим t и, следовательно, искомый доверительный интервал:
Пример 30. По условию примера 29, найти для истинного содержания вредных примесей доверительный интервал с надежностью 0,95, считая неизвестной дисперсию генеральной совокупности. Рассчитанное по выборке исправленное среднее квадратическое отклонение S = 0,0029 мг.
Решение. По таблице «Квантили t – распределения Стьюдента» определим критические точки по заданной доверительной вероятности = (1–α) = 0,95 и числу степеней свободы k = n – 1 = 5 – 1 = 4. Получим t = 2,78. Вычислим предельную погрешность интервального оценивания
Искомый доверительный интервал равен
18.307–0.0036 < а < 18.307+0.0036, или 18.3034 < а < 18.3106.
Сравнивая доверительные интервалы, накрывающие с одной и той же доверительной вероятностью 0,95 истинное содержание вредных примесей, в случае, когда генеральная дисперсия известна и когда неизвестна, видим, что во втором случае доверительный интервал получается более широкий. Однако при объеме выборки n > 30 эти отличия станут незначительными.
Доверительный интервал для дисперсии нормального распределения
Пусть случайная величина распределена по нормальному закону, для которого математическое ожидание M = a и дисперсия неизвестны. Делается выборка объема n. Из нее определяется исправленная выборочная дисперсия Вводим случайную величину , распределенную по закону 2 c (n –1) степенями свободы.
По заданной надежности можно найти сколько угодно границ 12 и 22 интервалов, таких, что
Найдем 12 и 22 из следующих условий:
(9)
(10)
В таблице «Квантили распределения » для случайной величины 2 обычно дается решение уравнения P(2 α2) = α. Из такой таблицы по заданной величине α и по числу степеней свободы n – 1 можно определить значение α2. Таким образом, сразу находится значение 22 в формуле (10).
Для определения 12 преобразуем (9):
P(2 12) = 1 – (1 – )/ 2 = (1 + )/ 2.
Полученное равенство позволяет определить по названной таблице значение 12.
Теперь, когда найдены значения 12 и 22, представим исходное равенство в виде . Или
Последнее равенство перепишем в такой форме, чтобы были определены границы доверительного интервала для неизвестной величины D
Здесь
Если математическое ожидание M = a известно, то доверительный интервал для неизвестной величины D будет иметь вид
где
Пример 31. Приняв числовые данные примера 29, найти доверительный интервал, накрывающий неизвестное среднеквадратическое отклонение σ с заданной надежностью 0,95.
Решение. По таблице «Квантили распределения » найдем значения хи-квадрат с k степенями свободы k=n–1=4. Будем иметь Тогда искомый доверительный интервал имеет вид:
, или 0,0017 < σ < 0,0084.