- •Часть II. Математическая статистика Введение
- •Основные понятия Методика рациональной организации выборки большого объема
- •Нахождение точечных и интервальных статистических оценок неизвестных числовых характеристик теоретических распределений
- •Индивидуальные задания к лабораторной работе «Описательные статистики»
Нахождение точечных и интервальных статистических оценок неизвестных числовых характеристик теоретических распределений
Важнейшими числовыми характеристиками признака являются, как известно, математическое ожидание, дисперсия и среднее квадратическое отклонение (с.к.o.). Точечными статистическими оценками этих параметров служат соответственно выборочное среднее , выборочная дисперсия и исправленная выборочная дисперсия , выборочное с.к.o. и исправленное
1.00 F*(x)
0.94
0.87
0.72
0.43
0.24
0.10
0.01
x
10 20 30 40 50 60 70 80
Рис. 10.3.
выборочное с.к.o. , которые вычисляются по формулам
,
или
,
,
, ,
где – выборочные значения (варианты) признака , – частоты этих значений, – объем выборки.
Воспользовавшись перечисленными выше формулами, вычислим точечные статистические оценки генеральных параметров распределения признака , используя при этом данные из таблицы 10.2.
1.
2. Первый способ вычисления выборочной дисперсии:
3. Второй способ вычисления выборочной дисперсии:
4.
5.
Часто выборка бывает представлена несколькими группами значений признака, и для всей совокупности требуется найти выборочное среднее (общее среднее) общ.= и выборочную дисперсию (общую дисперсию) общ., используя при этом групповые средние и групповые дисперсии (здесь - номер группы). Для решения этой задачи вычисляют все , , а затем находят
1) общее среднее
2) межгрупповую дисперсию
межгр.= ,
3) внутригрупповую дисперсию
внгр.= ,
4) общую дисперсию
общ.= межгр.+ внгр.
(здесь – объем группы (не путайте с частотой выборочного значения ); – объем всей выборки; – число групп).
Пример 10.2. Пусть выборка представлена тремя последними столбцами таблицы 10.1. Найдем общее среднее и общую дисперсию этой совокупности.
Решение. Договоримся считать выбранные колонки таблицы соответственно 1-й, 2-й и 3-й группами значений некоторого признака . Тогда
Аналогично
= 48.54; = 48.36; = 221.75; = 251.79.
Тогда
межгр.=
+
внгр.=
общ.= 0.102 + 228.75 = 228.177.
При желании нетрудно убедиться в том, что подсчет и общ. дает те же результаты, если провести вычисления, предварительно объединив группы в единую совокупность объема 30.
Числовые характеристики признака принято оценивать с помощью доверительных интервалов, покрывающих эти характеристики с заданной надежностью (доверительной вероятностью).
Для нормально распределенного признака , представленного выборкой объема , доверительные интервалы, покрывающие с надежностью его неизвестные математическое ожидание и дисперсию , имеют соответственно вид
(10.1)
и
. (10.2)
Здесь значения являются критическими точками распределения . Они ищутся в зависимости от заданного уровня значимости и числа степеней свободы по таблицам приложения 4.
Величины и являются критическими точками распределения . Их находят по таблицам приложения 3 в зависимости от числа степеней свободы , а также уровней значимости и соответственно.
Пример 10.3. Пусть нормально распределенный признак представлен выборкой значений из первой колонки таблицы 10.1. Построим доверительные интервалы, покрывающие с надежностью = 0.95 математическое ожидание и дисперсию этого признака.
Решение. По заданной выборке и таблицам приложений 3 и 4 находим
Теперь, используя формулы (10.1), (10.2), после несложных вычислений делаем вывод о том, что интервалы , покрывают с надежностью параметры нормального распределения и соответственно.