- •Статистическая обработка выборочных данных
- •Перечень основных понятий, определений и расчётных формул
- •Теории вероятности и аналитической статистики
- •Основы теории вероятности
- •Случайное событие
- •Вероятность события
- •Случайная величина
- •Закон распределения
- •Плотность распределения (плотность вероятности)
- •Математическое ожидание (среднее, среднее значение)
- •Дисперсия (рассеяние)
- •Среднеквадратическое отклонение (стандартное отклонение)
- •Нормальное распределение (распределение Гаусса)
- •Двумерное нормальное распределение
- •Коэффициент корреляции
- •Основы аналитической статистики Единица наблюдения
- •Генеральная совокупность
- •Выборка
- •Статистика
- •Ошибка оценки
- •Выборочное среднее
- •Выборочная дисперсия
- •Выборочное среднеквадратическое отклонение
- •Выборочная среднеквадратическая ошибка
- •Выборочный коэффициент корреляции
- •Гистограмма
- •Оценка доли качественного признака и её ошибка
- •Оценка математического ожидания количественного признака и её ошибка
- •Доверительный интервал
- •Необходимый объём выборки при оценке доли качественного признака
- •Необходимый объём выборки при оценке математического ожидания количественного признака
- •Роль нормального распределения в статистике
Ошибка оценки
Ошибка оценки – это отклонение полученной оценки от неизвестного значения оцениваемой вероятностной характеристики случайной величины.
Ошибка оценки сама по себе является случайной величиной. Она имеет нулевое математическое ожидание (предполагается, что смещение оценки отсутствует) и некоторую ненулевую дисперсию n2, величина которой зависит от объёма выборки n. Чем больше объём выборки n, тем меньше дисперсия n2 и тем точнее оценка.
Обычно для характеристики ошибки оценки используется корень квадратный из дисперсии оценки n2, и эта величина n носит название среднеквадратической ошибки.
Поскольку среднеквадратическая ошибка оценки n заранее не известна, она также подлежит оцениванию. Её оценка обозначается добавлением «крышечки»: .
Выборочное среднее
Выборочное среднее – это оценка неизвестного значения математического ожидания случайной величины по выборочным данным.
Вычисляется по формуле среднего арифметического:
= (x1 + x2 + … + xn) / n = , гдеn – объём выборки.
С ростом объёма выборки возможное отклонение выборочного среднего от оцениваемого неизвестного математического ожидания случайной величины M(X) уменьшается.
Выборочная дисперсия
Выборочная дисперсия – это оценка неизвестного значения дисперсии наблюдаемой в опыте случайной величины.
Вычисляется по формуле среднего арифметического, в которой выборочные значения заменены квадратами отклонений выборочных значений от математического ожидания. Как правило, математическое ожидание генеральной совокупности неизвестно, поэтому оно без большой ошибки заменяется его оценкой, т.е. выборочным средним.
Таким образом, выборочная дисперсия – это средний квадрат отклонения выборочных значений от выборочного среднего.
Формула для вычисления выборочной дисперсии такова:
s2 = ( (x1 – )2 + (x2 – )2 + … + (xn – )2 ) / n = .
С ростом объёма выборки n возможное отклонение выборочной дисперсии s2 от оцениваемой неизвестной дисперсии случайной величины D(X) уменьшается.
Выборочное среднеквадратическое отклонение
Выборочное среднеквадратическое отклонение – это оценка неизвестного значения среднеквадратического отклонения (стандартного отклонения) наблюдаемой в опыте случайной величины.
Вычисляется как квадратный корень из выборочной дисперсии s2.
Буквенное обозначение: s .
С ростом объёма выборки n возможное отклонение выборочного среднеквадратического отклонения s от оцениваемого среднеквадратического отклонения случайной величины уменьшается.
Выборочная среднеквадратическая ошибка
Выборочная среднеквадратическая ошибка – это вычисленное по выборке отклонение полученной оценки от неизвестного значения оцениваемой вероятностной характеристики случайной величины.
Вычисляется как квадратный корень из выборочной дисперсии оценки n2.
Буквенное обозначение: .
С ростом объёма выборки n возможное значение выборочной среднеквадратической ошибки уменьшается, изменяясь обратно пропорционально.
Выборочный коэффициент корреляции
Выборочный коэффициент корреляции – это оценка неизвестного значения коэффициента корреляции наблюдаемых случайных величин X и Y по парам выборочных данных (x1, y1), (x2, y2), …, (xn, yn). Буквенное обозначение: r .
Выборочный коэффициент корреляции показывает степень тесноты статистической связи между отклонениями выборочных значений двух наблюдаемых в опыте случайных величин X и Y от своих математических ожиданий M(X) и M(Y), или, если они не известны, от выборочных средних и .
Формула для выборочного коэффициента корреляции такова:
r = =.
С ростом объёма выборки n возможное отклонение выборочного коэффициента корреляции r от оцениваемого неизвестного коэффициента корреляции пары случайных величин уменьшается.