- •Статистическая обработка выборочных данных
- •Перечень основных понятий, определений и расчётных формул
- •Теории вероятности и аналитической статистики
- •Основы теории вероятности
- •Случайное событие
- •Вероятность события
- •Случайная величина
- •Закон распределения
- •Плотность распределения (плотность вероятности)
- •Математическое ожидание (среднее, среднее значение)
- •Дисперсия (рассеяние)
- •Среднеквадратическое отклонение (стандартное отклонение)
- •Нормальное распределение (распределение Гаусса)
- •Двумерное нормальное распределение
- •Коэффициент корреляции
- •Основы аналитической статистики Единица наблюдения
- •Генеральная совокупность
- •Выборка
- •Статистика
- •Ошибка оценки
- •Выборочное среднее
- •Выборочная дисперсия
- •Выборочное среднеквадратическое отклонение
- •Выборочная среднеквадратическая ошибка
- •Выборочный коэффициент корреляции
- •Гистограмма
- •Оценка доли качественного признака и её ошибка
- •Оценка математического ожидания количественного признака и её ошибка
- •Доверительный интервал
- •Необходимый объём выборки при оценке доли качественного признака
- •Необходимый объём выборки при оценке математического ожидания количественного признака
- •Роль нормального распределения в статистике
Основы аналитической статистики Единица наблюдения
Единица наблюдения – это действительный или условный предмет, над которым производится опыт или наблюдение. В статистике рассматриваются предметы (явления), признакам (свойствам) которых присуща случайность. В результате наблюдения фиксируется значение признака.
Признаки бывают качественными и количественными.
Качественный признак – это признак каждой единицы наблюдения, значение которого выражается одной из двух (или более) условных категорий (например: «имеется» – «не имеется»).
Количественный признак – это признак каждой единицы наблюдения, значение которого которых выражается числом и единицей измерения.
Признаки рассматриваются как случайные величины, непрерывные или дискретные, принимающие в результате наблюдения одно из своих возможных значений. В частности, для описания двузначного качественного признака может использоваться дискретная случайная величина с двумя значениями: 1 («имеется») и 0 («не имеется»).
Генеральная совокупность
Генеральная совокупность – это множество всех единиц наблюдения.
Во многих случаях точная численность единиц наблюдения не определена или часть единиц наблюдения не доступна. В генеральную совокупность включаются все мыслимые единицы наблюдения. Считается, что характеристики, рассматриваемые теорией вероятности: закон распределения, плотность распределения, математическое ожидание, дисперсия и др., описывают генеральные совокупности неограниченного объёма, т.е. массовые случайные явления.
Наблюдения за единицами, входящими в генеральную совокупность, рассматриваются как независимые опыты со случайной величиной. Поэтому вероятностные характеристики единиц наблюдения, входящих в генеральную совокупность, считаются одинаковыми.
Выборка
Выборка – это часть генеральной совокупности, отобранная для наблюдения. Количество отобранных единиц наблюдения называется объёмом выборки.
Значения, полученные из наблюдений за отобранными единицами наблюдения, называются выборочными данными (иногда также выборкой). Обозначение: x1, x2, x3, …, xn .
Отбор из генеральной совокупности может быть сделан по-разному, и заранее не известно, какие единицы наблюдения попадут в выборку. Следовательно, выборочные данные случайны даже при постоянном объёме выборки.
Задача выборочного метода статистического анализа заключается в том, чтобы на основании только выборочных данных сделать определённые выводы о характеристиках всей генеральной совокупности.
Статистика
Статистика – это какая-либо функция от выборочных данных. (По стечению обстоятельств совпадает с названием науки.)
Например, статистикой является среднее арифметическое.
Поскольку выборочные данные случайны, их различные наборы, подставленные в одно и то же выражение для статистики, каждый раз будут давать несколько различные результаты. Поэтому статистика является случайной величиной. Её распределение, среднее и дисперсия отличаются от соответствующих характеристик выборочных данных, использованных при её вычислении.
Оценивание (оценка)
Оценивание – это определение приблизительного значения неизвестной вероятностной характеристики или параметра генеральной совокупности (математического ожидания, дисперсии, коэффициента корреляции и т.д.) по выборочным данным.
Процедура оценивания часто называется также как и получаемое значение: оценкой. При оценивании вычисляется определённая функция от выборочных данных (статистика).
Результат оценивания представляет собой полученное значение оценки и, обязательно, указание величины возможной ошибки.