Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Учебное пособие 400172.doc
Скачиваний:
14
Добавлен:
30.04.2022
Размер:
2.04 Mб
Скачать

Задание и методика решения

Выполните статистическую обработку исходных данных, решая следующие задачи. При решении некоторых задач используются результаты решения предыдущих задач.

Задача 1. Вычисление показателей вариации

Вычислите показатели вариации по каждой из выборок X, Y, Z:

  • среднее арифметическое;

  • моду;

  • медиану;

  • размах вариации;

  • дисперсию;

  • стандартное отклонение;

  • среднее линейное отклонение;

  • коэффициент вариации.

Методика решения

Показатели вариации вычисляются следующим образом.

Среднее значение ‑ средняя арифметическая простая:

где n ‑ объем выборки.

Мода - значение признака, встречающееся чаще всего. Для нахождения моды необходимо расположить все исходные данные в порядке возрастания. Повторяющиеся значения записывают столько раз, сколько они попадаются в исходном массиве. Затем нужно выбрать значение с максимальной частотой, оно и будет модой.

Вариационный ряд может иметь несколько мод.

Медиана ‑ центральное значение упорядоченного вариационного ряда, делящего его на две равные части таким образом, что половина единиц совокупности имеет значения признака меньше, чем медиана, а половина – больше, чем медиана.

Для определения медианы используется построенный ранее ряд значений признака, отсортированных по величине.

Затем находят номер медианы:

где n – объем совокупности.

Значение признака, имеющее в упорядоченном вариационном ряду такой номер, и будет медианой:

Если совокупность содержит четное число значений варьирующего признака, то номер медианы будет дробным числом. В таком случае за медиану условно принимают среднее из двух серединных значений, так как в ряду нет члена, который делил бы совокупность на две равные по объему группы:

.

Например, если объем исследуемой совокупности n = 20, то номер медианы

Тогда медианой будет среднее из двух значений признака, стоящих в упорядоченном ряду под номерами 10 и 11:

Размах вариации ‑ разность между максимальным и минимальным значениями признака в совокупности:

.

Среднее линейное отклонение (d) является обобщающей мерой вариации индивидуальных значений признака от средней арифметической величины. Она дает абсолютную меру вариации.

Поскольку алгебраическая сумма отклонений то в расчетах данного показателя используются модули т.е. среднее линейное отклонение представляет собой среднюю из модулей отклонений индивидуальных значений признака от средней величины и определяется по формулам.

Среднее квадратическое отклонение ( ) представляет собой корень второй степени из среднего квадрата отклонений отдельных значений признака от их средней.

Формула расчета следующая:

Среднее квадратическое отклонение, как и среднее линейное отклонение, показывает, насколько в среднем отклоняются конкретные варианты признака от его среднего значения.

Квадрат среднего квадратического отклонения называется дисперсией ( ). Дисперсию используют не только для оценки вариации, но и при измерении взаимосвязей, для проверки статистических гипотез.

Она вычисляется по формуле

Рассчитать дисперсию можно также по преобразованной формуле

где ‑ средний квадрат значений признака в совокупности, ‑ квадрат среднего значения признака в совокупности:

;

При расчете дисперсии по этой формуле исключается дополнительная процедура по расчету отклонений индивидуальных значений признака от его средней величины, за счет этого уменьшается ошибка, связанная с округлением значений промежуточных вычислений.

Размах вариации, среднее линейное отклонение и среднее квадратическое отклонение являются величинами именованными, т.е. имеют ту же единицу измерения, что и изучаемый признак. Дисперсия имеет в качестве единицы измерения квадрат исходной величины.

Среднее квадратическое отклонение по величине всегда больше среднего линейного отклонения.

Соотношение зависит от наличия в совокупности резких отклонений и может служить индикатором «засоренности» совокупности нетипичными, выделяющимися из основной массы единицами, для нормального распределения это соотношение равно 1,25.

Для оценки интенсивности вариации, а также для сравнения ее величины в разных совокупностях или по разным признакам используют относительные показатели вариации, которые рассчитываются как отношение абсолютных показателей вариации к средней величине признака.

Наиболее часто на практике применяют коэффициент вариации ( ), который представляет собой относительное квадратическое отклонение:

По величине коэффициента вариации можно судить об интенсивности вариации признака, а следовательно, и об однородности состава изучаемой совокупности. Чем больше величина коэффициента вариации, тем больше разброс значений признака вокруг средней, тем больше неоднородность совокупности. Существует шкала определения степени однородности совокупности в зависимости от значений коэффициента вариации.

Коэффициент вариации (%)

Степень однородности совокупности

до 30

Однородная

30-60

Средняя

60 и более

Неоднородная

Для вычислений заполняется вспомогательная таблица:

Таблица 2

Расчет показателей вариации

1

2

n