Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Учебное пособие 400172.doc
Скачиваний:
14
Добавлен:
30.04.2022
Размер:
2.04 Mб
Скачать

Задача 2. Построение ряда распределения

По каждой из выборок X, Y, Z:

  • проведите группировку данных по интервалам равной длины;

  • составьте вариационный ряд;

  • вычислите абсолютные, относительные и накопленные частоты;

  • постройте полигон, гистограмму и кумуляту.

Методика решения

Построение вариационного ряда (ряда распределения) – это упорядоченное распределение единиц совокупности по возрастающим или убывающим значениям признака и подсчет числа единиц с тем или иным его значением.

Для признака, имеющего непрерывное изменение, строится интервальный вариационный ряд, состоящий из двух граф (варианты и частоты). При его построении в первой графе отдельные значения признака указываются в интервалах «от - до», во второй графе – число единиц, входящих в интервал.

При группировке данных вначале выбирают число интервалов группирования и границы интервалов.

Ориентировочное число интервалов можно определить по формуле Стерджесса:

где m — число групп; Nчисло единиц совокупности.

Полученную по этой формуле величину округляют до целого большего числа, поскольку количество групп не может быть дробным числом.

При небольшом объеме информации (численности единиц совокупности) число групп может быть установлено исследователем без использования формулы Стерджесса.

При определении числа интервалов желательно избегать получения малочисленных или «пустых» групп.

Величина интервала определяется по формуле

где R – размах колебания (варьирования признака), xmax, xmin - максимальное и минимальное значения признака в совокупности; m — число групп.

Величину интервала обычно округляют до целого (всегда большего) числа, исключение составляют лишь случаи, когда изучаются малейшие колебания признака (например, при группировке деталей по величине размера отклонений от номинала, измеряемого в долях миллиметра).

Нижнюю границу первого интервала принимают равной минимальному значению признака (чаще всего его предварительно округляют до целого меньшего числа); верхняя граница первого интервала соответствует значению (xmin+i). Для последующих групп границы определяются аналогично, т.е. последовательно прибавляется величина интервала.

После формирования групп подсчитывают абсолютные частоты ‑ число «попаданий» признака в каждый интервал, т.е. число объектов в каждой группе (fi). Каждая единица совокупности xi учитывается только один раз. Если значение оказывается на границе интервала, его относят к «левому» интервалу и не учитывают в «правом» интервале. Итак, интервалы выглядят следующим образом: [20 .. 30], (30 .. 40], (40 .. 50] и [50 .. 60] (табл. 3). Здесь квадратные скобки означают включение границы в интервал; круглые скобки - игнорирование граничного значения.

Достаточно часто в ряд вводится графа, в которой подсчитываются накопленные частоты ‑ Si. Накопленные (кумулятивные) частоты показывают, сколько единиц совокупности имеют значение признака не больше, чем данное значение, и исчисляются путем последовательного прибавления к частоте первого интервала частот последующих интервалов, т.е. S1=f1,S2=S1+f2 , и т.д.

Накопленная частота последнего интервала равна общему объему совокупности – N.

Частоты ряда (fi) могут быть заменены частостями (wi) – относительными частотами. Частость определяется по формуле

Таблица 3

Группировка данных и построение вариационного ряда

xi

20 .. 30

30 .. 40

40 .. 50

50 .. 60

100

100

Если расчеты выполнены без ошибок, сумма частостей будет равна 100 %.

Замена частот частостями позволяет сопоставлять вариационные ряды с различным числом наблюдений.

Накопленная частота также может быть выражена в процентах, если для ее расчета используется не частота, а частость: S1=w1, S2=S1+w2 и т.д.

При таком варианте расчета накопленная частота последнего интервала равна 100 %.

Следующим этапом после построения вариационного ряда является его графическое изображение, которое облегчает анализ и позволяет судить о форме распределения. Для графического изображения вариационного ряда в статистике строят гистограмму, полигон и кумуляту распределения.

Гистограмма – столбиковая диаграмма, для построения которой на оси абсцисс откладывают отрезки, равные величине интервалов вариационного ряда. На отрезках строят прямоугольники, высота которых в принятом масштабе по оси ординат соответствует частотам (или частостям) (рис. 1).

Рис. 1. Гистограмма ряда распределения

Полигон частот - изображение вариационного ряда с помощью ломаной линии. Для построения полигона достаточно соединить отрезками прямых линий середины верхних сторон прямоугольников (рис.2).

Крайние точки полученного графика соединяют с точками по оси абсцисс, отстоящими в принятом масштабе на величину интервалов от середины первого и последнего интервалов.

Рис. 2. Полигон распределения

К умулята распределения строится по накопленным частотам (частостям). При построении кумуляты интервального ряда нижней границе первого интервала соответствует нулевая частота (частость), верхней – вся частота (частость) первого интервала. Верхней границе второго интервала – сумма частот (частостей) первого и второго интервалов и т.д. Верхней границе последнего интервала – сумма накопленных частот (частостей) во всех интервалах, что соответствует общей численности изучаемой совокупности или 100 % (рис. 3).

Рис. 3. Кумулята распределения