Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
05а 1ч УМК Лек Задачи Ст.doc
Скачиваний:
38
Добавлен:
15.11.2019
Размер:
2.23 Mб
Скачать

6.4. Структурные средние. Квантили распределения

Мода и медиана являются обобщающими показателями центра распределения единиц статистической совокупности.

Среднеарифметические величины (простая и взвешенная) определяются с использованием всех единиц статистической совокупности и выражают основную закономерность совокупности в целом, но не позволяют характеризовать дифференцированные особенности и плотность центра распределения. Мода (Мо) является вариантой с наибольшей величиной признака ранжированного дискретного ряда распределения. Медиана (Ме) – это варианта, которая находится в середине ряда и делит численный ря на две равные части. Медиана – это серединная варианта дискретного ряда с нечетным количеством единиц ряда и средняя из 2-х серединных вариант для дискретного ряда с четным количеством единиц. Медиана интервального ряда определяется с помощью кумуляты медианного интервала, которая содержит номер медианной варианты (№ ме )

В интервальном ряду мода находится в интервале с наибольшей частотой (fмо = fmах), который называется модальным (при равной или неравной величине группового интервала игр), и определяется по формуле

Мо = ,

где: хmin Mo – величина нижней границы модального интервала.

ЗАДАЧА 6.2. Расчет моды и медианы интервального ряда.

По данным задачи 5.1 рассчитать моду интервального ряда.

№ ме = (∑fi +1) / 2 = (20 +1) / 2 = 10,5; по таблице 13.2. Sме = 18, которой соответствует 3-ий (медианный) интервал: (5-7). Медиана данного интервального ряда определится по формуле

11) Ме=xminгр млн. руб.

Вывод: ср=5.1< Ме=5.4< Мо=5.8.

Фактическая кривая распределения имеет асимметричный характер. Величина и знак асимметрии (смещения центра распределения) определяется по формуле:

As=

.Асимметрия (-) левосторонняя As < 0 (Рис. 5.3. Полигон распределения).

6.3. Квантили - структурные показатели рядов распределения.

Мода и медиана не характеризуют форму распределения и не характеризуют структуру совокупности в пределах всего размаха вариации изучаемого признака. Эти задачи решают квантили распределения, которые являются структурными показателями формы распределения в виде вариант Qij, делящих ранжированный ряд на Квj равных частей и занимающих определенное место в ряду: каждое 4-е квартили, каждое 5-е квинтили, каждое 10-е децили, каждое 100 –е перцентили и т.д. Общая формула для расчета квантилей:

,

где: х min Qij – величина нижней границы интервала искомого квантиля, который определяется по накопленной частоте - кумуляте SQij ; fQij – частота квантильного интервала; jQij – номер определяемого квантиля; икв – ширина квантильного интервала. Медиана интервального ряда рассчитывается по формуле, сходной с формулой для расчета квантилей при Квj = 2, т.е. медиана интервального ряда – это варианта, которая делит ранжированный ряд на две равные части (варианта середины ряда).

( К ЛЕКЦИИ 6) ЗАДАЧА 6.4. Расчет квартилей распределения.

Дано: По данным статистического наблюдения о периоде функционирования (хi - лет) 100 банков (n = 100) построен ранжированный интервальный ряд распределения из 8 интервалов (длина интервала ин = 1 год) (хi : 1-2; 2-3; 3-4; 4-5; 5-6; 6-7; 7-8; св. 8 лет) с соответствующим количеством (частотой - fi) банков в каждом интервале (fi: 10; 15; 21; 25; 12; 7; 5; 5 банков) и накопленной частотой (кумулятой – Si) (Si : 10; 25; 46; 71; 83; 90; 100 банков). При разделении всей совокупности банков на 4 равные части номер 3-го квартиля (Q3) равен NQ3 = [(100+1) / 4] * 3 = 75,75 ( который находится в объеме кумуляты SQ5 = 83 5-го интервала c пределами хi = 5 - 6 лет).

в = Nсп ; fi вар = fi + Кв ).

Определить: Величину 3-го квартиля.

Решение: Общая формула расчета i-го квантиля при разделении совокупности на j равных частей имеет вид:

Qij = х min Qij + ин * (∑ f i * j / к – S Qij – 1 ) / f Qij;

Q3 = х min Q3 + ин * (∑ f i * 3 /4 – S Q3 – 1 ) /fQ3) = 5 + 1 *[ (100 * 3 /4) - 71]/12 =5,3г.

Ответ: Продолжительность существования (жизненный цикл) 75% банков с момента начала их фунционирования (открытия) в среднем составляет 5,3 года.

Основные определения:

Абсолютные показатели вариации - это размах вариации, среднее линейное отклонение, среднее квадратическое отклонение и дисперсия. (Шм. с. 275)

Вариация - колеблемость, многообразие, изменяемость величины признака у отдельных единиц совокупности.

Внутригрупповая дисперсия отражает случайную вариацию, т.е. часть вариации, происходящей под влиянием неучтенных факторов и не зависящую от признака-фактора.

Децили - значения признака, делящие ранжированную совокупность на десять равных частей.

Дисперсия - средний квадрат отклонений индивидуальных значений признака от их средней величины.

Закономерности распределения - закономерности изменения час­тот в вариационных рядах.

Квартили - значения признака, делящие ранжированную совокуп­ность на четыре равновеликие части.

Коэффициент вариации - процентное отношение среднего квадратического отклонения к средней величине признака.

Коэффициент осцилляции — процентное отношение размаха вариа­ции к средней величине признака.

Кривая распределения - графическое изображение в виде непрерывной линии изменения частот в вариационном ряду, функционально связанном с изменением вариант.

Критерии согласия - особые статистические показатели, характеризующие соответствие эмпирического и теоретического распределений. Известны критерии согласия К. Пирсона, В.И. Романовского, А.Н. Колмогорова, Б. С. Ястремского.

Линейный коэффициент вариации - процентное отношение сред­него линейного отклонения к средней величине признака.

Межгрупповая дисперсия характеризует систематическую вариа­цию, т.е. различия в величине изучаемого признака, возникающие под действием признака-фактора, положенного в основу группировки.

Мода и медиана - структурные средние. Мода - значение изучаемо­го признака, повторяющееся с наибольшей частотой. Медиана - значение признака, приходящееся на середину ранжированной совокупности. Структурные средние могут быть определены по дискретным и интер­вальным рядам распределения.

Общая дисперсия измеряет вариацию признака во всей совокупнос­ти под влиянием всех факторов, обусловивших эту вариацию.

Относительные показатели вариации — это коэффициенты осцилляции, вариации, относительное линейное отклонение и др.

Перцентили - значения признака, делящие ранжированную совокуп­ность на сто равных частей.

Размах вариации - разность между наибольшим и наименьшим зна­чениями варьирующего признака.

Среднее квадратическое отклонение рассчитывается как корень квадратный из дисперсии. Среднее квадратическое отклонение, дисперсия и среднее линейное отклонение могут определяться по формулам простой и взвешенной (в зависимости от исходных данных).

Среднее линейное отклонение - средняя арифметическая из абсо­лютных значений отклонений вариант признака от их средней. (Шм.с. 276) Теоретическая кривая распределения - кривая, выражающая об­щую закономерность данного типа распределения в чистом виде, исклю­чающем влияние случайных факторов.

Эмпирический коэффициент детерминации - доля межгрупповой дисперсии в общей дисперсии.

Эмпирическое корреляционное отношение - корень квадратный из эмпирического коэффициента детерминации.

Энтропия - мера неопределенности данных наблюдения, которая может иметь различные результаты. Зависит от числа градаций признака и вероятности каждой из них.

ТЕСТЫ

1. Вариация - это:

а) изменение массовых явлений во времени;

б) изменение структуры статистической совокупности в простран­стве;

в) изменение значений признака во времени и в пространстве; г) изменение состава совокупности.