Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Методичка по Статистике

.pdf
Скачиваний:
53
Добавлен:
12.02.2015
Размер:
2.72 Mб
Скачать

затруднена. Несмотря на это показатель дисперсии имеет очень важное значение в статистике и в частности в факторном анализе.

Для интерпретации степени вариации значений признака извлекают арифметический квадратный корень из значения дисперсии, тем самым, по-

лучая показатель среднего квадратического отклонения , которое и от-

ражает то, на сколько в среднем индивидуальные значения признака колеблются (отклоняются) от их среднего значения.

Значение среднего квадратического отклонения имеет те же единицы измерения, что и значения признака. По этой причине для сравнения степени вариации значений разных признаков, имеющих разные единицы измерения,

этот показатель применить не получится.

Для решения подобной задачи исчисляют относительный показатель вариации коэффициент вариации.

Если коэффициент вариации:

-меньше 15%, можно судить о низкой степени вариации значений признака и высокой степени однородности совокупности его значений;

-от 15% до 33%, можно судить об умеренной (средней) степени вариации значений признака и достаточной степени однородности совокупности его значений;

-33% и более, можно судить о высокой степени вариации значений признака и неоднородности совокупности его значений.

Если выполнена аналитическая группировка совокупности единиц по какому-либо факторному признаку Х, то для оценки влияния этого фактора, определяющего колеблемость индивидуальных значений результативного признака Y, можно воспользоваться разложением дисперсии его значений на составляющие: межгрупповую и внутригрупповую дисперсии.

При дисперсионном анализе в первую очередь рассчитывают дисперсию общую, которая характеризует вариацию признака Y под влиянием всех факторов, определяющих его индивидуальные различия у единиц совокупности:

 

 

n

 

 

 

 

 

 

 

yi

 

 

0 2

 

 

 

y

 

 

 

общ2 =

i=1

 

 

 

,

(3.1)

 

 

n

 

 

 

 

 

где σобщ2

общая дисперсия значений результативного признака Y;

 

y0 общая средняя значений признака Y, вычисленная по всей сово-

купности его значений;

n – число значений признака в совокупности; yi – индивидуальные значения признака.

21

Если необходимо в составе общей дисперсии выделить ту ее часть, которая обусловлена влиянием фактора Х, положенного в основание группи-

ровки, то рассчитывают дисперсию межгрупповую (или факторную):

 

k

 

 

 

 

 

 

 

 

 

j

 

 

 

2 n j

 

y

y0

 

x2 =

j=1

 

 

,

(3.2)

 

k

 

 

 

 

n j

 

 

 

j=1

где x2 межгрупповая (факторная) дисперсия результативного признака; y j групповые средние значения Y, вычисленные по группам;

n j – число наблюдений в группах; k – число групп.

Вариацию, обусловленную влиянием прочих факторов, характеризует в каждой группе внутригрупповая дисперсия:

n j

yi y j 2

2j =

i=1

 

,

(3.3)

 

 

 

 

n j

 

где yi – индивидуальные значения признака.

По совокупности в целом из полученных внутригрупповых дисперсий рассчитывают среднюю внутригрупповую (остаточную) дисперсию:

 

 

k

 

 

 

2

 

2j

n j

 

=

j=1

 

.

(3.4)

ост

 

k

 

 

 

n j

 

j=1

По правилу сложения дисперсий общая дисперсия равна сумме межгрупповой и остаточной дисперсий:

общ2

= x2 + ост2 .

(3.5)

Если сравнение групповых средних показывает определенное различие в их уровне, то необходимо установить, является ли это различие существенным и вызвано ли оно влиянием фактора Х.

1) Формулируется проверяемая (нулевая) гипотеза Н0 о том, что различия между групповыми средними значениями результативного признака не существенны и сформировались под влиянием случайных факторов, а значит влияние факторного признака на формирование значений результативного признака не существенно по сравнению с влиянием этих факторов.

22

Для этого определяют дисперсии межгрупповую и остаточную на одну степень свободы (девиации):

 

 

2

 

2

 

 

 

dфакт

=

 

x

=

x

 

,

(3.6)

k

факт

k

1

 

 

 

 

 

 

 

 

 

 

 

 

 

где k - количество групп, полученных в результате группировки.

 

 

 

2

 

2

 

 

dост

=

 

 

ост

=

ост

,

(3.7)

 

k

 

n k

 

 

 

ост

 

 

 

 

 

 

 

 

 

где n – число значений признака в совокупности.

Полученные девиации сравнивают (большую по значению девиацию де-

лят на меньшую) и получают расчетное значение критерия (Fрасч).

По таблице F-распределения Фишера (Приложение 6) при определенном уровне значимости α (альфа) и числе степеней свободы (k1 (соответствует большей девиации) и k2 (соответствует меньшей девиации)) определяется табличное значение критерия (Fтабл).

Если Fрасч > Fтабл, то следует считать, что существенное влияние признака фактора не опровергается.

По проведенному дисперсионному анализу можно определить степень тесноты связи между признаками. Для этого рассчитываются показатели:

эмпирическое корреляционное отношение (η) и коэффициент детерминации (η2):

2

η = 2x . (3.8)

общ

Характеристика степени тесноты связи по значению величины η может быть дана на основе шкалы Чэддока (табл. 3.2).

Таблица 3.2 – Шкала Чэддока

Значения η

менее

0,1–0,3

0,3–0,5

0,5–0,7

0,7–0,9

0,9–0,99

свыше

0,1

0,99

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Характеристика

очень

слабая

уме-

замет-

тесная

весьма

функцио-

связи

слабая

ренная

ная

тесная

нальная

 

 

Эмпирический коэффициент детерминации η2 характеризует долю фак-

торной вариации в изменчивости значений результативного признака.

Если значение выражено в процентах, то оно показывает, на сколько процентов вариация значений результативного признака обусловлена влиянием фактора Х, положенного в основу группировки. Если полученное значение вычесть из 100%, то результат покажет долю совокупного влияния всех прочих факторов на вариацию значений результативного признака Y.

23

Расчетная часть

Задание 1

По исходным данным к предыдущей индивидуальной работе о предприятиях розничной торговли (Приложение 6) рассчитайте показатели вариации (размах вариации, среднее линейное отклонение, дисперсию, среднее квадратическое отклонение и коэффициент вариации) для каждого из трех признаков. Используйте несгруппированные данные, расчеты выполните в программе Excel и оформите таблично.

Задание 2

По результатам аналитических группировок, полученным в индивидуальной работе 2, выполните дисперсионный анализ для каждой группировки

вследующей последовательности:

1)Значение общей дисперсии значений результативного признака (прибыли, Y) возьмите из предыдущего задания.

2)Значение факторной (межгрупповой) дисперсии прибыли вычислите, используя значения групповых средних и общей средней, полученных в итоговой аналитической таблице в индивидуальной работе 2.

3)Для расчета значений внутригрупповых дисперсий прибыли постройте расчетную таблицу.

4)Выполните проверку правильности расчета дисперсий, используя «правило сложения дисперсий».

5)Сформулируйте проверяемую гипотезу Н0 и конкурирующую гипотезу Н1.

6)Вычислите факторную и остаточную девиации, расчетное значение F- критерия (критерия Фишера), определите табличное значение критерия Фишера по таблице (Приложение 7).

7)Сравните расчетное и табличное значения F-статистики и сделайте вывод о справедливости одной из гипотез.

8)Вычислите значения эмпирического коэффициента детерминации η2 и корреляционного отношения η. Сделайте выводы по их значениям.

Методические рекомендации

При выполнении задания 1 следует придерживаться следующей последовательности действий:

1)по каждому из трех признаков постройте расчетные таблицы (табл. 3.3-3.5) и выполните расчет показателей вариации;

2)рекомендации по оформлению расчетов: укажите применяемую фор-

мулу, поставьте знак равенства, выполните подстановку промежуточных результатов расчетов из соответствующей расчетной таблицы в эту формулу (обычно значения сумм из итоговой строки расчетной таблицы), поставьте знак равенства и запишите получаемое в результате значение показателя с указанием его единиц измерения;

Например,

24

хстаж работы 7,91(лет) ;

R xmax xmin 12,4 3,1 9,3(лет);

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

xi x

 

 

 

24,5

 

2,45 ( лет);

 

 

 

 

 

 

 

 

 

 

 

i 1

 

 

 

 

 

 

 

l

 

 

 

 

 

 

 

 

 

n

10

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

(xi x)2

 

81,769

 

 

2

 

i 1

 

 

 

8,177

;

 

 

 

10

 

 

 

 

 

 

n

 

 

 

 

 

 

2 8,177 2,860 (лет) ;

Vx 100% 2,867,91 100% 36,2% .

3)рекомендации по округлению расчетов:

-при округлении среднего значения точность результата увеличьте на один порядок по сравнению с точностью исходных значений признака;

-при расчете показателей вариации, вычисляемых через среднее значение признака, округления результатов выполняйте с точностью увеличенной на два порядка по сравнению с точностью исходных значений признака;

-значение коэффициентов принято округлять в долях единицы - до сотых и в процентном выражении - до десятых.

Таблица 3.3 – Расчет показателей вариации значений прибыли

Номер

Прибыль, млн. руб.

 

 

предприятия

 

 

 

 

 

 

 

1

 

 

 

2

 

 

 

 

 

 

30

 

 

 

Итого

 

 

 

Таблица 3.4 – Расчет показателей вариации значений (название первого факторного признака)

(Название факторного признака,

Номер единицы измерения) предприятия

1

2

30

Итого

Таблица 3.5 – Расчет показателей вариации значений (название второго

25

факторного признака)

(Название факторного признака, Номер пред- единицы измерения)

приятия

1

2

30

Итого

4)результаты расчета показателей по всем трем признакам сведите в одну таблицу (табл. 3.6);

5)сделайте выводы о характере и силе вариации значений каждого признака, о степени однородности совокупности предприятий в отношении каждого признака, выполните сравнительную оценку вариации признаков.

Таблица 3.6 – Показатели вариации значений признаков по совокупности предприятий розничной торговли

 

 

(Название

(Название

 

 

Прибыль,

первого

второго

 

 

факторного

факторного

 

 

млн. руб.

 

Показатель

признака,

признака,

 

 

 

 

(Y)

единицы

единицы

 

 

измерения)

измерения)

 

 

 

 

 

 

i)

j)

 

Размах вариации

 

 

 

 

Среднее значение

 

 

 

 

Среднее линейное отклоне-

 

 

 

 

ние

 

 

 

 

Дисперсия

 

 

 

 

Среднее квадратическое от-

 

 

 

 

клонение

 

 

 

 

Коэффициент вариации, %

 

 

 

 

При выполнении задания 2 следует придерживаться следующей после-

довательности действий:

 

 

 

 

2)выпишите из итоговой аналитической таблицы (табл. 2.3), полученной

впредыдущей индивидуальной работе, средние значения результативного

признака Y по группам ( y j ) и совокупности в целом ( y0 ), а так же значения числа наблюдений (единиц) в группах ( n j );

3) по формуле (3.2) вычислите значение межгрупповой (факторной) дис-

персии признака Y, придерживаясь рекомендаций по оформлению и округлению расчетов;

26

4) по формуле (3.3) вычислите значения внутригрупповых дисперсий для каждой группы, оформив промежуточные расчеты таблично (табл. 3.7, число интервалов может быть другим, в зависимости от того, как была выполнена группировка в предыдущей индивидуальной работе), придерживаясь реко-

мендаций по оформлению и округлению расчетов;

Таблица 3.7 – Расчет внутригрупповых дисперсий значений прибыли

Группы предприятий по (название факторного признака, единицы измерения)

 

(границы первого

 

(границы второго

 

 

 

(границы третьего

 

 

 

интервала)

 

 

 

интервала)

 

 

 

интервала)

 

 

 

 

п/п

y

i

( y

i

y )2

п/п

y

i

( y y

2

)2

п/п

y

i

( y

i

y

3

)2

 

 

 

1

 

 

i

 

 

 

 

 

 

1

 

 

 

 

 

1

 

 

 

 

 

1

 

 

 

 

 

 

 

2

 

 

 

 

 

2

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n1

 

 

 

 

 

n2

 

 

 

 

 

n3

 

 

 

 

 

 

 

Σ

 

 

 

 

 

Σ

 

 

 

 

 

Σ

 

 

 

 

 

 

 

5)вычислите по формуле (3.4) среднюю из внутригрупповых дисперсий, получив значение остаточной дисперсии признака Y, придерживаясь реко-

мендаций по оформлению и округлению расчетов;

6)проверьте правильность рассчитанных значений дисперсий, опираясь на правило сложения дисперсий (3.5): сумма факторной и остаточной дисперсий должна получиться равной значению общей дисперсии признака Y, полученному в задании 1;

7)сформулируйте проверяемую (нулевую) гипотезу Н0: различия между групповыми средними значениями (название результативного признака Y) не существенны и сформировались под влиянием случайных факторов, а значит влияние (название факторного признака Х) на формирование значений (название результативного признака Y) не существенно по сравнению с влиянием этих факторов.

8)рассчитайте девиации, пользуясь формулами (3.6) и (3.7);

9)определите расчетное значение критерия Фишера и сравните его с

табличным значением F табл= F ; k1 ; k2 (табличные значения критерия приве-

дены в Приложении 7); 10) примите решение относительно справедливости гипотезы Н0:

- если Fрасч > Fтабл, то Н0 отвергается, а значит на 5%-ном уровне значимости можно утверждать, что влияние (название факторного признака Х) на

формирование значений (название результативного признака Y) существенно по сравнению с совокупным влиянием всех прочих факторов;

- если Fрасч < Fтабл, то Н0 не отвергается, а значит на 5%-ном уровне значимости можно утверждать, что влияние (название факторного признака Х)

на формирование значений (название результативного признака Y) не существенно по сравнению с совокупным влиянием всех прочих факторов;

11) рассчитайте показатели: эмпирическое корреляционное отношение (η) и коэффициент детерминации (η2), сделайте по ним выводы.

27

Например,

 

σ x2

 

 

3905,8

 

 

 

 

η =

=

 

 

= 0,4445 0,66 .

σ 2

8785,6

 

общ

 

 

 

 

 

 

 

Связь между стажем работы и часовой выработкой рабочего заметная.

Эмпирический коэффициент детерминации η2 = 0,445, или 44,5%.

Это означает, что 44,5% вариации часовой выработки рабочих объясняется влиянием стажа работы, и 55,5% этой вариации объясняется совокупным влияние всех других факторов.

Индивидуальная работа 4 Статистическое изучение динамики социально-

экономических процессов

Теоретическая часть

Динамический ряд представляет собой ряд расположенных в хронологической последовательности числовых значений статистического показателя, характеризующих изменение общественных явлений и процессов во времени.

Всякий временной ряд включает два обязательных элемента: время (t) и конкретное значение показателя (y), или уровень ряда.

По форме представления уровней ряды динамики подразделяются на ряды абсолютных, относительных и средних величин.

По времени, отраженному в динамических рядах, ряды разделяются на моментные и интервальные.

Моментным рядом динамики называется такой ряд, уровни которого характеризуют состояние явления на определенные даты (моменты времени).

Интервальным рядом динамики называется такой ряд, уровни которого характеризуют размер явления за весь конкретный период времени (год, квартал, месяц).

Основным условием для получения правильных выводов при анализе рядов динамики является сопоставимость уровней динамического ряда между собой по территории, кругу охватываемых объектов, единицам измерения, моменту регистрации, методике расчета, ценам, достоверности.

Анализ интенсивности изменения уровней во времени осуществляет-

ся с помощью системы показателей, получаемых в результате сравнения уровней. К таким показателям относятся: абсолютный прирост, темп ро-

ста, темп прироста, абсолютное значение одного процента прироста. По-

казатели анализа динамики могут вычисляться на постоянной и переменной базах сравнения. Сравниваемый уровень называется отчетным, а уровень, с которым производится сравнение – базисным.

28

Таблица 4.1 – Формулы для расчета базисных и цепных показателей динамики

Название показателя

Вид показателя по методике расчета

 

базисный

 

цепной

 

 

 

 

 

y б y

i

y

0

yц y

i

y

i 1

 

 

 

 

 

Взаимосвязь абсолютных приростов:

сумма последовательных цепных абсолютных приростов Абсолютный прирост равна базисному, т.е. общему приросту за весь промежуток

времени

 

 

 

 

 

 

 

 

y ц

y б

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

K ц

 

 

yi

 

 

 

 

 

 

 

K

ц

 

yi

 

 

 

 

р

 

yi 1

 

 

 

 

 

 

 

р

 

 

yi 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Коэффициент роста

 

 

Взаимосвязь коэффициентов роста:

 

 

 

произведение последовательных цепных коэффициентов ро-

 

 

ста равно базисному коэффициенту роста за весь период

 

 

 

 

 

 

 

 

К ц

К б

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

р

 

 

 

р

 

 

 

 

 

 

 

 

 

 

 

T б

 

yi

100

 

 

 

 

 

 

T ц

 

 

yi

100

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Темп роста, %

 

р

 

y0

 

 

 

 

 

 

р

 

 

yi 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

T К 100

 

 

 

 

 

 

 

 

 

 

 

T б

 

yб 100

 

 

 

 

 

Т ц

 

 

yц

 

100

 

 

 

 

 

 

 

 

 

 

 

Темп прироста, %

 

 

 

y0

 

 

 

 

 

 

 

 

 

 

yi 1

 

 

 

 

 

 

 

 

 

 

 

Т Т р 100

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Абсолютное значение

 

 

 

 

 

 

 

yц

 

 

y

 

 

 

 

 

 

 

 

 

 

 

 

(содержание) одного

 

 

 

А%

 

 

i 1

0,01 y

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Т ц

 

 

 

i 1

 

 

 

 

 

 

 

процента прироста

 

 

 

 

 

 

 

100

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

yi

– уровень сравниваемого периода;

 

 

 

 

 

 

 

 

 

Основные обозначения

yi 1 – уровень предыдущего периода;

 

 

 

 

 

 

 

 

 

в формулах

y0

– уровень базисного периода;

 

 

 

 

 

 

 

 

 

 

i 1, 2, 3,...,

n – номер периода.

 

 

 

 

 

 

 

 

 

Для обобщающей характеристики динамики исследуемого явления определяются средние показатели динамического ряда. К ним относятся:

средний уровень ряда, средний абсолютный прирост, средний коэффициент роста, средний темп роста и средний темп прироста.

Для интервальных рядов динамики из абсолютных уровней средний уровень за период времени определяется по формуле средней арифметической.

29

По интервальному динамическому ряду из абсолютных величин с рав-

ными интервалами средний уровень определяется по средней арифметической простой из уровней ряда:

y

yi

 

y1 y2 y3 yn

,

(4.1)

n

 

 

 

n

 

где y уровни ряда;

n – число уровней ряда.

Средний уровень моментного ряда с равностоящими датами определя-

ется по формуле средней хронологической:

1

y y

 

... y

 

 

1

y

 

 

 

 

 

 

 

n 1

 

 

 

 

y

2

1

2

 

 

2

 

n

;

(4.2)

 

 

 

n 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

где y1 , ..., yn уровни периода; n – число уровней.

По моментному динамическому ряду с не равноотстоящими датами

времени, средний уровень определяется по формуле средней арифметиче-

ской взвешенной:

y

yi

ti

 

y1t1 y2t2

... yn tn

;

(4.3)

ti

t1 t2 ... tn

 

 

 

 

где y1 , ..., yn уровни ряда динамики, сохраняющиеся без изменения в течении промежутка времени t;

t1 ,..., tn – веса, длительность интервалов времени в течении которых уровень не изменялся.

Обобщающим показателем скорости изменения уровней во времени является средний абсолютный прирост. Он может быть рассчитан как простая средняя арифметическая по цепным абсолютным приростам:

y y n

где n – число цепных абсолютных приростов.

ц

,

(4.4)

Средний абсолютный прирост можно рассчитать и через накопленный (базисный) абсолютный прирост по следующей формуле:

 

 

yn y0

 

 

y

,

(4.5)

n 1

 

 

 

 

30