Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лекции по теории статистики.doc
Скачиваний:
16
Добавлен:
24.03.2015
Размер:
661.5 Кб
Скачать

Статистическое изучение динамики социально-экономических явлений и процессов.

Понятие рядов динамики.

Статистика изучает общественные явления и процессы в непрерывном развитии во времени и этот процесс в статистике принято называть динамикой, а показатели, характеризующие это развитие - статистическими рядами динамики (ряды динамики). Статистические ряды динамики - это форма отображения развития социально-экономических явлений и процессов во времени. Составными элементами рядов динамики являются:

  • показатель времени;

  • уровень ряда.

Например:

Год (показатель времени)

1995

1996

1997

1998

1999

2000

Выпуск продукции, млн.руб. (уровень ряда)

у0

уn

Промежуточные уровни

Ряды динамики могут состоять из абсолютных и относительных величин, а также средних величин. В свою очередь каждый из них подразделяется на интервальные и моментные ряды.

Ряды динамики называются интервальными, если составляющие его уровни выражают размеры изучаемого явления за определенные периоды времени (# за месяц, за квартал, за год).

Ряды называются моментными, если составляющие его уровни выражают размеры изучаемого явления по состоянию на определенную дату (# на начало какого-либо месяца или года и т.п.).

В ряду динамики различают начальный (У0), конечный (уn) и средний уровни ряда.

Показатели ряда динамики

Показатели, характеризующие динамику какого-либо явления, подразделяются на аналитические и средние.

К аналитическим показателям относятся:

  • абсолютные приросты (цепные и базисные);

  • темпы роста (цепные и базисные);

  • темпы прироста ( цепные и базисные)

  • абсолютное содержание одного процента прироста.

К средним показателям относятся:

  • средний абсолютный прирост;

  • средний уровень ряда;

  • среднегодовой темп роста;

  • среднегодовой темп прироста.

Аналитические показатели ряда динамики.

Абсолютный прирост представляет собой разность между каждым последующим уровнем ряда и предыдущим или уровнем, принятым за базисный. В первом случае получаются цепные абсолютные приросты, во втором - базисные.

  1. Δуц = уi - yi-1

  2. Δуб = уi - y0

Между абсолютными цепными и базисными приростами существует следующая зависимость: сумма всех цепных абсолютных приростов равна последнему базисному приросту.

Темп роста. Для характеристики относительной скорости изменения уровня ряда динамики в единицу времени рассчитываются темпы роста. Темпом роста называется процентное отношение каждого последующего уровня ряда динамики к предыдущему или уровню, принятому за базу сравнения. В первом случае мы получим цепные темпы роста, во втором - базисные.

  1. Tц = yi/yi-1 * 100

  2. Tб = yi/y0* 100

yi/yi-1 и yi/y0 коэффициенты роста.

Между цепными и базисными темпами роста существует следующая зависимость: Произведение всех цепных темпов роста равно последнему базисному темпу роста. Доказательство:

Tц = yi/yi-1 * 100

Tб = yi/y0* 100

у10

у10

у21

у20

у32

у30

у43

у40

у10 * у21 * у32 * у43 = у40

у40 = у40

Эта взаимосвязь позволяет осуществлять переход от цепной системы показателей к базисной и наоборот.

Абсолютное содержание одного процента прироста. Темпы прироста определяются как разность между темпом роста и 100%.

ΔТ = Т - 100 или ΔТ = Δу/ yi-1

Абсолютное содержание 1% прироста определяется следующим образом:

  1. А% = 0,01 yi-1

  2. А% = (yi - yi-1)/ ΔТ

Эта величина определяется только по цепной системе.

Средние показатели в рядах динамики.

Средние показатели используются для общей характеристики уровня изучаемого явления за весь период.

Средний абсолютный прирост в зависимости от исходных данных рассчитывается следующим образом:

1.

2.

Средний уровень ряда динамики рассчитывается в зависимости от вида ряда динамики.

В моментном ряду динамики с равными интервалами средний уровень ряда рассчитывается по средней хронологической.

- средняя хронологическая

В интервальных рядах динамики средний уровень ряда рассчитывается по средней арифметической простой (если промежутки между датами равны) и по средней арифметической взвешенной (если промежутки между датами не равны).

а)

n – число уровней ряда

б)

уi – уровень какого-либо явления на определенную дату;

ti – длина календарного промежутка между двумя соседними датами;

Σti – длина всего изучаемого периода

Среднегодовой темп роста и прироста. Для характеристики развития какого-либо явления в целом за изучаемый период рассчитываются средние темпы роста и прироста. Средний темп роста может быть рассчитан по абсолютным уровням ряда и по темпам роста.

1.

2. - средняя геометрическая

К123, …Кn – цепные коэффициенты роста; m – число цепных коэффициентов роста

Средний темп прироста представляет собой разность между средним темпом роста и 100%.

Важнейшие приемы анализа рядов динамики

Ряды динамики и исчисляемые на их основе показатели служат для характеристики развития общественных явлений во времени. Они используются для выявления основного направления (тенденции) развития, а также для измерения сезонных колебаний. Решение этих задач в некоторых случаях требует применения специальных приемов обработки и анализа рядов динамики. Основными из них являются:

  1. Укрупнение интервалов;

  2. Механическое выравнивание рядов динамики;

  3. Аналитическое выравнивании

Способ укрупнения интервалов заключается в объединении временных интервалов , например данные по месяцам объединяются в квартальные. Этот способ применяется для анализа временных рядов, подверженных сезонным колебаниям.

Механическое выравнивание проводится с помощью скользящей средней. Суть этого метода заключается в том, что скользящая средняя образуется путем последовательного исключения начального уровня ряда и замены его очередным. Спецификой этого способа выравнивания является то, что полученные средние не дают теоретических рядов динамики, в основе которых бы лежала определенная математически выраженная зависимость.

Более совершенным примером изучения общей тенденции в рядах динамики является аналитическое выравнивание. При его использовании исходят из предположения, что изменение уровней ряда динамики может быть с той или иной степенью приближения выражено определенным математическим законом.

На основе теоретического анализа выявляется характер развития явлений во времени, и на основе этого выбирается то или иное математическое выражение типа закономерности изменения явления:

  • прямая;

  • парабола различных порядков (II, III);

  • гипербола и др. типы зависимости.

Аналитическое выравнивание в экономических исследованиях чаще всего проводится по уравнению прямой и параболе II порядка. Уравнение прямой в общем виде записывается:

где - выравнивание значения ряда динамики (теоретические уровни);

- параметры этого уравнения;

- показатель времени.

Параметры ао и а1 определяются в каждом конкретном случае на основе конкретных (эмпирических) данных ряда динамики. Для их расчета используется способ наименьших квадратов. В основе этого способа лежит следующее условие: сумма квадратов отклонений конкретных значений «у» от должна быть минимальной, т.е.

В математической статистике доказывается, что этому условию удовлетворяет определенная система уравнений называемых нормальными. Для уравнения прямой система нормальных уравнений имеет следующий вид:

где n – число уровней ряда динамики.

Эту систему уравнений можно упростить, если отсчет времени производить от какого-либо момента, условно принятого за 0. Поэтому в каждом конкретном случае всегда можно так обозначить время, чтобы Σt=0. При этом условии система нормальных уравнений примет следующий вид:

Из полученной системы уравнений легко определить параметры :

1.

2.

Подставляя в уравнение прямой количественное значение параметров , а также показатель времени t, получим сглаженные (выровненные или периодические) значения . При выборе уравнения для аналитического выравнивания необходимо учитывать особенности изменения тех конкретных показателей, данные о которых подвергаются обобщению. Уравнение прямой отражает изменение функции и применяется в тех случаях, когда скорость изменения уровня явления во времени остается в изучаемом периоде более или менее стабильной.

Например: имеются следующие условные данные о численности населения города А за 5 лет.

год

Численность населения, тыс.человек (у)

t

t2

ty

1995

72

-2

4

-144

73,0

1960

78

-1

1

-78

77,5

1997

83

0

2

0

82,0

1998

87

1

1

87

86,5

1999

90

2

4

180

91,0

410

45

410

- уравнение тренда

человек (1995г.) и т.д.

Выявленная тенденция численности населения города может быть использована для перспективных расчетов населения, например, определить численность населения города А на 3 года вперед при условии сохранения выявленной тенденции.

Год

t

2000

3

82,0+4,5*3

2001

4

82,0+4,5*4

2002

5

82,0+4,5*5

Экономические индексы

Понятие экономического индекса

Для характеристики социально- экономических явлений и процессов статистика широко применяет обобщающие показатели, такие как относительные величины, средние, показатели вариации и другие. К обобщающим показателям относятся также экономические индексы.

Слово index означает «показатель». Однако в статистике это слово приобретает специфическое значение. Индекс в статистике – это обобщающий показатель сравнения двух совокупностей, состоящих из элементов, которые нельзя непосредственно суммировать.

С такими совокупностями статистика имеет дело при изучении изменения объемов произведенной, проданной или потребленной продукции как масса материальных благ в натурально-вещественной форме. Элементами таких совокупностей являются отдельные виды продуктов (# тонны риса, железа, нефти и т.д., которые невозможно суммировать). Между тем возникает потребность определить общий объем произведенной или реализованной продукции с тем, чтобы изучить ее динамику или сравнить с производством других стран. В этих случаях на помощь приходят индексы, которые в данном случае называются индексами физического объема произведенной, проданной или потребленной продукции.

Такая же задача возникает и в том случае, если необходимо изучить динамику уровня цен на произведенную, проданную или реализованную продукцию, т.к. цены на отдельные виды товаров суммировать нельзя. В этом случае рассчитывают специальные показатели, которые носят название индексы цен. К такого рода индексам относятся:

  • индексы себестоимости продукции (промышленности, сельского хозяйства и т.д.),

  • индексы производительности труда,

  • индексы урожайности,

  • индексы заработной платы и т.д.

Во всех приведенных примерах причиной несуммарности отдельных элементов является натурально-вещественная форма отдельных видов продуктов. Однако общим для всех видов продуктов (товаров и услуг) является то, что они – продукты общественного труда. В товарном производстве это общее находит выражение в цене (стоимости) товаров. А как известно стоимость различных товаров можно суммировать. Изменение этих сумм зависит от изменения физического объема продукции и цен. Поэтому чтобы измерить, как изменится физический объем разнообразной продукции, нужно принять для сравниваемых периодов одинаковые цены. А чтобы измерить, как изменится уровень цен на эту продукцию, необходимо принять одинаковыми физический объем этой продукции. В этом заключаются специфические приемы индексного метода.

С помощью индексной теории решаются следующие задачи:

  1. дается сравнительная характеристика совокупности элементов неподдающихся непосредственному суммированию;

  2. индексы применяются для сравнения фактического состояния того или иного показателя по сравнению с планом, и в этом случае индексы выступают как показатели выполнения плана;

  3. с помощью индексов можно производить сравнение уровня производства, цен, производительности труда, урожайности и т.п. по различным территориям; В этом случае исчисленные индексы называются территориальными;

  4. индексный метод позволяет произвести оценку роли отдельных факторов в изменении сложного явления, т.е. провести факторный анализ; для этого применяется система взаимосвязанных индексов.

Классификация индексов

С точки зрения объектов исследования индексы подразделяются на индексы объемных и качественных показателей. К первой группе относятся индексы физического объема продукции промышленности и сельского хозяйства, а также других отраслей экономики оптового и розничного товара оборота, ВВП и др. Во всех этих индексах объемы в натуральном выражении оцениваются в сопоставимых или постоянных ценах. Ко второй группе относятся индексы цен, себестоимости промышленной и сельскохозяйственной продукции, производительности труда, заработной платы, покупательной способности рубля и т.д. Все эти индексы рассчитываются на базе одинаковых объемных показателей.

С точки зрения охвата элементов изучаемой совокупности различают индивидуальные, общие и групповые индексы.

Индивидуальные индексы дают сравнительную характеристику отдельных элементов совокупности.

Символика в индексной теории:

i - индивидуальный индекс

ip - индивидуальный индекс цен

iq - индивидуальный индекс физического объема какого-либо продукта

ipq - индивидуальный индекс стоимости какого-либо продукта

izq - индекс затрат на производство какого-либо продукта

it - индекс трудоемкости

I - общий индекс

Ip - общий индекс цен

Iq - общий агрегатный индекс физического объема

Ipq - общий индекс товарооборота

Iх - агрегатный индекс качественного показателя

If - общий индекс объемных показателей

Iу - общий агрегатный индекс урожайности

Iw - индекс производительности труда

P0 - цена какого-либо продукта в базисном периоде

P1 - цена того же продукта в отчетном периоде

q0 и q1 - физический объем какого-либо продукта в отчетном и базисном периоде

Σp0q0 и Σp1q1 - стоимость всей произведенной, проданной или потребленной продукции в отчетном и базисном периодах в текущих ценах этих периодов

Σp1q0 - стоимость всей произведенной, проданной или потребленной продукции в отчетном и базисном периодах в сопоставимых или неизменных ценах

z - себестоимость единицы произведенной продукции

Σz0q0 и Σz1q1 - общая сумма затрат на производство продукции в отчетном и базисном периодах

f0 и f1 - уровень оплаты труда одного рабочего или одного работника

w0 и w1 - уровень производительности труда одного рабочего или одного работника

t0 и t1 - трудоемкость изготовления единицы продукции в базисном и отчетном периодах

T - отработанное время в человеко-днях или человеко-часах или среднесписочная численность рабочих или работающих

Индивидуальный индекс - относительный показатель, который получается в результате сравнения двух одноименных абсолютных величин, характеризующих уровень изучаемого явления для двух различных периодов. Величина, которую сравнивают и которая стоит в числителе индекса, характеризует уровень явления за отчетный период. А величина, с которой производят сравнение (в знаменателе) - уровень базисного периода.

Как относительная величина индекс может быть выражен в виде коэффициента или процента. Расчет индивидуальных индексов прост и не вызывает затруднений.

  1. iq = q1 / q0

  2. ip = p1 / p0

  3. if = f1 / f0

  4. ipq = p1q1 / p0q0

  5. iz = z1 / z0

  6. iw = w1 / w0

  7. it = t1 / t0

  8. izq = z1q1 / z0q0

Взаимосвязь индексов

  1. ipq = ip * iq

  2. izq = iz * iq

  3. iq = iw * iT

Общие индексы. В экономических расчетах чаще всего используются общие или сводные индексы, которые характеризуют изменение какой-либо сложной совокупности в целом. Общие индексы рассчитываются для количественных и качественных показателей. В зависимости от цели исследования и наличия исходных данных используют различные формы построения общих индексов:

    • агрегатная;

    • средняя.

Агрегатный индекс - это сложный относительный показатель, который характеризует среднее изменение социально-экономического явления, которое состоит из несоизмеримых элементов. Эта несоизмеримость преодоляется путем включения в индекс дополнительного показателя экономически связанного с тем показателем, динамика которого изучается. В настоящее время агрегатная форма экономического индекса является наиболее распространенной. Числитель и знаменатель агрегатного индекса представляют собой сумму произведений двух величин, одна из которых изменяется (индексируемая величина), а другая остается неизменной в числителе и знаменателе (вес индекса).

Например:

Вид продукта

Продано, единиц

Цена за единицу продукции, руб.

Расчетные величины, руб.

Базисный период

Отчетный период

Базисный период

Отчетный период

q0

q1

p0

p1

p0q0

p1q1

q1 p0

А

100

120

200

150

20000

18000

24000

Б

80

100

250

320

20000

32000

25000

40000

50000

49000

1. Как изменились цены на проданную продукцию (А+Б) в отчетном

периоде по сравнению с базисным?

p1 и p0 - индексируемая величина

q1 - вес индекса

Σ p1q1 - товарооборот отчетного периода в текущих ценах

Σ p0q1 - стоимость продукции отчетного периода в ценах базисного периода

или 102%

- индексное соотношение

1,02 - индексный коэффициент

102% - индекс

Вывод: в отчетном периоде по сравнению с базисным цены на проданную продукцию увеличились в среднем на 2%.

2. Как изменился физический объем проданной продукции?

q1 и q0 - индексируемая величина

p0 - вес индекса

49000

Iq= -------------= 1,225 или 122,5%

40000

Вывод: в отчетном периоде по сравнению с базисным физический объем проданных товаров, как массы материальных благ, увеличился в среднем на 22,5%.

3. Как изменилась стоимость проданной продукции в отчетном периоде по сравнению с базисным периодом?

или 125%

Вывод: в отчетном периоде по сравнению с базисным товарооборот увеличился на 25%.

Рассчитанные индексы связаны между собой следующим образом:

Эта взаимосвязь индексов используется для расчета недостающих индексов.

1.

2.

Рассмотрим индексы в общем виде:

(качественный показатель)

(индекс объемного показателя)

Агрегатные индексы некоторых экономических показателей:

Средние индексы

Агрегатные индексы являются основной формой любого экономического индекса. Средние индексы являются производными от них и получаются путем преобразования либо числителя агрегатного индекса, либо знаменателя агрегатного индекса.

В индексах физического объема преобразуется числитель индекса путем замены q1 значением, полученным из индивидуального индекса.

iq = q1 / q0q1= iq* q0

Iq - средний арифметический взвешенный индекс

iq - индексируемая величина

- вес индекса

В индексах качественных показателей преобразуется знаменатель путем замены индексируемой величины значением, полученным из индивидуального индекса.

iр = р1 / р0 → р0= р1 / iр

Iр - средний гармонический индекс цен

Iz - средний гармонический индекс себестоимости

If - средний гармонический индекс заработной платы

Iw - средний арифметический индекс производительности труда им. академика Струмилина

Ряды индексов с постоянными и переменными весами

В тех случаях, когда необходимо определить изменение какого-либо социально-экономического явления за ряд последовательных периодов (# месяцев, кварталов, лет), используют индексы с постоянной переменной базой сравнения, т.е. базисные и цепные индексы.

Вид продукции

Выпуск продукции, шт.

Цена за единицу продукции, руб.

I кв.

II кв.

III кв.

IV кв.

I кв.

II кв.

III кв.

IV кв.

qI

qII

qIII

qIV

pI

pII

pIII

pIV

А

Б

В

Iq

базисные

Цепные

1

1

2

2

3

3

Ряд индексов физического объема является рядом индексов с постоянными весами.

Ip

базисные

Цепные

1

1

2

2

3

3

Индексы цен являются индексами с переменными весами.

Доказательство:

1.

2. В индексах качественных показателей (# индексы цен) такое доказательство невозможно.

Индексы переменного и постоянного состава. Индекс структурных сдвигов

При изучении динамики средних уровней каких-либо социально-экономических явлений используются индексы переменного состава, которые представляют собой отношение средневзвешенных уровней отчетного и базисного периодов.

Имеются следующие данные о выпуске однородной продукции и ее себестоимости по двум фирмам.

Фирма

Выпуск продукции, единиц

Себестоимость продукции, руб.

Структура выпуска продукции, %

Индексы

базисный

отчетный

базисный

отчетный

базисный

отчетный

q0

q1

z0

z1

d0=q0/∑q0*100

d1=q1/∑q1*100

iz = z1/z0

1

500

800

160

155

50

80

0,969

2

500

200

140

142

50

20

1,014

1000

1000

100

100

1. Как изменилась средняя себестоимость единицы продукции?

общий индекс себестоимости переменного состава.

Этот индекс является индексом переменного состава по двум причинам:

  1. это индекс средних уровней;

  2. На величине этого индекса отражается влияние двух факторов:

  • Изменение себестоимости единицы продукции по каждой фирме;

  • Изменение удельного веса выпуска продукции каждой фирмой в общем объеме.

или 101,6%,

т.е. в отчетном периоде по сравнению с базисным средняя себестоимость единицы продукции повысилась на 1,6: за счет изменения себестоимости единицы продукции и удельного веса выпущенной продукции каждой фирмой (структурные сдвиги).

2. Влияние первого фактора, т.е. изменения себестоимости единицы продукции изучаtтся с помощью общего индекса себестоимости продукции постоянного(фиксированного) состава, который может быть рассчитан по агрегатной форме или среднему гармоническому.

а) агрегатный индекс (индекс постоянного состава)

б) средний гармонический индекс

Разность между числителем и знаменателем этих индексов покажет размер абсолютной экономии или перерасхода затрат на производство продукции за счет изменения только себестоимости единицы продукции.

или 97,7%,

т.е. в отчетном периоде по сравнению с базисным себестоимость единицы продукции по двум фирмам в целом снизилась на 2,3% за счет изменения себестоимости единицы продукции по каждой фирме и в связи с этим достигнута экономия затрат в размере –3600 руб. (152400-156000).

3. Влияние структурного фактора на изменение средней себестоимости изучается с помощью индекса структурных сдвигов, который рассчитывается:

или

Числитель и знаменатель этой формулы представляет собой среднюю себестоимость единицы продукции в отчетном и базисном периоде.

Между , , существует взаимосвязь:

Формулы индексов переменного состава.

1. Индекс цен переменного состава:

или

2. Индекс заработной платы переменного состава:

или

- средний уровень оплаты труда за отчетный и базисный периоды

Выборочное наблюдение

Сущность и особенности выборочного наблюдения

В статистике на ряду со смешенным наблюдением широко используется не сплошное наблюдение, при котором статистическое изучение объекта производится на основе наблюдения части входящих в него единиц наблюдения. Выборочное наблюдение относится к не сплошному наблюдению. Суть его заключается в том, что обобщающие показатели (относительные, средние, вариации и другие) получаются на основе наблюдения определенной части единиц объекта, отобранных в случайном порядке. К выборочному наблюдению относится не всякое не сплошное наблюдение, а лишь такое, при котором заранее определено число единиц наблюдения и их отбор произведен в случайном порядке.

Выборочное наблюдение имеет существенные преимущества перед сплошным:

  • Обеспечивает экономию материальных трудовых ресурсов

  • Позволяет проводить наблюдение в более сжатые сроки

  • Дает возможность проводить более глубокое исследование за счет расширения программы наблюдения при относительно небольшом числе наблюдений

  • Способствует снижению ошибок регистрации по сравнению со сплошным наблюдением за счет более тщательной организации наблюдения за отобранными для обследования единицами.

На практике выборочное наблюдение используется также для решения специальных задач. Например:

  1. для выборочного обследования работников различных секторов экономики по уровню оплаты труда, по продолжительности ежегодных отпусков, потерь рабочего времени и другое.

  2. в некоторых случаях выборочное наблюдение занимает место сплошного, когда осуществляется контроль за качеством продукции. В этом случае сплошное наблюдение невозможно из-за уничтожения наблюдаемых единиц.

Выборочное наблюдение применяется также в тех случаях, когда сплошное наблюдение невозможно (# обследование бюджетов семей рабочих и служащих). Выборочное наблюдение используется иногда одновременно со сплошным (# перепись населения). В этом случае оно используется для более глубокого исследования или для контроля результатов сплошного наблюдения.

Широкое использование выборочного наблюдения в статистической практике говорит о том, что оно является важным источником статистической информации о различных сферах социально-экономической и общественной жизни страны.

Основные понятия выборочного наблюдения

Различают генеральную (N) и выборочную (n) совокупности. Генеральная совокупность - это совокупность, из которой производится отбор единиц наблюдения. Выборочная совокупность - это совокупность единиц, которая отобрана из генеральной и подвергнута наблюдению. Задача выборочного наблюдения состоит в том, чтобы на основе выборочных показателей вынести суждение о размерах соответствующих или генеральных характеристик.

В результате случайного отбора выборочные характеристики могут оказаться больше или меньше генеральных.

В связи с этим возникает вопрос о расхождении выборочной и генеральной характеристик, т.е. возникает вопрос об определении ошибки регистрации.

Ошибкой выборки (∆) называется разность между обобщающими характеристиками выборочной и генеральной совокупности. Например, ошибка выборки может быть рассчитана для средней и для доли:

Существует несколько источников образования ошибки выборки:

  1. ошибки регистрации индивидуальных величин и не сплошной характер наблюдения

  2. ошибки регистрации могут быть случайными и систематическими. Случайные ошибки регистрации - это неумышленные источники при записи признаков у наблюдаемых единиц, которые могут их преувеличивать или преуменьшать. При обобщении большого числа данных эти ошибки могут взаимно погашаться и не вызывать больших искажений обобщающих характеристик. Систематические ошибки связаны с односторонним искажением фиксируемого признака – преднамеренными или непреднамеренными. Такого рода ошибки не погашаются при расчете обобщающих характеристик, а накапливаются и приводят к существенному преувеличению или преуменьшению.

Ошибки регистрации нельзя рассматривать в качестве главного источника ошибок выборки, т.к. научная организация выборочного наблюдения предполагает правильную регистрацию размеров изучаемых признаков и входящих в выборку единиц наблюдения.

Главным источником ошибки выборки является проводимое на основе предварительного отбора не сплошное наблюдение. В связи с этим ошибки выборки называют ошибками репрезентативности. Таким образом, ошибку репрезентативности можно рассматривать как расхождение между выборочной и генеральной характеристикой в условиях точной регистрации индивидуальных значений признака по отобранным для обследования единиц. Эти ошибки свойственны только выборочному и не могут быть полностью устранены. Но могут быть сведены до незначительных размеров, если выборочное наблюдение научно организованно.

Определение средней ошибки выборки

Определение средней ошибки выборки зависит от способа отбора единиц для наблюдения. Наиболее простым способом является случайный повторный отбор. Он состоит в том, что отобранная единица наблюдения участвует в отборе столько раз, сколько единиц отбирается. В этом случае средняя ошибка выборки определяется по следующей формуле:

, где σ2 - дисперсия генеральной совокупности, п - численность выборочной совокупности

Для измерения средней ошибки доли используют следующую формулу:

, где р – доля признака генеральной совокупности.

На практике повторная выборка используется довольно редко. Чаще всего выборку организуют по схеме бесповторного отбора, при котором единица совокупности, попавшая в выборку, в дальнейшем в ней не участвует. Таким образом, при бесповторном отборе численность единиц генеральной совокупности в процессе выборки сокращается. Поэтому применительно к бесповторной выборке к приведенным ранее формулам добавляется дополнительный множитель:

, где - доля отобранных единиц в генеральной совокупности.

Приведенные формулы характеризуют величину отклонения характеристик генеральной совокупности. Например, средняя продолжительность горения лампочки по выборочным данным составило 300 часов, и при этом ошибка выборки составила 10 часов. Следовательно, продолжительность горения лампочек во всей партии, из которой взята выборка, можно ожидать в пределах 300±10 часов или от 290 до 310 часов.

То, что генеральная средняя или генеральная доля не выйдет за определенные пределы, можно утверждать не с абсолютной достоверностью, а лишь с определенной степенью вероятности. Это положение приводит к расчету предельной ошибки выборки (Δх – предельная ошибка для средней величины и Δр – предельная ошибка доли). Предельная ошибка выборки характеризует диапазон, в котором по обе стороны от выборочной доли расположатся значения генеральной средней или генеральной доли, гарантируемые с определенной степенью вероятности. Таким образом: Δ=t*μ, где t – коэффициент доверия, зависящий от вероятности, с которой можно гарантировать, что предельная ошибка не превысит t-кратную среднюю ошибку.

В статистической практике наиболее часто используются следующие значения t и Р:

Р

t

0,683

1

0,954

2

0,997

3

0,999

4

При t=1 уровень вероятности для принятия практических решений очень не велик, т.к. в этом случае полученные выводы будут достоверны лишь на 68,3%. В практике выборочного наблюдения в качестве предельной ошибки выборки обычно используют удвоенную или утроенную среднюю ошибку. Это означает, что результаты будут верны на 95,4% или 99,7%.

Например, проведена бесповторная 10-процентная выборка рабочих по различным специальностям по выполнению норм выработки с вероятностью 0,954. Определить пределы, в которых можно ожидать средний процент выполнения норм выработки всеми рабочими.

Группы рабочих по специальности

Число рабочих, f

Среднее выполнение нормы выработки, %

σ, %

Токари

40

98

2

Слесари

60

108

3

Фрезеровщики

50

104

5

150

  1. Сначала рассчитаем средний процент выполнения нормы выработки всеми рабочими, попавшими в выборку.

или 104%

  1. Рассчитаем выборочную дисперсию по следующей формуле:

  1. Определим предельную. Ошибку выборки для генеральной средней.

t=2

n=150

N=?

Т.к. выборка 10-процентная, то N=150*10=1500 человек.

Таким образом, с вероятностью 0,954 можно утверждать, что средний процент выполнения нормы выборки всеми рабочими в генеральной совокупности будет находиться в пределах:

Пределы или границы генеральной средней в общем виде записываются следующим образом:

Для нашего примера с вероятностью 0,954 средний процент выполнения норм выработки рабочими в генеральной совокупности будет находиться в пределах

Для доли запись пределов в общем виде представляется образом:

Распространение результатов выборки на генеральную совокупность

Существует два способа распространения этих результатов:

  1. Прямой пересчет полученных показателей на всю совокупность.

Например, по выборочным данным получим, что средняя урожайность зерновых составила 20 ц с 1 га, а посевная площадь 1000 га. Отсюда следует, что валовой сбор зерновых составит 20000 ц. Предельная ошибка выборки при исследовании показало возможное отклонение выборочной средней от генеральной на 1 ц. Следовательно, границы генеральной средней будут находиться в следующих пределах: , размер валового сбора с 1000 га будет составлять не менее 19000 ц, но не более 21000 ц.

  1. Данные выборочного наблюдения могут использоваться с целью уточнения результатов сплошного наблюдения. Такое уточнение проводится методом коэффициентов. Этот метод используется при уточнении данных сплошного наблюдения при переписи населения.

Определение необходимой численности выборки

При проектировании выборочного наблюдения возникает вопрос об определении необходимой численности выборки. Ее можно определить исходя из допустимой ошибки с вероятностью, которой можно гарантировать величину устанавливаемой ошибки и способа отбора.

  1. для повторного отбора

  2. для бесповторного отбора

Изучение взаимосвязи между социально-экономическими явлениями и процессами.

Задачи статистики в изучении и измерении связи между явлениями.

При анализе статистических данных, характеризующих социально-экономические явления и процессы, необходимо учитывать объективно существующие взаимосвязи и зависимости. Изолированно изучение этих явлений не может дать представление о присущих им закономерностям, о характере развития явления, о причинах и факторах, на него влияющих.

Задача статистики состоит в том, чтобы на основе всестороннего теоретического анализа скрыть и установить характер взаимосвязи, изучить конкретное проявление этих взаимосвязей и измерить тесноту связи между изучаемыми явлениями. Различают два вида связи:

  1. функциональную (полную);

  2. корреляционную (неполную).

Функциональной называют связь, при которой каждому значению факторного признака Х строго соответствует вполне определенное значение результативного признака У. Такие связи обычно встречаются в математике, физике и другие. Все другие связи, при которых нет такого строгого соответствия между значениями факторного и результативного признаков в каждом отдельном случае, называются неполными или корреляционными. При корреляционной зависимости каждому значению факторного признака Х соответствует целый ряд значений результативного признака У, и величина этих значений может колебаться иногда очень значительно. Таким образом, корреляционной называется связь, которая проявляется не в каждом отдельном случае, а лишь в среднем для совокупности явлений определенного вида.

Например, между стажем работы и уровнем производительности труда существует определенная зависимость. Однако наличие зависимости производительности труда от стажа работы можно выявить лишь в среднем при массовом наблюдении, т.к. проявление зависимости между этими признаками варьирует в силу взаимодействия многих факторов. В области социально-экономических явлений преобладают неполные корреляционные связи.

Графический метод выявления корреляционных зависимостей.

Графическое изображение данных статистического наблюдения дает наглядное представление о существующей зависимости между изучаемыми признаками. Нанося на график точки, соответствующие Х и У, мы получим корреляционное поле, где по характеру расположения точек можно судить о направлении и силе связи.

Если точки беспорядочно разбросаны по всему полю, то взаимосвязи между изучаемыми признаками нет.

Если точки концентрируются вокруг оси, идущей от нижнего левого угла в верхний правый угол, то можно говорить о наличие прямой зависимости между изучаемыми признаками, при которой с увеличением факторного признака результативный признак в среднем возрастает.

Если точки концентрируются вокруг оси, идущей от верхнего левого угла в нижний правый, то можно говорить о наличии обратной зависимости между изучаемыми признаками, при которой с увеличением факторного признака результативный признак в среднем уменьшается.

Нахождение уравнения связи.

При изучении корреляционной зависимости возникает необходимость решить два вопроса: о форме и о тесноте связи. Первый вопрос решается путем нахождения уравнения связи. Это уравнение позволит определить каким в среднем будет значение результативного признака У при том или ином значении факторного признака Х, если остальные факторы, влияющие на У и не связанные с Х, рассматривать неизменными. Взаимосвязь между результативными и факторными признаками может быть прямолинейной и криволинейной (прямая, парабола различных порядков, гипербола, экспонента и другие). Форма связи определяется на основе анализа существа явления, а также расположения на корреляционном поле. Взаимосвязь между изучаемыми признаками может быть парной и множественной. В случае парной прямолинейной формы уравнение зависимости между признаками записывается следующим образом:

, где а0 и а1 – параметры уравнения.

В этом уравнении величина результативного признака представляет собой линейную функцию только одного фактора Х. Все прочие факторы приняты постоянными и выражены параметрами а0 и а1. Таким образом, это уравнение позволяет фактические значения У заменить теоретическими значениями, вычисленными по уравнению корреляционной зависимости. Параметры а0 и а1 находят из системы нормальных уравнений, полученных по способу наименьших квадратов из условия.

условие для способа наименьших квадратов

Например, для того, чтобы найти параметры этого уравнения, рассматривают:

Выпуск продукции, единиц (у)

Расход электроэнергии кВт*ч (х)

ху

х2

у2

2

10

20

100

4

4,0

3

7

21

49

9

2,2

3

8

24

64

9

2,8

5

11

55

121

27

4,6

7

14

98

196

49

6,4

20

50

218

530

98

20

Между расходом электроэнергии и выпуском продукции существует прямая положительная зависимость.

уравнение множественной зависимости между факторами.

Измерение тесноты связи.

Основными показателями тесноты связи являются:

    • теоретическое корреляционной отношение (η), применяемое для любой формы взаимосвязи двух переменных;

    • коэффициент корреляции (r или R), который используется для прямолинейной зависимости между Х и У.

Для нашего примера , т.е. между изучаемыми признаками существует значительная зависимость, т.к. коэффициент корреляции может принимать значения от –1 до +1.

В случае обратной связи r будет отрицательным. В случае положительной связи будет положительным. В случае отсутствия – равным 0. Поэтому чем ближе r к 1, тем существеннее взаимосвязь между признаками, тем ближе корреляционная связь к функциональной.

46