Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Конспект Лекций по Таксации.doc
Скачиваний:
313
Добавлен:
05.03.2016
Размер:
748.54 Кб
Скачать

2.2. Методы вариационной статистики

Отдельные участки леса, состоящие из более или менее однородных объектов, находящихся в сравнительно одинаковых условиях, представляют собой совокупности, или множества. Лесная таксация довольно часто характеризует их одним числом, тесно связанным с данной совокупностью и способным в определенной степени заменить ее.

Для решения этих задач первостепенное значение имеют методы вариационной статистики.

Первый шаг на пути статистической обработки заключается в группировке собранных данных. Группировку можно проводить в упорядочный ряд, называемый вариационным рядом.

Простейшей величиной, характеризующей определенные совокупности, являются средние величины. Наиболее часто применяется средняя арифметическая. Она выражается теми же единицами измерения, что и характеризуемый ею признак и вычисляется по формуле:

х = Σxi / n (2.1)

Если в совокупности наблюдений отдельные варианты повторяются р раз, то средняя называется взвешенной средней, вычисляется с учетом повторяемости вариант по форме:

х = Σxiрi / рi (2.2)

где х – значение вариант; р – их частота или «веса».

Наиболее подходящей мерой варьирования служит показатель, называемый дисперсией:

σ2 = Σ(xi –х)2 / n - 1 (2.3)

Извлекая корень квадратный из дисперсии, получим другой показатель – среднее квадратичное отклонение.

σ=√ Σ(xi –х)2/ n - 1 (2.4)

Среднее квадратичное отклонение величина именованная, это мешает использовать его в качестве меры сравнения вариабельности признаков. Поэтому его выражают в процентах от средней арифметической. Полученный показатель называют коэффициентом вариации и обозначают символом CV,

CV = σ/ х ∙100 % (2.5)

Чтобы получить исчерпывающую информацию о состоянии статистической совокупности, нужно учесть весь ее состав без исключения. Однако не всегда можно или нужно прибегать к сплошному обследованию. Поэтому делают выборку, исследуя ее на интересующий нас признак. Совокупность, из которой отбираются варианты, называют генеральной, ее объем обозначают N, а объем выборки - n. Характеристики генеральной совокупности – средняя величина (М), дисперсия (σ2) и среднее квадратичное отклонение (σ) – представляют собой величины постоянные. По отношению к ним соответствующие выборочные характеристики, являются величинами случайными. Возможные отклонения выборочных показателей от их параметров в генеральной совокупности, называются ошибками. Выборочные средние варьируют в √ n раз меньше, чем отдельные варианты одной и той же генеральной совокупности. Следовательно, среднее квадратичное отклонение, характеризующее варьирование выборочных средних вокруг их генеральных параметра, равняется:

σх= σ/n= σ2/ n (2.6)

Этот показатель называют выборочной ошибкой средних. Обозначают ее буквой m, которая сопровождается символом того показателя, к которому относится ошибка. При выборках малого объема (n<30) выборочная ошибка вычитается с учетом степеней свободы:

mх=

σ

=

Σ(xi –х)2

(2.7)

n -1

n(n – 1)

Чтобы получить определенное представление о точности, с какой определен тот или иной средний результат, принято использовать показатель точности (Cs), определяющий по формуле:

Cs = mx / х ∙ 100 % = CV / n (2.8)

Для точного выражения зависимости между переменными величинами X и Y в математике применяется понятие функции. Оно имеет в виду случаи, когда определенному значению, которое может принять переменная величина Y , называемая аргументом, соответствует только одно значение переменной X , называемой функцией. В общем виде это записывается так: Y = f(Х). Такого рода однозначная зависимость между переменными величинами называется функциональной. Для биологических объектов зависимости, как правило, не однозначные, т.е. числовому значению одного признака соответствует не одно и то же определенное значение, а целая гамма варьирующих значений другого, связанного с ним признака. Такого рода зависимости между переменными случайными величинами X и Y , при которой каждому значению одной из них соответствует не какое-то конкретное значение, а определенная групповая величина, называется корреляционной, или просто корреляцией. Чтобы измерить степень связи между признаками X и Y , необходимо сопоставить соответствующим образом их значения друг с другом. Это делается с помощью коэффициента корреляции по формуле:

r = Σ(xix)(yi - y)/ nσxσy (2.9)

Коэффициент корреляции может принимать значения от – 1 до + 1. Когда r = 0, это означает отсутствие корреляции, а при r = 1 налицо функциональная связь между признаками. При r < 0,3 – слабая связь, при 0,3 ≤ r ≤ 0,5 – связь признается умеренной, при 0,5 ≤ r ≤ 0,7 – корреляция считается значительной, при 0,7 ≤ r ≤ 0,9 – сильная, при r > 0,9 очень сильная, близкая к функциональной.