2.2. Методы вариационной статистики

Отдельные участки леса, состоящие из более или менее однородных объектов, находящихся в сравнительно одинаковых условиях, представляют собой совокупности, или множества. Лесная таксация довольно часто характеризует их одним числом, тесно связанным с данной совокупностью и способным в определенной степени заменить ее.

Для решения этих задач первостепенное значение имеют методы вариационной статистики.

Первый шаг на пути статистической обработки заключается в группировке собранных данных. Группировку можно проводить в упорядочный ряд, называемый вариационным рядом.

Простейшей величиной, характеризующей определенные совокупности, являются средние величины. Наиболее часто применяется средняя арифметическая. Она выражается теми же единицами измерения, что и характеризуемый ею признак и вычисляется по формуле:

х = Σx_i/ n (2.1)

Если в совокупности наблюдений отдельные варианты повторяются р раз, то средняя называется взвешенной средней, вычисляется с учетом повторяемости вариант по форме:

х = Σx_iр_i / р_i(2.2)

где х – значение вариант; р – их частота или «веса».

Наиболее подходящей мерой варьирования служит показатель, называемый дисперсией:

σ² = Σ(x_i–х)² / n - 1 (2.3)

Извлекая корень квадратный из дисперсии, получим другой показатель – среднее квадратичное отклонение.

σ=√ Σ(x_i–х)²/ n - 1 (2.4)

Среднее квадратичное отклонение величина именованная, это мешает использовать его в качестве меры сравнения вариабельности признаков. Поэтому его выражают в процентах от средней арифметической. Полученный показатель называют коэффициентом вариации и обозначают символом CV,

CV= σ/ х ∙100 % (2.5)

Чтобы получить исчерпывающую информацию о состоянии статистической совокупности, нужно учесть весь ее состав без исключения. Однако не всегда можно или нужно прибегать к сплошному обследованию. Поэтому делают выборку, исследуя ее на интересующий нас признак. Совокупность, из которой отбираются варианты, называют генеральной, ее объем обозначают N, а объем выборки - n. Характеристики генеральной совокупности – средняя величина (М), дисперсия (σ²) и среднее квадратичное отклонение (σ) – представляют собой величины постоянные. По отношению к ним соответствующие выборочные характеристики, являются величинами случайными. Возможные отклонения выборочных показателей от их параметров в генеральной совокупности, называются ошибками. Выборочные средние варьируют в √ n раз меньше, чем отдельные варианты одной и той же генеральной совокупности. Следовательно, среднее квадратичное отклонение, характеризующее варьирование выборочных средних вокруг их генеральных параметра, равняется:

σ_х= σ/√ n= √ σ²/ n (2.6)

Этот показатель называют выборочной ошибкой средних. Обозначают ее буквой m, которая сопровождается символом того показателя, к которому относится ошибка. При выборках малого объема (n<30) выборочная ошибка вычитается с учетом степеней свободы:

m_х=

√

Σ(x_i–х)²

(2.7)

√ n -1

n(n – 1)

Чтобы получить определенное представление о точности, с какой определен тот или иной средний результат, принято использовать показатель точности (Cs), определяющий по формуле:

Cs= m_x/ х ∙ 100 % = CV/ √n (2.8)

Для точного выражения зависимости между переменными величинами X и Y в математике применяется понятие функции. Оно имеет в виду случаи, когда определенному значению, которое может принять переменная величина Y , называемая аргументом, соответствует только одно значение переменной X , называемой функцией. В общем виде это записывается так: Y = f(Х). Такого рода однозначная зависимость между переменными величинами называется функциональной. Для биологических объектов зависимости, как правило, не однозначные, т.е. числовому значению одного признака соответствует не одно и то же определенное значение, а целая гамма варьирующих значений другого, связанного с ним признака. Такого рода зависимости между переменными случайными величинами X и Y , при которой каждому значению одной из них соответствует не какое-то конкретное значение, а определенная групповая величина, называется корреляционной, или просто корреляцией. Чтобы измерить степень связи между признаками X и Y , необходимо сопоставить соответствующим образом их значения друг с другом. Это делается с помощью коэффициента корреляции по формуле:

r= Σ(x_i – x)(y_i - y)/ nσ_xσ_y(2.9)

Коэффициент корреляции может принимать значения от – 1 до + 1. Когда r = 0, это означает отсутствие корреляции, а при r = 1 налицо функциональная связь между признаками. При r < 0,3 – слабая связь, при 0,3 ≤ r ≤ 0,5 – связь признается умеренной, при 0,5 ≤ r ≤ 0,7 – корреляция считается значительной, при 0,7 ≤ r ≤ 0,9 – сильная, при r > 0,9 очень сильная, близкая к функциональной.

<<< < Предыдущая 1 23 / 423 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 > Следующая >>>