- •1.1. Моделирование геологических процессов и явлений
- •1.2. Характер геологической информации
- •1.3. Понятие о геолого-математическом моделировании
- •1.4. Принципы и методы геолого-математического моделирования
- •2. ОДНОМЕРНЫЕ СТАТИСТИЧЕСКИЕ МОДЕЛИ
- •2.1. Сущность и условия применения
- •2.2. Статистические характеристики, используемые в геологии
- •2.3. Точечные и интервальные оценки свойств геологических объектов
- •2.4. Основные статистические законы распределения, используемые в геологии
- •2.5. Статистическая проверка геологических гипотез
- •2.7. Проверка гипотез о равенстве дисперсий
- •2.8. Анализ однородности выборочных геологических совокупностей
- •2.9. Однофакторный и двухфакторный дисперсионный анализ
- •3. МНОГОМЕРНЫЕ СТАТИСТИЧЕСКИЕ МОДЕЛИ
- •3.2. Многомерный корреляционный анализ
- •3.3. Статистические методы выделения ассоциаций химических элементов
- •3.4. Кластер-анализ (дендрограммы и дендрографы)
- •3.6. Задачи распознавания образов в геологии
- •3.8. Оценка информативности геологических признаков
- •3.9. Линейные дискриминантные функции
- •3.10. Метод главных компонент
- •4. МОДЕЛИРОВАНИЕ ПРОСТРАНСТВЕННЫХ ПЕРЕМЕННЫХ
- •4.2. Элементы неоднородности, изменчивость и анизотропия гелогических полей
- •4.4. Фон, аномалии и поверхность тренда
- •4.5. Геометрические методы выявления закономерных составляющих признаков
- •4.6. Способы сглаживания случайных полей
- •4.7. Анализ карт
- •4.8. Метод ближайшего соседа
- •4.9. Поверхности тренда
- •4.10. Сравнение карт
- •4.15. Моделирование дискретных случайных полей
- •5.1. Принципы моделирования свойств геологических объектов
- •5.3. Использование автокорреляционных функций для решения геологических задач
- •6. ФАКТОРЫ, ОПРЕДЕЛЯЮЩИЕ ВЫБОР И ЭФФЕКТИВНОСТЬ ИСПОЛЬЗОВАНИЯ МАТЕМАТИЧЕСКИХ МЕТОДОВ
- •6.4. Роль геологического анализа при выборе геолого математической модели
- •7. ПРИМЕНЕНИЕ ЭВМ В ГЕОЛОГИИ
- •7.1. Автоматизация первичной обработки данных
- •7.2. Решение геологических задач с помощью ЭВМ
- •7.3. Автоматизированные системы обработки геологических данных
- •СПИСОК РЕКОМЕНДУЕМОЙ ЛИТЕРАТУРЫ
2.9.Однофакторный и двухфакторный дисперсионный анализ
вгеологии
Свойства геологических объектов, как и любой другой сложной природной системы, обычно зависят от ряда факторов, обусловли вающих их изменчивость. Выявление этих факторов и оценка сте пени их влияния на изменчивость (неоднородность) свойств изу чаемых объектов осуществляется с помощью дисперсионного ана лиза.
Этот статистический метод основан на следующем принципе: если на случайную величину действуют взаимонезависимые факто ры А, В, ..., Д то общую дисперсию этой случайной величины а 2 можно рассматривать как сумму дисперсий а 2 = а 2 + а 2в +
По количеству оцениваемых факторов дисперсионный анализ подразделяется на одно-, двух- и многофакторный.
Каждый фактор представляет собой переменную дискретную или непрерывную величину, которая разделяется на определенное количество постоянных интервалов (уровней). Если количество за меров изучаемой случайной величины на всех уровнях по всем фак торам одинаковое, дисперсионный анализ принято называть равно мерным, а если разное - неравномерным.
Суждение о влиянии определенного фактора или комбинации факторов на изменчивость изучаемой случайной величины основа но на группировке ее замеров по факторам и их уровням и проверке гипотезы о равенстве дисперсий, обусловленных данными факто рами, с остаточной (случайной) дисперсией, вызванной неучтенны ми факторами. Если гипотеза отвергается, то делается вывод о том, что данный фактор или взаимодействие факторов оказывают суще ственное влияние на изменение изучаемого свойства геологическо го объекта.
С помощью дисперсионного анализа решается широкий круг геологических задач:
-проверяются гипотезы о влиянии литологических, петрофи зических, геохимических, структурных и других факторов на лока лизацию оруденения;
-выявляются элементы зональности различных геологических
объектов;
-определяется влияние способа отбора проб на их достовер ность и представительность;
-оценивается влияние ландшафтных условий на интенсив ность проявления различных поисковых признаков;
-решается вопрос о влиянии гипергенных процессов на каче
ство руд; - выявляются факторы, определяющие прочностные свойства
грунтов и пород и т. д.
При равномерном однофакторном дисперсионном анализе слу чайной величины х относительно фактора А, имеющего к уровней при количестве замеров на каждом уровне, равном л, результаты наблюдений обозначаются как x,j, где i - номер наблюдения (i = 1, 2 ,
..., л), a j - номер уровня фактора (/' = 1, 2 , ..., к), |
и записываются |
|||
в виде табл. 4. |
|
|
Таблица 4 |
|
|
|
|
||
Однофакторный дисперсионный анализ |
||||
Номер изменения |
|
Уровень фактора |
|
|
Ах |
А г |
A k |
||
1 |
||||
*11 |
*12 |
*1* |
||
2 |
*21 |
*22 |
*2* |
|
п |
*л1 |
*п2 |
Хпк |
|
Групповые средние |
*\ |
|
** |
По этим данным рассчитываются следующие статистики:
1) общая сумма квадратов отклонений наблюдаемых значений признака от общей средней:
с обШ= £ Х ( * о = *)1’
j =I <=i
2 ) факторная сумма квадратов отклонений групповых средних от общей средней, характеризующая рассеяние между группами:
к
СфЛКГ= п ^ ( х ( - х ) 2;
У = 1
3 ) |
остаточная сумма квадратов отклонений наблюдаемых зн |
|||
чений от своей групповой средней, характеризующая рассеяние |
||||
внутри групп: |
|
|
|
|
|
И |
П |
п |
~ Хк)> |
|
Сост = £ (* ,,-* > ) |
■*" |
С*/2 “ *2 ) ••• |
|
|
/=1 |
/=1 |
/=1 |
|
4) |
общая, факторная и остаточная дисперсии: |
|
||
|
|
V2 |
=- •"общ |
|
|
|
о6щ |
к ( п - \ ) ’ |
|
|
|
пт2 |
с |
|
|
|
_ __факт_. |
|
|
|
|
факт~ ( * - 1) ’ |
|
|
|
|
о 2 _ |
^ о ст |
|
|
|
ост |
* (и - 1) ’ |
|
5) |
значение критерия Фишера: |
|
F =
Значение критерия Фишера сравнивается с критическим значе нием для заданного уровня значимости а и числа степеней свободы
(к - 1) и к ( п - 1).
При неравномерном однофакторном дисперсионном анализе, когда количество наблюдений на уровне А\ равно п\, на уровне Л2 -
|
|
к |
п2, ..., на уровне Ак - и*, а общее их число N= У я , факторная и |
||
|
|
/=1 |
остаточная дисперсии находятся по формулам |
||
|
_ 82,35 |
1,92; |
|
х =------- |
|
|
43 |
|
V2 - 6,70 + 3,61 + 4,26 |
14,57 |
|
°о6щ - |
42 |
= 0,347 ; |
|
42 |
с 2 15(1,51 - 1,92)2 +14(1,99 -1,92)2 +14(2,27 -1,92)2
факт - |
« |
|
2,52 + 0,07 + 1,72 4,31 = 2,155 |
4040
£k = i L 5 i = 8 ,45.
S l 0.255
При (,= £ -1 = 2, ( 2= N —k = 40 и а = 0,05 FKp = 3,24, а при а = 0,01 Ftp = 5,18.
Остальные операции выполняются так же, как при равномер ном анализе.
Пример. При изучении гидротермального свинцово-цинкового месторождения в гранитах высказано предположение, что на ин тенсивность процесса рудоотложения влияла степень предрудного метасоматического изменения пород. Для проверки этой гипотезы результаты опробования на свинец по 43 разведочным пересечени ям были разделены на три группы: в слабо измененных (уровень Ai), в средне измененных (уровень Аг) и сильно измененных (уровень AjJ гранитах.
Таким образом, с достаточно высокой доверительной вероят ностью гипотеза об отсутствии влияния степени метасоматиче ского изменения гранитов на содержание свинца в руде отвергает ся, и предрудный метасоматоз должен рассматриваться как один из ведущих рудоконтролирующих факторов.
Вычислительные операции при однофакторном дисперсионном анализе можно упростить, используя равенство Сост = СобщСфакт.
При двухфакторном дисперсионном анализе сумма квадратов отклонений от общего среднего разделяется на компоненты, отве чающие двум предполагаемым факторам изменчивости - А и В. Ес ли по фактору А выделяется р уровней, а по фактору В - q уровней, то общее количество групп будет равно т =pq, а исходные данные можно записать в виде табл. 5.
|
|
|
|
|
Таблица 5 |
|
Двухфакторный дисперсионный анализ |
|
|||
|
Уровень фактора В |
Среднее |
|||
Номер изменения |
В2 |
... В/ |
... в ч |
||
|
Вх |
|
|||
А, |
*11 |
*12 |
ХУ |
*2V |
|
А г |
*21 |
*22 |
ХУ |
*2q |
*2 |
А, |
*/1 */2 |
x p j |
* /< 7 |
Ар |
*р1 |
*р2 |
x p j |
x p q |
* P |
Среднее |
*1 |
*2 |
* j |
|
X |
|
|
|
|
|
Если для каждого сочетания факторов A,Bj произведено по и наблюдений (двухфакторный дисперсионный анализ с повторени ем), то в каждую клетку табл. 23 помещается п значений, а единич ное наблюдение обозначается как xjjk, где к - 1, 2, ..., п. Оценки средних значений по группам (ху), по факторам (х ,... и Ху) и об щее среднее ( х ) в этом случае рассчитываются по формулам
х |
|
|
1 |
Ч П |
1 Ч |
f<-=— |
у=1 к=1 |
Ч j=\ |
Чп |
1 Р п |
1 Р |
* . j . =--ZZxv*— Ь г |
|
Рп м м |
Р м |
Проверка гипотезы о влиянии на изменчивость изучаемого свойства каждого фактора в отдельности и их совместного влияния производится по критерию Фишера:
Ч2 S2
s;
Полученные значения F-критерия сравниваются с критическим для заданного уровня значимости и числа степеней свободы.
При расчете F-критерия в данном случае в знаменателе всегда берется остаточная дисперсия. Поэтому его значение иногда может получаться меньше 1.
Приведенные схемы дисперсионного анализа основаны на свойствах нормального закона распределения и предположении о равенстве дисперсий на разных уровнях одного и того же фактора. Однако F-критерий по выборкам достаточно большого объема ус тойчив и для совокупностей, умеренно отклоняющихся от нормаль ных. Умеренное различие в дисперсиях также не является препятст вием для его применения при условии приблизительного равенства объемов выборок по группам. Если возможность применения F-критерия все же вызывает сомнения, можно воспользоваться непараметричскими критериями.
Однофакторный непараметрический дисперсионный анализ
с применением критерия Краскала-Уоллиса включает следующие операции:
- ранжирование всех наблюдений по возрастанию от 1 до N,
к
где У = - объем всей выборки;
7=1
-нахождение сумм рангов Ru R2, .... F* для каждого уровня анализируемого фактора;
-вычисление критерия Краскала-Уоллиса по формуле
12 |
D2 |
|
(— +... + — ) - 3(N +1); |
||
Н =- |
||
N(N + 1) |
п, |
- сравнение полученного значения Н с его критическим значе нием (Нк) для принятого уровня значимости а.
При достаточно большом объеме выборки, когда количество наблюдений по каждому уровню превышает 5, значение Нк опреде
ляется по таблицам распределения %2 для числа степеней свободы
/ = k —l , где к - количество уровней исследуемого фактора.
Если рассчитанное значение критерия Н превышает НК, то ги потеза об отсутствии влияния анализируемого фактора на изменчи вость изучаемого свойства отвергается.
При двухфакторном непараметрическом анализе Фридмана
исходные данные записываются в виде табл. 6 .
Таблица 6
Схема вычисления дисперсий при двухкратном дисперсионном анализе
Вид дисперсии |
Сумма квадратов отклонений |
||||
Факторная |
С, = n q j t ( x L - х ) 2 |
|
|||
по фактору А |
|
||||
|
|
1=1 |
|
|
|
Факторная |
С2 = пр i j ( X j - x j |
|
|||
по фактору В |
|
||||
|
|
|
|
|
|
Смешанная |
Съ = п Z |
Z |
|
x L - X j |
|
по факторам |
- |
+ x f |
|||
АВ |
|
|
|
|
|
Остаточная |
c = 4 , |
1, |
|
|
|
|
|
|
|
||
Общая |
P |
4 |
n |
/ |
\ 2 |
c = £ |
5 |
|
|
|
|
|
|
|
|
Число
степеней
свободы
P- 1
<7-1
(р- D (</-D
p q ( n - l)
npq—l
Дисперсия
s i - c '
1P-1
=Cz
2<7-1
3 (p -l)(9 -l)
p2 |
C4 |
4 |
P<7(« -1) |
2 |
C |
s 2 |
= -------- |
|
iipq -1 |
Для проверки влияния фактора А значения в строках таблицы ранжируются, то есть заменяются цифрами от 1 до q. По каждому
столбцу вычисляется сумма рангов Rj ( j = |
р), |
рассчитывается |
статистика S = (Я,2+ . . . + + . . . + /? ,) 2 /<7 |
и |
критериальная |
статистика %2R= 1 2 S / pq(q + 1). |
|
|
Для количества уровней по факторам А или В больше 4, крити
ческое значение статистики определяется по таблицам критерия
X2 . Для количества степеней свободы { = q -1, а при малом количе стве уровней используются специальные таблицы .
Для проверки гипотезы о влиянии фактора В строки и столбцы в табл. 6 меняются местами.
Использованный в данной главе математический аппарат опи сан в специальных пособиях по теории вероятностей и математиче ской статистике. Приемы первичного анализа результатов массовых наблюдений подробно рассмотрены в монографии Дж. Тьюки. Много полезных рекомендаций по вычислительным методам стати стики можно почерпнуть из справочника Дж. Полларда.
Применению статистических методов при геохимических ис следованиях посвящены работы В. Н. Бондаренко, Д. А. Родионова. Многочисленные примеры использования одномерных статистиче ских моделей в различных областях геологии приведены в моно графиях Р. Миллера и Дж. Кана, У. Крамбейна и Ф. Грейбилла, Дж. Дэвиса.
Статистическому анализу угловых величин посвящена моно графия К. Мардиа.
Контрольные вопросы
1.Почему при изучении свойств геологических объектов мож но применять методы математической статистики?
2.Какие требования предъявляются к выборочной геологиче ской совокупности при статистическом моделировании?
3.Какие свойства геологических объектов можно описать не прерывными случайными величинами, а какие - дискретными?
4.Какие геологические задачи можно решать с помощью гис
тограмм и кумулят?
5.Какие статистические законы распределения используются
вгеологии?
6. Как проверяются гипотезы о типе статистического распреде
ления?
7. Для чего рассчитываются точечные и интервальные оценки свойств геологических объектов?
8 . Как строятся доверительные интервалы оценок средних зна чений в условиях нормального, логнормального, биномиального закона и распределений Пуассона и Мизеса?
9. Какие типы геологических гипотез можно проверять стати стическими методами?
10.Чем отличаются параметрические критерии согласия от не параметрических?
11.Чем различаются ошибки первого и второго рода при стати стической проверке гипотез?
12.Какие геологические задачи решаются путем проверки ги потез о равенстве средних?
13.Для чего используются критерии Стьюдента, Ван-дер- Вардена, Родионова, Вилкоксона, Ватеона-Вильямса, Вилера- Ватсона-Ходжеса?
14.Какие геологические задачи решаются путем проверки ги потез о равенстве дисперсий?
15.Для чего используются критерии Фишера, Сиджела-
Тьюки?
16.Какие геологические задачи решаются с помощью критери ев Смирнова и Фергюссона?
17.Какие геологические задачи решаются с помощью однофак торного и двухфакторного дисперсионного анализа?