- •1.1. Моделирование геологических процессов и явлений
- •1.2. Характер геологической информации
- •1.3. Понятие о геолого-математическом моделировании
- •1.4. Принципы и методы геолого-математического моделирования
- •2. ОДНОМЕРНЫЕ СТАТИСТИЧЕСКИЕ МОДЕЛИ
- •2.1. Сущность и условия применения
- •2.2. Статистические характеристики, используемые в геологии
- •2.3. Точечные и интервальные оценки свойств геологических объектов
- •2.4. Основные статистические законы распределения, используемые в геологии
- •2.5. Статистическая проверка геологических гипотез
- •2.7. Проверка гипотез о равенстве дисперсий
- •2.8. Анализ однородности выборочных геологических совокупностей
- •2.9. Однофакторный и двухфакторный дисперсионный анализ
- •3. МНОГОМЕРНЫЕ СТАТИСТИЧЕСКИЕ МОДЕЛИ
- •3.2. Многомерный корреляционный анализ
- •3.3. Статистические методы выделения ассоциаций химических элементов
- •3.4. Кластер-анализ (дендрограммы и дендрографы)
- •3.6. Задачи распознавания образов в геологии
- •3.8. Оценка информативности геологических признаков
- •3.9. Линейные дискриминантные функции
- •3.10. Метод главных компонент
- •4. МОДЕЛИРОВАНИЕ ПРОСТРАНСТВЕННЫХ ПЕРЕМЕННЫХ
- •4.2. Элементы неоднородности, изменчивость и анизотропия гелогических полей
- •4.4. Фон, аномалии и поверхность тренда
- •4.5. Геометрические методы выявления закономерных составляющих признаков
- •4.6. Способы сглаживания случайных полей
- •4.7. Анализ карт
- •4.8. Метод ближайшего соседа
- •4.9. Поверхности тренда
- •4.10. Сравнение карт
- •4.15. Моделирование дискретных случайных полей
- •5.1. Принципы моделирования свойств геологических объектов
- •5.3. Использование автокорреляционных функций для решения геологических задач
- •6. ФАКТОРЫ, ОПРЕДЕЛЯЮЩИЕ ВЫБОР И ЭФФЕКТИВНОСТЬ ИСПОЛЬЗОВАНИЯ МАТЕМАТИЧЕСКИХ МЕТОДОВ
- •6.4. Роль геологического анализа при выборе геолого математической модели
- •7. ПРИМЕНЕНИЕ ЭВМ В ГЕОЛОГИИ
- •7.1. Автоматизация первичной обработки данных
- •7.2. Решение геологических задач с помощью ЭВМ
- •7.3. Автоматизированные системы обработки геологических данных
- •СПИСОК РЕКОМЕНДУЕМОЙ ЛИТЕРАТУРЫ
3.6. Задачи распознавания образов в геологии
Многие прогнозные и интерпретационные задачи решаются в практической геологии путем сопоставления комплекса признаков изучаемого объекта с комплексом тех же признаков эталонного объекта. Совокупность подобных методов, основанных на принци пе аналогии, получила название методов распознавания образов.
Проблема распознавания образов геологических объектов тес но связана с проблемой их классификации по совокупности извест ных признаков. С позиций многомерного математического анализа реальному геологическому объекту ставится в соответствие набор действительных чисел дгь лг2, ..., JCw, которые выражают значения его измеренных геологических, геохимических или геофизических его признаков. Каждая совокупность таких чисел интерпретируется как вектор или точка в многомерном пространстве, а множествам объ ектов одного класса в пространстве признаков соответствуют неко торые множества точек.
Области многомерного пространства, в которых сосредоточены точки одного класса, называются собственными областями классов. Если объекты тождественны друг другу, их собственные области совпадают. Собственные области объектов, резко отличающихся друг от друга, не пересекаются в пространстве. Для объектов, близ ких по некоторым признакам, характерно большее или меньшее пе ресечение их собственных областей.
Разделение непересекающихся собственных областей двух классов возможно с помощью гиперповерхностей (в трехмерном пространстве - плоскостей, в двухмерном - линий), а для разделе ния пересекающихся областей необходимо отыскать решающую функцию, минимизирующую возможность принятия ошибочного решения.
Статистический подход к классификации объектов основан на байесовской теории принятия решений. В терминах этой теории «состояние природы» А может быть охарактеризовано вероятно стью Р(А1) и условной вероятностью Р(Х/А,). Под условной вероят ностью подразумевается вероятность того, что совокупность при знаков объекта примет значение Х9когда состояние природы будет Aj (то есть объект будет относиться к классу Л,). Если удается оце
нить априорную Р(А) и условную Р(Х/А) вероятность, можно пред сказать свойственное объекту состояние природы в зависимости от того, какое значение X примут характеризующие его признаки:
Р(А/)Р(Х / А/) |
|
P(Ai / X ) = т |
’ |
^ Р ( А ,) Р ( Х / А,) |
|
где т - число возможных состоянии природы (то есть классов). |
|
Для совокупностей многомерных |
статистических признаков |
геологических объектов заранее не известно, пересекаются их соб ственные области или нет, в связи с чем допускается возможность их пересечения. В качестве меры пересечения Ф используется про изведение условных вероятностей Ф = Р ( XI А,) Р (XI Aj), где Р (XI А/) - вероятность попадания точки X в область пересечения при ус ловии, что она относится к классу А -,; P(X/Aj) - то же при условии, что она относится к классу Aj.
Правило, в соответствии с которым производится разграниче ние объектов на классы, называется решающим правилом. Для его реализации в общем случае подыскивается система разделяющих функций gi(A'), &(Х), ..., gm(X). Если g,(X) > gj(X), точка X принадле жит к Aj и наоборот. Если g,(X) = g/X), то области Л, и Aj соприка саются. Если при подстановке признаков Хтокажется, что для всех / Ф j соблюдается неравенство g/(X) > g,(X), то можно утверждать принадлежность объекта к классу /.
Для нормального распределения признака / g,{X) = - (х - Зс,)2 /
12а2 Задача обучения распознаванию образов сводится к подбору математической модели алгоритма аппроксимации и построению в пространстве признаков некоторой поверхности (в общем случае - гиперплоскости), разделяющей множества точек, которые соответ ствуют различным классам объектов, или к отысканию решающей функции.
Модели распознавания образов геологических объектов весьма разнообразны. При решении конкретных геологических задач их выбор зависит от природы геологических объектов, числа, полноты описания эталонных объектов, типов и информативности их при
знаков. В зависимости от типов исходных признаков выделяют две группы моделей: дискретные и непрерывные. Дискретные модели применяются в тех случаях, когда измеряемые признаки рассматри ваются как независимые или частично зависимые детерминирован ные величины. Непрерывные модели используются для распознава ния образов таких объектов, измеряемые признаки которых могут рассматриваться как случайные величины и поддаются статистиче скому описанию многомерными функциями плотностей вероятности.
В качестве критериев оптимальности распознавания использу ются решающие правила, определяющие пороговые значения ре шающих функций. Они могут определяться статистическими, логи ческими или эвристическими методами.
Для целей эффективного использования математических мето дов распознавания образов необходимо последовательно решить несколько взаимосвязанных задач: выбрать эталонные объекты, признаки и методы распознавания; построить решающее правило и провести классификацию контрольных объектов. Лишь после по лучения удовлетворительных результатов такой классификации можно приступать к распознаванию образов новых объектов.
При выборе эталонных объектов (формировании выборки обу чения) следует помнить: использование статистических алгоритмов распознавания требует, чтобы число объектов в выборке обучения было в несколько раз больше числа признаков. Чем больше неиз вестных параметров (например, средних значений и дисперсий при знаков), которые требуют определения в процессе обучения, тем больше должна быть выборка обучения. Поэтому на практике обычно возникает проблема сокращения числа признаков и повы шения их информативности. При использовании алгоритмов, в ко торых измеренные признаки рассматриваются как детерминирован ные величины, число объектов в выборке обучения может быть со измеримым или даже меньше числа измеряемых признаков.
При выборке признаков, характеризующих особенности оцени ваемых геологических объектов (формировании признакового про странства объектов), решающее значение имеют знания и аналити ческие способности исследователей, от эрудиции которых зависит правильная отбраковка заведомо неинформативных и малоинфор мативных признаков и предельно возможное ограничение размер ности признакового пространства.
Эвристическими называют такие методы, когда пороговые зна чения решающих функций оцениваются эмпирически или с пози ций «здравого смысла».
Выбор метода распознавания основывается на априорных зна чениях специалистов-геологов и результатах предварительного ана лиза выборок объектов по их признаковым описаниям. В односвяз ных объектах классы распознаваемых объектов характеризуются многими особенностями, члены одного и того же класса располага ются близко, а члены различных классов - далеко друг от друга. В таких случаях применяются простые и быстродействующие ли нейные методы распознавания образов (разделение гиперплоско стью или кусочно-линейной гиперповерхностью). Если же классы состоят из подклассов, один из которых находится в окружении то чек другого класса {многосвязные объекты), для их распознавания используются более сложные и емкие по времени нелинейные ме тоды, например, полиномиальные разделяющие функции. При ис пользовании любых алгоритмов распознавания следует стремиться к построениям решающих функций как можно более простых ви дов, поскольку они легче поддаются реализации и обеспечивают более устойчивые решения, особенно при малых выборках обучения.
3.7. Статистическая оценка перспектив
рудоносности территорий
Для прогнозирования перспектив рудоносности территорий, вероятных масштабов оруденения и ожидаемых геолого-промыш ленных типов месторождений используются совокупности (наборы) геологических, геофизических и минералого-геохимических при знаков, для которых изначально установлены пространственные или временные связи с прогнозируемыми геологическими объ ектами.
В простейших случаях удается различить сравниваемые объек ты по суммам кодируемых признаков. В таких схемах различающая способность (информативность) каждого из признаков изучается и оценивается раздельно с помощью условных балльных оценок, коэффициентов парной линейной или ранговой корреляции и дру гими способами. Однако, оценивая информативность каждого при-
знака изолированно, нельзя получить характеристики их суммарной эффективности, поскольку месторождения полезных ископаемых представляют собой сложные геологические системы, сформиро ванные под совокупным влиянием многих рудообразующих факто ров. Для оценок их важнейших пространственно-временных связей необходимо выявление суммарного эффекта доминирующих рудо образующих факторов. Используя более совершенные схемы распо знавания перспективных площадей или крупномасштабных рудных объектов с применением человскомашинных методов предвари тельного преобразования признаков, принятия оптимальных реше ний и оценки их надежности, можно заметно повысить информа тивность используемых исходных данных. При этом, однако, во просы выбора объектов и территорий прогноза, элементарных участков прогнозирования, совокупностей исходных признаков и систем их описания основываются прежде всего на существующем опыте человекомашинного прогнозирования и геологической эру диции исполнителей.
Обычно за элементарные участки прогноза принимаются квад ратные и прямоугольные ячейки, размеры которых определяются средними размерами прогнозируемых объектов, целями и масшта бами проводимых исследований. Как правило, площади элементар ных ячеек измеряются на картах любых масштабов квадратными сантиметрами или их долями. Для описания элементарных участков выбираются признаки, наиболее тесно связанные с проявлениями процесса оруденения и масштабами рудных образований. Это могут быть наборы детерминированных признаков, характеризующих ли тологический, гранулометрический, петрографический или мине ральный состав полезных ископаемых и вмещающих их пород, их стратиграфическое положение или формационную принадлежность, пространственные связи с тектоническими или вулкано тектониче скими структурами линейного или центрального типов, метасоматитами или гидротермалитами соответствующих масштабов прояв ления или стохастических характеристик различных свойств полез ных ископаемых и вмещающих их пород.
Полученный массив описаний разбивается на несколько сово купностей: эталонная выборка перспективных объектов (месторож дений, рудных полей и др.); эталонная выборка неперспективных