Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги / Прикладной статистический анализ в горном деле (Многомерная математическая статистика)

..pdf
Скачиваний:
9
Добавлен:
12.11.2023
Размер:
11.62 Mб
Скачать

Составим уравнение регрессии. Результаты расчётов обнадёживающие, уравнение имеет хорошую корреляцию, но значительную стандартную погрешность и значительные остатки

(табл. 7.5).

В уравнении одна переменная не значима (Х), после её удаления и пересчёта получаем окончательный результат. Но и стандартная ошибка оценки имеет большую величину (см. табл. 7.5, рис. 7.13), также встречаются значительные по величине остатки

(табл. 7.6).

Рис. 7.12. Окно ввода данных для проведения их классификации

Таблица 7.5

Построение уравнения регрессии

301

Рис. 7.13. Уточнение уравнения после удаления переменной X

Таблица 7.6 Статистики остатков от уравнения регрессии

Выполним расчёты нейронными сетями, загрузим данные. На обучение отберём 70 %, на контроль и тест по 15 % всех данных. Отбор выбираем случайный, к выводу оставляем 10 лучших сетей (табл. 7.7). После выполнения расчётов получим следующие результаты. Лучшими оказались сети многослойных перцептронов (табл. 7.8, 7.9).

Таблица 7.7 Фрагмент таблицы с характеристиками некоторых сетей

302

Лучшей по коэффициентам корреляции и по размеру остатков оказалась сеть № 1. Статистика остатков (рис. 7.14, табл. 7.10) показывает максимальные их размеры, которые изменяются от –16,54 до 14,47 м.

Таблица 7.8 Таблица корреляций по каждой полученной сети

Большие по абсолютной величине остатки получены на участках, где отсутствуют данные или они представлены единичными скважинами. В основной части площади остатки не превышают 2,7 м по модулю, что даёт основание для выполнения прогноза высотной отметки пласта на новые камеры.

Таблица 7.9

Характеристики предсказанных сетей

303

Рис. 7.14. Распределение остатков в лучшей сети

Таблица 7.10 Статистики остатков, полученных от лучшей сети

7.10.4. Применение нейронных сетей для прогноза временных рядов

В задачах временных рядов цель заключается в предсказании величин переменной (или нескольких переменных) на основе предыдущих значений той же или другой переменной (переменных). В нашем примере используется одна переменная – концентрация солей в рассоле. Предыдущие значения (первое

304

предпоследнее, второе предпоследнее и др.) используются для предсказания следующего значения этой же последовательности. Такая возможность позволяет делать прогноз на несколько шагов вперед последовательно. Поэтому необходимо установить «Размер окна». Поскольку ранее установлен цикл в 4 квартала, в данном поле задаём 4 предыдущих наблюдения для построения прогноза, которые будут работать как входы в нейронную сеть (рис. 7.15).

Рис. 7.15. Задание первичных параметров расчёта ВР в нейронных сетях: слева – ввод окна (количество предыдущих наблюдений); справа – размеры подвыборок

В нейронных сетях в качестве метода исследования укажем временной ряд. Выберем переменную – наблюдения за концентрацией солей. Назначим две подвыборки – обучающая и контрольная в соотношении 80 / 20 %.

Прогноз вперед (количество шагов): количество прогнозируемых значений временного ряда задаём равным одному шагу. Таким образом, для прогноза выбран размер окна 4, количество шагов прогноза – 1. После нескольких вариантов расчётов получены две лучшие сети радиальных базисных функций с параметрами, представленными в табл. 7.11, и статистиками по табл. 7.12.

Таблица 7.11

Показатели лучших сетей

305

Остатки после расчётов сетей лежат в интервале от – 5,5 до 4,8. График 22-й сети, совмещённый с исходным, приведен на рис. 7.16. Анализ графиков показывает их хорошее совпадение. Прогноз на шаг вперёд не противоречит локальной тенденции ряда. Прогноз на следующий шаг можно проводить после ввода в данные полученных результатов на предыдущем шаге.

Таблица 7.12

Статистики отобранных сетей

Рис. 7.16. Графическое отображение временного ряда

306

7.10.5. Применение нейронных сетей для прогноза остатков временных рядов

В примере анализа временного ряда раздела «Временные ряды и прогнозирование» после разложения на компоненты остались остатки, график которых представлен на рис. 7.17. Статистика прогноза остатков свидетельствует о наличии нескольких выбросов, но в целом, остатки подчиняются нормальному закону распределения с нулевым средним и стандартом, равным

2,87 (табл. 7.13).

Таблица 7.13

Некоторые статистики остатков

Попробуем остатки аппроксимировать временными рядами нейронных сетей. Поскольку основной ряд сезонных наблюдений, то и в остатках, вероятно, также будет представлена сезонность.

Загрузим остатки в нейронные сети с такими же параметрами и произведём их аппроксимацию (рис. 7.17).

После проведения вычислений разброс остатков в два раза уменьшился – с 2,87 до 1,43. Уменьшился минимальный отклик остатков, но выбросы остались, более того, на прогнозном графике предполагается формирование нового выброса в интервале 57-го квартала. Если убрать выбросы, один в области пяти единиц и два со значением – 4, то на гистограмме границы разброса будут уменьшены и останутся лежать в интервале от – 3,5 до 2,5 единиц (рис. 7.18).

307

Рис. 7.17. График распределения остатков и их статистики в результате аппроксимации в нейросетях

Рис. 7.18. Гистограмма остатков

Такой подход к описанию временных рядов может улучшить прогнозы. Преимуществом нейронных сетей является возможность сохранения результатов в виде скрипта в различных форматах с возможностью его последующего использования. Если список активных сетей не пуст, их можно сохранить в форматах PMML файла, C/C++ и некоторых других. Ранее сохранённую сеть в формате PMML можно запустить, если нажать кнопку «Загрузить сети» на стартовой панели модуля нейронных сетей.

308

ЗАКЛЮЧЕНИЕ

Успешная практическая деятельность горнодобывающего предприятия все в большей мере зависит от организации сбора, хранения, обработки и передачи информации – основных функций информационных технологий. Совершенствование технологий записи и хранения данных, создание баз данных и знаний во всех сферах деятельности человека, в том числе горной и нефтедобывающей промышленности, предъявляют новые требования к уровню подготовки специалистов. Большой объем информации, который присутствует в деятельности практически любого предприятия и учреждения, обычно содержит значительные сведения, благодаря которым можно повысить эффективность работы, совершенствовать технологию работ, управление и т.д.

На многих крупных предприятиях горной, нефтяной и других отраслей инженерные кадры младшего звена выполняют функции сбора, обработки, хранения, передачи и представления информации. И неважно, как организована эта система – по старинке с использованием бумажной технологии или в современных информационных системах.

Традиционно считается, что система управления предприятием представляет иерархическую организационную структур, состоящую из трёх уровней:

1)младшее звено, задачами которого является подготовка, сбор, обработка, хранение, передача (представление в удобном виде) информации. В процессе работы специалисты выполняют измерения, после чего требуется надлежащим образом их оценить и определить влияние неизбежных погрешностей на полученные результаты измерений. Кроме этого, необходимо осуществить математическую обработку материалов измерений, устранить противоречия, т.е. выполнить уравнивание результатов измерений;

2)среднее звено специалистов, которое на основании данных информационных систем выполняет анализ для получения

309

прогнозов и сценариев развития, оптимизации заданных параметров производства;

3) старшее звено, руководство, они принимают решения по управлению предприятием в соответствии с некоторыми целями.

Обязанности специалистов предполагают проведение первичной обработки данных, их анализ, построение прогнозов и сценариев развития. Эти работы выполняют специалисты младшего и среднего уровней, маркшейдеры, геодезисты, геологи и горняки. По этой причине они должны владеть как методами статистической обработки первичной информации, так и технологией обработки многомерных данных, чтобы извлекать из неё предполагаемые тенденции, уметь выделить из множества данных отличающиеся по каким-либо признакам районы и опасные зоны, обладать технологиями статистического прогноза на планируемые участки.

Многомерный анализ включает широкий спектр статистических методов, общепринятого определения границ этой области не существует. В настоящей работе представлены методы структурирования горно-геологической информации (факторный анализ), технологии классификации (кластерный анализ) и методы распознавания образов (дискриминантный анализ), корреляция и аппроксимация функций (канонический анализ, нейронные сети). Наблюдаемые параметры геологического строения месторождений, от которых зависит уровень потерь полезного ископаемого и его качество, обладают свойствами случайных функций. Это направление также представлено теоретическими сведениями о случайных функциях и методами обработки временных рядов.

310

Соседние файлы в папке книги