Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Статистика и анализ геологических данных

..pdf
Скачиваний:
22
Добавлен:
15.11.2022
Размер:
21.12 Mб
Скачать

Приближенное процентное отношение сумм квадратов имеет вид

-§§*- • 100°/о.

(5.41)

В этих равенствах все суммирования производятся по п данным точкам исходной последовательности или по п* точкам сгла­ женной последовательности. В частности, отметим, что вычисля­ ются два значения для суммы квадратов первоначальных дан­ ных. Первая из них учитывает все точки данной последова­

тельности от 1 до п, вторая включает только те наблюдения, для

л

которых вычисляются оценки Yi. Таким образом, из-за потери

данных

на концах

сглаженной

последовательности

мы имеем

п * = п — ( ш — 1). Хотя

в этом

случае,

как и в регрессионном

анализе,

можно

было

бы ожидать

выполнения

равенства

SSo = S S S+ SS D, тем не менее

его нет

в методе скользящего

среднего. Это происходит по той причине, что вычисление оценок Yi вблизи концов последовательности данных отчасти основано

на использовании значений, не входящих в вычисление S S o . Поэтому значение процентного отношения сумм квадратов яв­ ляется приближенным, но его можно использовать как показа­ тель эффективности процесса фильтрации.

В табл. 5.16 приведены 176 значений сопротивления пород на электрокаротажной диаграмме нефтяной скважины, в кото­ рой замеры были проведены с интервалом в 2 фута. Скважина была пробурена в породах пенсильванского возраста в Айове, где стратиграфический разрез представлен переслаиванием тон­ ких слоев измененного известняка и сланца. Геологи предпри­ няли попытку установить корреляцию внутри стратиграфиче­ ской последовательности в северо-восточном Канзасе, однако подходящих каротажных диаграмм там не оказалось. Дело в том, что каротажные диаграммы скважин Канзаса отличаются наличием дополнительных слоев известняка и общего увеличе­ ния мощности пород. Сглаживание данных уменьшило измен­ чивость каротажных диаграмм и позволило, по крайней мере приближенно, оценить корреляцию. Используя программу 5.6, произведите сглаживание данных с помощью метода 5-членного скользящего среднего. Какое влияние оказывает сглаживание На расположение пиков? Используя больший интервал сглажи­ вания, снова примените метод скользящего среднего и сравните результаты. Приводит ли увеличение сглаживающего интер­ вала к значительному изменению вида кривой? Перепишите Программу SMOOTH для уравнения Шеппарда. Как сравнить сглаженные последовательности, полученные методом Шеп­ парда и методом пятичленного скользящего среднего?

Значения каротажной кривой в стратиграфическом разрезе пенсильванских

слоев в штате Айова (интервал замеров 2 фута)

(Верх р а з р е з а )

2 1 ,3

4 5 ,6

1 8 ,4

2 2 ,8

 

 

3 4 ,0

3 4

,4

1 9 ,7

2 2 ,2

 

 

4 3 ,5

2 3

,9

19 ,3

2 0 ,5

 

 

3 8 ,4

15 ,2

1 8 ,0

2 0 ,9

 

 

3 4 ,0

1 5 ,7

1 5 ,9

5 1 ,5

 

 

3 6 ,8

1 5 ,3

18,1

4 0 ,3

 

 

3 4 ,2

1 4 ,7

2 6 ,0

4 2 ,9

 

 

3 4 ,3

1 4 ,9

2 8 ,0

4 5 ,7

 

 

3 1 ,0

1 1 ,7

2 5 ,4

4 4 ,2

 

 

1 7 ,0

9

,2

2 1 ,4

4 7 ,7

 

 

1 3 ,9

1 0 ,8

2 2 ,7

4 7 ,8

 

 

13 ,7

1 9 ,0

2 2 ,3

4 3 ,2

 

 

14,1

16,1

2 1 ,0

4 3 ,2

 

 

1 4 ,8

1 6

,2

19 ,7

4 6 ,2

 

 

1 4 ,9

1 6

,0

1 8 ,8

4 4 ,3

 

 

14,1

1 2

,8

2 0 ,3

44,1

 

 

13,1

1 3

,9

20,1

4 2 ,7

 

 

13 ,7

1 2 ,4

2 1 ,8

3 7 ,4

 

 

2 5 ,9

1 4 ,0

2 1 ,5

35,1

 

 

2 5 ,2

14,1

2 1 ,3

3 6 ,0

 

 

2 5 ,0

1 0

,0

2 0 ,8

3 5 ,0

 

 

2 5 ,0

2 3 ,0

21,1

3 2 ,6

 

 

2 5 ,0

3 1

,7

3 3 ,3

3 1 ,3

 

 

2 2 ,3

4 4

,9

3 5 ,3

3 0 ,2

 

 

1 6 ,5

4 8

,0

4 9 ,4

2 6 ,8

 

 

1 5 ,0

4 9

,9

4 7 ,8

2 7 ,9

 

 

1 5 ,4

4 9 ,7

4 6 ,9

2 7 ,8

 

 

1 5 ,7

50,1

47,1

2 5 ,2

 

 

1 5 ,3

4 9 ,0

4 5 ,9

2 2 ,9

 

 

1 5 ,6

4 6

,2

4 4 ,2

2 2 ,3

 

 

1 5 ,8

4 4

,8

45,1

2 1 ,8

 

 

1 5 ,9

3 7

,0

3 6 ,7

2 2 ,0

 

 

2 9 ,7

3 8

,2

2 7 ,7

2 1 ,8

 

 

38,1

4 2

,5

3 0 ,3

2 1 ,5

 

 

40,1

4 0

,6

2 9 ,9

2 0 ,0

 

 

4 4 ,0

3 8 ,0

4 5 ,7

2 0 ,6

 

 

4 2 ,0

2 5

,5

47,1

21,1

 

 

3 8 ,0

21,1

4 5 ,6

2 1 ,9

 

 

38,1

2 5 ,7

4 6 ,0

2 2 ,7

 

 

4 5 ,0

3 2 ,5

4 7 ,4

2 5 ,9

 

 

4 6 ,7

3 1 ,8

4 6 ,2

2 6 ,0

 

 

4 6 ,3

2 8 ,2

3 3 ,3

2 5 ,4

 

 

4 6 ,4

2 0 ,0

2 4 ,2

2 7 >°

(Основание

 

4 5 ,8

2 0 ,6

2 2 ,9

2 9 ,0

разр еза)

Автокорреляция

ивзаимная корреляция

Впоследовательности результатов наблюдений иногда бы­ вают повторения, как это указано на фиг. 5.16. Повторение может быть не совсем точным, но наводит на мысль о том, что наблюдаемая последовательность является циклической или пе­

риодической. Если бы мы могли провести сравнение элементов этой последовательности в ее различных* участках, то, вероятно, отметили бы места максимального сходства и вычислили бы меру сходства между различными участками.

Одним из способов сравнения двух одинаковых участков кривой является выделение двух отрезков и их наложение друг на друга. Качество подбора кривой, охарактеризованное неко­ торым числовым способом, даст нам показатель их сходства. Исключая те случаи, когда целая последовательность должна сравниваться сама с собой во всех возможных вариантах, для этой цели удобно использовать метод автокорреляции. С его помощью удается установить не только степень сходства во всех положениях, где наблюдается хорошее соответствие, но также оценить меру различий в остальных участках последователь­ ности.

Мы можем осуществить «самосравнение», вычисляя авто­ корреляционную функцию, которая определяется как коэффици­ ент линейной корреляции между временным рядом и тем же рядом в последующий интервал времени. Автокорреляционная функция временного ряда с лагом L вычисляется по формуле

[ ( n ~ L) (SYJYJ j_L) — 2.Y, SY1+ l ]/ ( n - L ) (n — L — 1)

j a ( a - l )

C O V (Y , Y,+ | )

(5.42)

_2

 

Фиг. 5.16. Последовательность повторяющихся значений переменной Y в зави­

симости от X во времени или в пространстве.

сравним их между собой, то получим автокорреляционную функцию с лагом 0; коэффициент корреляции, конечно, будет равен 1,0. Далее, сдвинем одну цепь вперед на одно звено и сравним две полученные цепи, затем сдвинем цепь снова на одно звено и сравним и т. д. Если один участок цепи целиком пере­ двинется по отношению к другому, то скажем, что мы провели полную автокорреляцию и обладаем сведениями о степени сов­ падения двух цепей в каждой позиции. В вычислительной ма­ шине нельзя физически передвигать элементы самого времен­ ного ряда. Мы даже не имеем дела с двумя «цепями», а просто проводим процесс вычисления, используя переменные индексы в циклах DO. Тем не менее приведенная физическая аналогия весьма полезна, и она будет еще использоваться в следующих разделах.

Вычислив автокорреляционную функцию для всех значений лага, можно построить коррелограмму, представляющую собой график автокорреляционной функции, аргументом которой явля­ ется лаг. Коррелограмма временного ряда фиг. 5.16 изображена на фиг. 5.18. Типичная коррелограмма принимает значения от 1,0 при нулевом лаге до отрицательных значений. При значе­ ниях лага, соответствующих близкому совпадению элементов, коррелограмма имеет пики, соответствующие высокой автокор­ реляции. Исследование коррелограммы помогает выявить вре­ менные или пространственные интервалы, при которых изучае­ мые ряды имеют повторяющиеся элементы.17

Фиг. 5.18. Коррелограмма последовательности, представленной на фиг. 5.16.

Значения автокорреляционных функций, равные 1,00, при лаге 9, указывают на то, что исходная последовательность периодична, а длина периода равна девяти единицам.

17 Заказ No 455

Коррелограммы помогают выявить характеристики времен­

ных рядов. На фиг. 5.19, а изображены

правильная синусоида

и соответствующая ей коррелограмма. По мере изменения фазы

сигнала, т. е. при смене пиков и впадин,

коррелограмма изме­

няется от

+1

до 0 и затем до — 1. Затем корреляция снова рас­

тет, пока

не

достигает значения + 1, когда сигнал сдвинется

ровно на одну длину волны. На фиг. 5.19, б изображен сигнал, полученный в результате использования точек, взятых из таб­ лицы случайных чисел. Коррелограмма быстро убывает от +1.0 до 0 и затем незначительно колеблется около нуля. Оба эти ряда являются стационарными, т. е. в наблюдениях не имеется значительного тренда. Нестационарный сигнал изображен на фиг. 5.19, в, где наблюдения, образующие последовательность, неуклонно растут по величине. Соответствующая коррелограмма показывает, что корреляция неуклонно убывает. На фиг. 5.19, г изображена комбинация случаев 5.19, а и 5.19, б, т. е. синусои­ дальной волны и наложенного на нее шума. Полная автокорре­ ляция возможна только при нулевом лаге, однако о периоди­ ческой компоненте временного ряда напоминает пик коррело­ граммы, имеющей два пересечения с нулевым уровнем. График фиг. 5.19, д представляет собой комбинацию графиков 5.19, а, 5.19, б и 5.19, в, т. е. синусоидальная волна складывается с гра­ фиком линейного тренда и с наложенным на них шумом. Заме­ тим, что тренд значительно снижает наши возможности выде­ лить периодическую компоненту в сигнале.

Математическое ожидание или среднее значение автокорре­ ляции для последовательности случайных чисел равно нулю. Ожидаемая теоретическая дисперсия автокорреляции случайной последовательности при любом лаге L равна

Р-43)

Эти два параметра определяют совокупность элементов случай­ ного временного ряда данной длины п [27]. Как уже отмечалось в гл. 3, можно определить вероятность появления некоторого случайного события для нормального распределёния с извест­ ным средним значением и заданной дисперсией, если ввести стандартизованную величину

Z = + + .

(5.44)

Извлекая квадратный корень из выражения (5.43), мы получим стандартное отклонение автокорреляции. Подставив среднее значение и стандартное отклонение в формулу (5.44), получим

ZL

rL “

°

rL|/n — L.

(5.45)

l / / n - L

 

 

 

+/1

0-

I I I г I I

0 510152025

+ /

UA^ vo

-/

I I I I I I

0 5 10152025

1 i i i i i

0 5 10152025

J

+ /-|

0-

-H

I i i i i i

.0 5 10152025

+ / J

i i i i I i

0 5 10152025

Фиг. 5.19. Примеры идеализированных временных рядов и их автокорреляци­ онные функции.

а — синусоидальная волна с длиной волны 20 единиц; б — последовательность случайных чисел или «шум»; в — последовательность возрастающих по линейному закону чисел илн «тренд*; г — сумма синусоидальной волны н случайного шума (последовательность а плюс последовательность б); б — сумма синусоидальной волны со случайным шумом и линейным трендом (последовательность а плюс последовательность б плюс последова­

тельность в).

Эту величину можно использовать в качестве статистики для проверки гипотезы, заключающейся в том, что автокорреляция гь равна нулю при условии, когда длина последовательности п

велика, а лаг L мал.

«Много»

и

«мало» — термины,

которые

трудно определить

точно.

Обычно

п выбирают

не

более

50,

a L — не превосходящим

п/4.

(Некоторые

авторы устанавли­

вают еще более низкие пределы для L, например п/10 или еще

меньше.) Эти ограничения основываются на

том,

что

если лаг

увеличивается, то

значение гь

приходится

вычислять по

все

меньшему и меньшему

числу

наблюдений.

Это

приводит

не

только к увеличению дисперсии гь, но также к все более значи­ тельному нарушению предположения о том, что автокорреля­ ция вычисляется по выборке из временного ряда бесконечной длины. По указанным причинам высокие значения автокорре­ ляционной функции при большом лаге не играют существенной

роли,

пока

сам временной ряд во много раз длиннее.

В

табл.

5.17 представлены необычные для геолога данные,

а именно наблюдаемые значения истинного временного ряда из геологического прошлого. Только при очень редком стечении обстоятельств удается датировать прошедшие события по ре­ зультатам изучения пород, что в свою очередь позволяет опре­ делить временную шкалу для последовательности геологических данных. Эоценовые озерные отложения в Скалистых горах со­ стоят из тонкослоистых доломитизированных нефтяных сланцев мощностью в сотни футов. Было установлено, что слоистость претерпевает изменения, т. е. является результатом сезонных климатических изменений в бассейне озера. Измерения мощ­ ности этих слоев позволили определить годичные изменения скорости осадконакопления в течение истории озера. Табл. 5.17 содержит значения мощности слоев в миллиметрах, замеренные в разрезе этих отложений вблизи западного побережья одного из самых больших озер. Мы попытаемся ответить на несколько вопросов, связанных с этими данными. Например, существовал ли тренд в скорости отложения доломитов с течением времени, причиной которого могло явиться постепенное изменение кли­ мата? Имеется ли очевидная цикличность мощности слоев, ко­ торая, возможно, имеет связь с астрономическими явлениями? При наличии цикличности мы можем определить многолетние периоды (связанные, например, с солнечными пятнами за по­ следние 11 лет). Было проведено 101 наблюдение, которые при­ ведены в таблице. Вычисление автокорреляционной функции без ЭВМ при малом числе точек для любого значительного ко­ личества лагов является почти невыполнимой задачей. Прог­ рамма 5.8 (AUTOCR) предназначена для вычисления и графи­ ческого представления коррелограммы временного ряда, имею­ щего п точек. Значения лага берутся вплоть до L = n/4.

Т а б л и ц а 5.17

Мощность последовательности слоев в разрезе нефтеносных сланцев (мм)

Верх, разреза

6,0

8,6

10,8

4,2

 

7,2

9,0

9,5

4,5

 

7.1

12,0

8,1

5,9

 

7.1

13,7

7,2

7,3

 

7.2

14,0

7,1

7,3

 

7,4

13,6

6,8

6,7

 

8,0

12,1

7,0

6,0

 

8.6

12,9

7,1

5,8

 

10,0

12,8

5,6

5,7

 

11,4

11,1

3,8

6,5

 

12.0

9,0

3,4

8,2

 

11.0

7,5

4,2

10,2

 

9.6

7,5

4,8

12,3

 

8.7

8,4

4,5

13,2

 

7.6

8,4

3,6

13,2

 

7.2

7,9

3,0

12,4

 

7.2

7,0

2,8

9,7

 

7.8

6,7

4,1

9,2

 

8,1

6,8

6,8

9,3

 

7.8

7,3

8,1

8,3

 

7.1

7,3

7,8

6,0

 

7.2

7,2

6,4

5,7

 

7,1

8,1

4,6

6,1

 

7.0

9,8

3,7

6,3

 

7.0

11,0

4,0

6,3

 

7.7

 

 

 

Основание

разреза

При вычислении автокорреляционной функции элементы данной последовательности снабжаются двумя различными ин­ дексами. По окончании каждого вычисления один из них (со­ ответствующий последовательности с лагом) увеличивается на единицу. Коэффициенты гь печатаются по мере их вычисления и хранятся в памяти машины. При желании этот массив можно представить графически с помощью подпрограммы, аналогич­ ной программе 5.7 TSPLOT. Выполните анализ данных и опре­ делите, имеется ли значимый тренд или периодичность в дан­ ных, представленных в таблице, характеризующей изменения мощности. Напомним, что данные должны быть стационар­ ными, так что до выполнения автокорреляционного анализа любой значимый тренд нужно устранить.

Если можно провести сравнение временного ряда с самим

собой

с помощью автокорреляционной

функции, то, вероятно,

этот

же

метод можно применить для

сравнения одного ряда

с другим.

Если сравнимые ряды являются стратиграфическими

сPROGRAM 5 - 8

с

сRO UTINE AUTOCR

с

с

SUBROUTINE TO COMPUTE AUTOCORRELATION FUNCTION

OF

с

A DATA SEQUENCE,

FROM ZERO LAG TO

L A G = N IN /4 .

IN P U T

с

SEQUENCE IS X IN

AND

CONTAINS

N IN

P O IN T S .

 

с

AUTOCORRELATION

IS

RETURNED

IN ARRAY XOUT, WHICH IS

сNOT P O IN TS LONG.

с

с SUBROUTINES REQUIRED ARE TS P LO T, R EA D M .PR IN TM .

с

с

DIMENSION XIN(500),X0UT(250)

с

с READ INPUT DATA, PRINT IT OUT, AND PLOT IT.

с

CALL READM(XIN,NIN,NI,5 0 0 ,I )

CALL PRINTM(XIN,NIN,NI,5 0 0 ,I ) WRITE (6,2002)

CALL TSPL0T(XIN,NIN,2) WRITE (6,1000)

WRITE (6,2000)

с

с, . . CALCULATE TOTAL VARIANCE

с

AN=NIN

SY=0.0

SYY=0.0

DO 100 1=1,NIN SY=SY*XIN(I)

S Y Y = S Y Y + X I N ( I ) +*2

I 00 CONTINUE

VY=(AN*SYY-SY*SY)/(AN*(AN-1.0 ))

с

с . . CALULATE CORRELATION FDR EACH LAG (0 TO NIN/4)

с

N0T=NIN/4*1

DO 101 1=1,NOT SX=0.0

SY=0.0

SXY=0.0

L-NIN-I+!

DO 102 J=1,L

K*J+I-1 SX=SX*XIN(J)

SY=SY+XIN(K)

SXY=SXY+XIN(J)*XIN(K)

102CONTINUE AL=L

R=((AL*SXY-SX*SY)/4AL*(AL-1. 0 ) ))/VY XOUT(I)=R

11= 1-1

12=1

101

W R IT E ( 6 , 2 0 0 1 ) I I , 1 2 , L , I , N I N , R

C O N T IN U E

 

C A L L T S P L O T ( X O U T , N O T , 1)

 

W R IT E ( 6 , 1 0 0 1 )

2 0 0 0

F O R M A T ( I H I , 8 X , / L A G / , I O X , 'T E R M S T H A T ARE B E I N G C O R R E L A T E D ' , 4 X ,

1 ' A U T O C O R R E L A T I O N ' / , 6 X . ' P O S I T I O N ' , 6 X , ' F I R S T S E T ' ,1 I X , 'S E C O N D S E T ' . 2 I 0 X . ' C O E F F I C I E N T ' )

2 0 0 1 F O R M A T ( I X , 5 I I 0 , F I 5 . 6 )

1 0 0 0 F O R M A T ( / ' P L O T

OF

I N P U T DA TA S E Q U E N C E ')

100 1

F O R M AT ( / '

P L O T

OF

A U T O C O R R E L A T IO N C O E F F I C I E N T S ' )

2 0 0 2

F O R M A T ( / '

I N P U T

DATA S E Q U E N C E ')

 

C A L L E X I T

 

 

 

 

END

 

 

 

Программа 5.8. AUTOCR