Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги / Статистика и анализ геологических данных

..pdf
Скачиваний:
2
Добавлен:
12.11.2023
Размер:
21.12 Mб
Скачать

Метод ближайшего соседа. Существует еще один способ ис­ следования подобластей, на которые разбита некоторая об­ ласть, называемый методом ближайшего соседа. Анализируе­ мые в этом случае данные представляют собой не множество точек, расположенных внутри некоторой заданной области, а расстояния между наиболее близкими парами точек. Преи­ мущество метода ближайшего соседа заключается в том, что он дает возможность получать некоторую информацию о при­ роде распределения точек, которая весьма далека от простого принятия или отклонения проверяемой гипотезы [31].

В условиях случайного распределения точек на плоскости математическое ожидание расстояния (ожидаемое среднее рас­

стояние) Д между каждой точкой и ближайшей к ней соседней точкой определяется следующей формулой:

Д

1

(6.8)

2 /р

 

где р — плотность точек в изучаемой области, которая опреде­ ляется как число точек, приходящихся на единицу площади, причем площадь измеряется квадратами единиц, используемых для измерения расстояний между точками. Так, например, если расстояние между точками выражено в милях, то р подсчиты­ вается как число точек, приходящихся на квадратную милю.

Мы можем также измерить расстояние между каждой точ­ кой и соответствующей ей ближайшей соседней точкой и вы­

числить наблюдаемое среднее значение этих расстояний D. От­

ношение

Pi

 

R

- 4 А-

(6.9)

представляет собой статистику метода ближайшего соседа, ко­ торая принимает значения в интервале от 0 до 2,15, где 0 соот­ ветствует случаю, когда все точки сведены в одну и расстояние между ними равно 0. Если критерий принял значение, равное 1, это соответствует случайному расположению точек, а макси­ мальная величина критерия 2,15 характеризует распределение точек, имеющих тенденцию к рассеянию. На фиг. 6.4 приведены примеры расположения точек, соответствующих трем различ­ ным случаям. Если точки расположены случайно, то теоретиче­ ское значение стандартного отклонения оценки среднего рас­ стояния между ближайшими точками будет определено сле­

дующим выражением:

0,26136 (6. 10)

0д_ VW

где N — число измерений расстояния между парами точек. Воп­ рос о константе в числителе этой дроби рассмотрен в работе

Фиг. 6.4. Значения статистики метода ближайшего соседа для различных схем расположения точек на картах.

а — точки_ сгруппированы:

£>=0,12,

Д=0,24,

/?=0,50;

б — случайное расположение___точек:

D =0,40, Д=0,32, R = 1,25;

в — точки

размещ ены в

верш инах шестиугольников: D =0,50,

 

 

Д=0,33,

Я=2,15.

Кинга [19] и Кендалла и Морана [18]. Располагая значениями D, А и о д , нетрудно построить критерий для проверки гипотезы

о случайном распределении

рассматриваемого

набора точек

Z =

- ~ А-.

(6.11)

 

ад

 

Если проверяемая гипотеза верна, то Z будет значением случайной величины, распределение которой близко к нормаль­ ному. Нулевая гипотеза должна быть отклонена, если Z превы­ сит допустимое значение, соответствующее заданному уровню значимости, которое можно найти в табл. 3.8.

Мы проиллюстрируем применение метода ближайшего со­ седа на примере «карты», приведенной на фиг. 6.5. Эта «карта» в действительности представляет полированную поверхность каменной облицовки фасада здания банка в университетском

городке. Эта облицовка выполнена черным анортозитом, кото­ рый содержит небольшие рассеянные кристаллы магнетита. Преподаватели нередко используют плиты облицовки как на­ глядное пособие для различной тематики, включая и примене­ ние математических методов в петрографии. При этом обычно постулируется, что положение плиты совпадает с ее исходной природной ориентацией. Таким образом рассматривается вер­ тикальная поверхность, нижней части которой соответствует ниж­ ний обрез плиты. Так называемая карта характеризует положе­ ние всех наблюдаемых на этой поверхности зерен магнетита.

В табл. 6.3 приведены значения координат этих точек в сан­ тиметрах, отсчитываемые от левого нижнего угла плиты. В дан­ ном случае задача заключается в получении ответа на вопрос: равномерно ли распределены зерна на поверхности плиты или же они обладают тенденцией к группировке? Кроме того, если распределение зерен неравномерно, спрашивается: можно ли считать плотность зерен у нижнего края плиты превышающей плотность у верхнего края? Получение ответа на подобные во­

просы играет

существенную роль при

решении

различных задач

петрогенезиса

изверженных горных

пород, и

рассматриваемые

в этой главе

методы анализа данных могут

быть при этом

о

_±_

_1_

_1_

 

40

80

Сантиметры

Фиг. 6.5.' Схематическое представление полированной плиты анортозита, на которой показано расположение кристаллов магнетита.

 

 

 

Т а б л и ц а 6.3

Координаты магнетитовых зерен на полированной

 

анортозитовой плите

 

 

Расстояние от нижнего левого угла плиты, см

горизонтальное

вертикальное

горизонтальное

вертикальное

1

86

38

25

2

41

38

7

4

3

41

51

4

15

46

2

8

9 5 .

47

12

9

13

45

82

7

35

50

83

8

44

49

96

10

58

50

13

12

88

51

25

14

2

56

12

22

2

58

40

21

56

59

28

22

53

60

61

24

31

62

70

27

12

66

0

27

34

66

15

28

76

65

75

37

14

69

38

37

61

69

83

27

85

71

27

И

25

76

1

15

15

77

4

3593

---с-----------------

весьма полезными. Проверку гипотезы о равномерном случай­ ном распределении зерен магнетита можно провести с помощью одного из рассматриваемых ранее способов — разделения на бо­ лее дробные участки или же с помощью метода ближайшего соседа. Вычисления можно делать вручную или составить не­

большую программу для ЭВМ и вычислить необходимые рас­ стояния по данным табл. 6.3.

Проведение изолиний

Построение карт в изолиниях по произвольно расположенным на плоскости результатам наблюдений представляет собой за­ дачу, сходную с задачей преобразования данных, неравномерно расположенных ^в пространстве по линиям, в равномерную си­ стему точек, так как обычно первый шаг построения данной карты — получение регулярной сети точек наблюдения. Регу­ лярную сеть можно получить различными способами, начиная от распространения ближайшего наблюдаемого значения на за­ данную точку регулярной сети и кончая вычислением оценок значений в заданных точках по уравнению, описывающему по­ верхность тренда, построенному по совокупности всех имею­ щихся наблюдений. Первый способ получения оценок значений в точках сети в значительной степени подвержен случайным воздействиям, что приводит к поверхности, содержащей раз­ рывы. Последний дает возможность получения гладкой непре­ рывной поверхности, но обладает существенным неудобством, заключающимся в том, что ни один из исходных результатов наблюдения не лежит на этой поверхности. Большинство ис­ пользуемых в практике методов построения карт в изолиниях включает процедуру взвешенного усреднения ограниченного числа близко расположенных наблюдений или же построение поверхностей тренда для малых участков изучаемой территории с последующей оценкой значений этих поверхностей в задан­ ных точках правильной сети.

В настоящее время существует очень много различных ва­ риантов схем построения сети, причем каждый из них, естест­ венно, имеет как свои преимущества, так и недостатки. Неко­ торые предназначены для получения карты, учитывающей осо­ бенности отдельных ее регионов, другие — для наилучшего приближения к результатам исходных наблюдений, а третьи — для наиболее эффективного использования времени ЭВМ при построении карты. Хотя все эти схемы и не являются взаимо­ исключающими, построение схемы, учитывающей совместное решение всех перечисленных задач, является непомерно труд­ ной проблемой (Уолтерс [37]). В данной книге мы не будем ка­ саться этих вопросов, а сосредоточимся на таких алгоритмах построения сети и изолиний, которые предназначены в большей степени для упрощения процедуры создания карты, чем для минимизации машинного времени или красивого оформления вывода результатов на печать.

Набор значений, по которому строится карта в изолиниях, вводится в машину в виде матрицы порядка пХЗ, в которой каждая строка содержит три элемента: Xi и Х2 — координаты

22 З а к а з № 455

Фиг. 6.6. Изображение контрольных точек для задачи топографического кар­ тирования.

За единицу масштаба выбрали 50 футов,

начало отсчета — левый нижний угол;

над уровнем

моря — в футах.

и Y — картируемая характеристика, заданная как функция на множестве значений координат. На фиг. 6.6 приведен типич­ ный набор точек с соответствующими им значениями результа­ тов измерения абсолютных отметок топографической поверх­ ности. Эти данные получены при мензульной съемке и равно­ мерно распределены на изучаемой площади с учетом заданного масштаба карты. Все эти данные с соответствующими им коор­ динатами приведены в табл. 6.4. Для удобства за начало коор­ динат принят левый нижний угол карты, а значения коорди­ натных отсчетов выражены в произвольных единицах (одна еди­ ница— 50 футов). Положение точек наблюдения можно было бы выразить и в любых других единицах, что не повлияло бы на результаты.

В ЭВМ вводится только матрица координат и топографи­ ческих отметок в порядке, удобном для последующих построе­ ний. После этого задается прямоугольная сеть точек, на основе которых будут строиться изолинии. В описанных в этой главе системах построения карт в изолиниях на ЭВМ расстояние между точками сети выбирается автоматически и равно рас­ стоянию между строк печатающего устройства вычислительной машины. В программах математического обеспечения графопо­ строителей обычно предусмотрен контроль этого интервала

Географические координаты и абсолютные отметки точек наблюдения в топографической задаче *

Горизонталь ная координа­ та, единицы

Вертикальная координата, единицы

Высота над уровнем мо­ ря, футы

0,3

6,1

870,0

1.4

6,2

793,0

2,4

6,1

755,0

3,6

6,2

690,0

5,7

6,2

800,0

1,6

5,2

800,0

2,9

5,1

730,0

3,4

5,3

728,0

3,4 *

5,7

710,0

4,8

5,6

780,0

5,3

5,0

804,0

6,2

5,2

855,0

0,2

4.3

830,0

0,9

4.2

813,0

2,3

4,8

762,0

2,5

4,5

765,0

3,0

4,5

740,0

3,5

4,5

765,0

4,1

4,6

760,0

4,9

4,2

790,0

6,3

4,3

820,0

0,9

3,2

855,0

1,7

3,8

812,0

2,4

3,8

773,0

3,7

3,5

812,0

4,5

3,2

827,0

Горизонталь­ ная координа­ та, единицы

5,2

6,3

0,3

2,0

3,8

6,3

0,6

1,5

2,1

2,1

3,1

4,5

5,5

5,7

6,2

0,4

1,4

1,4

2,1

2,3

3,1

4,1

5,4

6,0

5,7

3,6

Вертикальная координата, единицы

Высота над уровнем мо­ ря, футы

3,2

805,0

3,4

840,0

2,4

890,0

2,7

820,0

2,3

873,0

2,2

875,0

1,7

873,0

1,8

865,0

1,8

841,0

1,1

862,0

1,1

908,0

1,8

855,0

1,7

850,0

1,0

882,0

1,0

910,0

0,5

940,0

0,6

915,0

0,1

890,0

0,7

880,0

0,3

870,0

0,0

880,0

0,8

960,0

0 .4

890,0

0,1

860,0

3,0

830,0

6,0

705,0

• Отсчет координат <эт левого H I«жнего угла карты в ггроизвольных единицах.

оператором. Уменьшение длины шага графопостроителя обеспе­ чивает более красивый вид карты, так как делает линии более сглаженными. Однако это приводит к значительному увеличе­ нию числа точек сети, для которых должны быть выполнены определенные вычисления, что увеличивает время работы ЭВМ и как следствие увеличивает стоимость составления карты. Об­ суждение всех этих вопросов не входит в наши задачи, но де­ тальное их рассмотрение можно найти в трудах фирмы IBM [16], Палмера [32] и Уолтерса [37].

На фиг. 6.7, а изображена серия наблюдений, причем каждая точка охарактеризована значениями координат Xi и Хг, а тккже значением высоты над уровнем моря, которое приведено справа

от каждой точки.

 

 

 

)-

(

 

 

\

iЬ (

 

/ \

/

 

 

/

\

)

(

V)

 

 

6.1

5,7

5,3

5.8

о

О

О

6

7,0

6,5

6,0

5,2

О

О

о

О

7,6

7,0

6.0

5,7

О

О

о

О

7.2

7,0

6.2

5,5

О

О

О

О

Фиг. 6.7. Последовательность вычислений для построения изолиний при на­ хождении значений в узлах сетки.

а — исходная сеть неравномерно расположенных контрольных точек на карте; числа ука­ зывают абсолютные отметки; б — равномерная сеть, в узлах которой вычисляются зна­ чения; в — расположение четырех ближайших контрольных точек по отношению к точке равномерной сети: эти четыре ближайших значения используются для вычисления зна­ чения в этой точке; г — окончательный результат вычисления отметок в каждой точке

равномерной сети.

Набор точек можно перенумеровать, т. е. приписать каждой точке номер i. Следовательно, в новых обозначениях точка с но­ мером i будет обладать координатами Хц и Х2ь а также абсо­ лютной отметкой Yi. На фиг. 6.7,6 приведена выбранная пра­ вильная сеть точек, по которой будут строиться изолинии. Каж­ дой из этих точек можно приписать соответствующий номер к. Таким образом, точка этой сети с номером к будет обладать

-""S

координатами Xik, Х2к и вычисленным значением Yk. Нам нужно

высчитать оценку Yk по п ближайшим к ней исходным точкам наблюдения. Следовательно, сначала нужно найти эти п бли­ жайших точек и подсчитать соответствующие им расстояния от точки с номером к заданной сети. В математическом обес­ печении ЭВМ обычно имеется стандартная программа такого поиска, и поэтому мы на ней останавливаться не будем. Это совсем не умаляет важности этого этапа в построении карты, но заметим, что эффективность выполнения этой операции во многом зависит от быстродействия ЭВМ.

Допустим, что с помощью некоторого метода мы определим п ближайших тбчек к заданной точке с номером к. Согласно

теореме Пифагора, расстояние Dik от точки с

номером i до

точки с номером к будет равно

 

Dik = V (Xik — Xn)2-j-(X2k — X2I)2.

(6.12)

Вычислив расстояние Dik для всех п ближайших точек, можно подсчитать значение Yk по следующей формуле:

2 (Yi/D,k)

(6.13)

2 (l/Dik)

1=1

Процесс этих вычислений можно показать на примере дан­ ных, приведенных на фиг. 6.7, в. Мы произвольно выберем че-

тыре ближайшие точки (т. е.

п =4)

и подсчитаем Yk. На

фиг. 6.7, в числа

1, 2, 3, 4 являются номерами точек. Тогда

D,k= V

( 2 ,0 - 1,5)2+ ( 3 , 0 - 3,6)2 -=1/061 = 0,78,

D2k= V

(2,0

- 3,0)2+ (3,0

— 3,0)2 =

У ТМ = 1 .0 0 ,

D3k = У (2,0

2,0)2-}-(3,0

2,4)2 == У о М = 0,60,

D4k = 1 / ( 2 ,0 - 1 ,0 ) 2+ ( 3 , 0

- 2 , 9 ) 2 =

] / Ш = 1,00.

Используя полученные расстояния, можно вычислить Yk. Числитель выражения (6.13) будет равен

6.0

. 6.0

. 7.0

. 7.0

_ оо

0,78

1.00 +

0.60

1.00

Соответственно

знаменатель

определяется как сумма

1

, 1 ,

1

. !

= 4,95,

0,78

1.00

0,60

1.00

так что

32,36

=6,54.

4.96

 

Точно так же можно выполнить эту процедуру и для осталь­ ных точек заданной сети, которая со всеми вычисленными зна-

С

PROGRAM

6 . 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

с

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

С

R O U T I N E G R I D

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

С

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

С

PROGRAM Т О COMPUTE A

R E C TAN G U LAR G R I D

OF

V A L U E S

I N T E R P O L A T E D

C

FROM

I R R E G U L A R L Y

S PA C E D

MAP

D A T A .

M A T R I X

OF G R I D

V A L U E S

I S

C

P R I N T E D

OUT

AND

A LS O

P L O T T E D

A S

A

L I N E

P R I N T E R

CONTOUR

 

 

C

MAP B Y

S U B R O U T IN E

P L O T .

 

A CONTR OL'

CA RD

I S

F I R S T READ

T H A T

C

C O N T R O LS T H E

S I Z E

O F T H E

F I N I S H E D M A P .

 

SEE

BELOW

FOR

FORMAT

C

S P E C I F I C A T I O N .

 

 

N E X T

D A T A ARE RE AD

I N

AS

AN

N B Y

3 M A T R I X ,

C

WHERE

N

I S T H E

 

NUMBER

O F O B S E R V A T I O N S .

 

T H E

F I R S T

COLUMN

C O N -

C

T A I N S

X I ( E A S T - W E S T OR

ACR OSS

T H E M A P)

C O - O R D I N A T E ,

T H E

SECOND

C

COLUMN

C O N T A I N S

X 2 ( N O R T H - S O U T H

OR

DOWN

T H E

M A P ) ,

AND

THE

T H I R D

C

COLUMN

C O N T A I N S

T H E

D E P E N D E N T V A R I A B L E .

 

T H E MAP AS

PRODUCED

C

B Y P L O T

W I L L

HAVE

9

E Q U A L L Y S P A C E D

CO NT OUR BAN D S

S C A L E D

 

C

BETWEEN

T H E

M A XIM U M

AND

M I N I M U M

V A L U E S

O F

Y .

 

 

 

 

 

C

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

C

S U B R O U T IN E S

R E Q U I R E D

ARE

R E AD M ,

P R I N T M ,

AND

P L O T .

 

 

 

 

C

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

D I M E N S I O N D A T A ( 2 0 0 , 3 ) , D I S T ( 2 0 0 ) , A M A P ( 6 0 , 1 0 0 )

 

 

 

 

 

C

N D * 2 0 0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

C . . .

RE AD MAP CO N TR OL CA RD

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

C . . .

FO RMAT

OF C ONTROL CA RD

 

 

 

 

 

 

 

 

 

 

 

 

 

 

C

 

 

C O L .

1 - 8 W ID T H

OF MAP

I N I N C H E S

 

 

 

 

 

 

 

C

 

 

C O L .

9 - 1 6

X I

V A L U E O F

L E F T EDGE

OF

MAP

 

 

 

 

 

C

 

 

C O L .

1 7 - 2 4

X I

V A L U E

O F

R I G H T

EDGE O F MAP

 

 

 

 

C

 

 

C O L .

2 5 - 3 2

X 2

V A L U E

O F

BOTTOM

EDGE

OF

MAP

 

 

 

C

 

 

C O L .

3 3 - 4 0

X 2

X2 V A L U E

O F

TOP

EDGE

OF

MAP

 

 

 

C

RE AD

( 5 , 1 0 0 1 )

 

W I D T H , X

I M I N , X I M A X , X 2 M I N , X2MAX

 

 

 

 

 

 

C

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

C...

C A L C U L A T E MAP

 

S I Z E

AND

S C A L E

PAR A M ET ER S

 

 

 

 

 

 

 

C

I W « W I D T H * I 0 . 0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

I H B W I D T H * 6 . 0 * ( X 2 M A X - X 2 M I N ) / ( X I M A X - X I M I N )

 

 

 

 

 

 

 

 

D X I = ( X I M A X - X I M I N ) / F L O A T ( I W - 1 )

 

 

 

 

 

 

 

 

 

 

 

 

D X 2 * ( X 2 M A X - X 2 M I N ) / F L O A T ( I H - I )

 

 

 

 

 

 

 

 

 

 

 

C

S M A L L a ( D X 1 * D X l + D X 2 * D X 2 ) / l 0 0 0 0 . 0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

C . . .

RE AD

AND P R I N T

I N P l t t

D A T A M A T R I X

 

 

 

 

 

 

 

 

 

 

C

C A L L R E A D M ( D A T A , N , M , N D , 3 )

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

C A L L P R I N T M ( D A T A , N , M , N D , 3 )

 

 

 

 

 

 

 

 

 

 

 

 

C

W R I T E ( 6 , 2 0 0 1 )

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

C . . .

C A L C U L A T E M AP V A L U E S

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

C