Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

08 Учебное пособие МОГИ

.pdf
Скачиваний:
75
Добавлен:
11.03.2016
Размер:
881.82 Кб
Скачать

плотностью распределения вероятностей СВ: f ( x ) F ( x ). Вероятность попадания случайной величины на заданный отрезок [α, β] равна:

p x F( ) F( ) f ( x ) dx

. (2.1)

В иженерной гидрологии часто используют понятие обеспеченности СВ (вероятности превышения). Обеспеченность гидрологической величины Р(х) – это вероятность того, что рассматриваемое значение х гидрологической величины

Х может быть превышено среди совокупности всех возможных ее значений

 

P( x ) p X x 1 F( x ) .

(2.2)

Обычно обеспеченность выражают не в долях единицы, как вероятность СВ, а в процентах. Например, если среднегодовой расход имеет обеспеченность 1 %, это означает, что такой расход будет превышен в среднем один раз в 100 лет.

Значения обеспеченности определяются для генетически однородных гидрологических характеристик: объемов весенних половодий, объемов дождевых паводков теплого периода, объемов годового стока, максимальных расходов половодий и максимальных расходов дождевых паводков, минимальных расходов межени и т.д.

3 Числовые характеристики случайных величин

Определение математического ожидания и дисперсии дискретной СВ:

n

 

n

 

 

mx pi xi

 

Dx pi xi mx 2

 

 

i 1

,

i 1

.

(3.1)

Математического ожидание (МО) СВ является главной характеристикой положения, дисперсия – рассеивания СВ.

Основные числовые характеристики положения непрерывной СВ – математическое ожидание mx (МО), медиана (Ме), мода (Мо) определяются так:

 

 

 

 

mx

x f ( x ) dx

 

 

Me

 

,

(3.2)

 

 

 

f ( x ) dx f ( x ) dx

 

 

Me

,

(3.3)

max f ( x ) f Mo .

(3.4)

Числовые характеристики рассеивания непрерывной СВ: дисперсия, среднее квадратическое отклонение (СКО), коэффифиент вариации:

11

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Dx 2

 

x mx 2 f ( x ) dx

 

 

 

 

 

 

 

 

x

 

 

,

(3.5)

 

 

 

x

 

 

Dx ,

Cv

 

 

 

 

 

 

 

 

 

mx .

 

 

(3.6)

 

 

 

 

 

 

 

 

Центральный момент s-го порядка

M X mx S

 

 

 

 

 

 

S

 

 

(3.7)

 

 

 

 

 

 

 

 

.

 

 

Коэффициент асимметрии характеризует степень симметричности

рассеяния относительно МО (см. рис. 3.1):

 

 

 

 

 

 

 

 

3

M X mx 3

 

 

1

 

3

 

 

Cs

 

 

 

 

 

 

 

x mx

 

f ( x ) dx

 

3

3

 

 

3

 

 

 

x

x

 

 

 

x

 

 

.

(3.8)

При симметричном распределении (Cs=0) Mo = Me = mx = a (см. рис. 3.1).

Рис. 3.1. Соотношение между МО, Ме, и Мо для распределения с отрицательной Cs<0 (а) и положительной Cs>0 (б) асимметрией

Как уже отмечалось, каждая случайная величина исчерпывающим образом характеризуется своим законом распределения. Аналитическим выражением закона распределения является функция распределения (дифференциальная или интегральная), которую записывают в виде параметрического выражения, где в качестве параметров обычно используют числовые характеристики случайной величины (МО, СКО и т.д.). При такой записи для каждого значения СВ соответствующее значение функции распределения однозначно определяется параметрами аналитического выражения (параметрами распределения). В гидрологической практике, как правило, рассматриваются случайные величины, функции распределения которых зависят от небольшого числа параметров - обычно двух или трех.

12

В одних ситуациях закон распределения можно вывести из теоретических соображений, в других он не известен, и аналитическое выражение функции распределения является лишь аппроксимацией истинного распределения. В последнем случае можно предложить несколько аналитических выражений. Исследователь вынужден производить выбор подходящего, опираясь на практический опыт и некоторые априорные соображения. Ниже рассматриваются аналитические функции распределения, наиболее часто используемые в практике гидрологических расчетов.

4 Равномерное и нормальное распределения случайных величин

Пусть возможные значения СВ X лежат в интервале [а, b] и нет оснований для того, чтобы отдать предпочтение какому-либо из этих значений. При этих условиях СВ X подчиняется закону равномерной плотности (рис. 4.1). Это распределение называют также равномерным или прямоугольным.

а б Рис. 4.1. Плотность (а) и функция (б) равномерного распределения СВ

Закон равномерной плотности определяется двумя параметрами: началом а и концом b интервала изменения СВ X. Дифференциальная и интегральная функция распределения определяются равенствами:

0

при x a;

 

 

при a x b;

 

f ( x ) 1 /( b a )

 

 

при x b.

(4.1)

0

0

 

при x a;

 

 

 

при a x b;

 

F( x ) ( x a ) /( b a )

 

 

 

при x b.

(4.2)

1

 

Подставляя (4.1) в (3.2) и (3.5) получим МО, дисперсию и СКО,

соответственно:

 

 

( b a )2

 

 

( b a )

 

mx a b

Dx

 

x

 

(4.3)

2 ;

 

 

12 ;

 

 

4 3 .

Медиана совпадает с МО. Закон равномерной плотности моды не имеет, так как все значения плотности вероятности равны между собой. Закон равномерной плотности играет важную роль при моделировании искусственных гидрологических рядов, поскольку значения любой случайной величины можно получить преобразованием значений СВ, равномерно распределенной на [0, 1].

13

В природе и различных областях человеческой деятельности весьма распространены СВ, представляющие собой сумму большого числа независимых или слабо зависимых СВ, дисперсии которых малы по сравнению с дисперсией всей суммы. Как следует из центральной предельной теоремы теории верочтностей, распределение таких СВ при весьма общих дополнительных условиях хорошо аппроксимируется нормальным распределением. Этим объясняется весьма широкое распространение последнего. Нормальное распределение применяется и в тех случаях, когда истинный закон распределения известен, но вычисления по нему затруднены, а аппроксимация его нормальным законом не приводит к большим ошибкам.

Плотность вероятности нормального распределения:

 

 

1

 

( x m

x

)2

 

 

f ( x )

 

 

exp

 

 

 

 

x

2

2 2

 

 

 

 

 

 

 

 

(4.4)

 

 

 

 

x

 

 

.

Нормальное распределение является двухпараметрическим, т.е. зависит от двух параметров: математического ожидания mx и среднеквадратического отклонения σx. График плотности вероятности нормального распределения представлен на рис. 4.1. Как видно на рис. 4.1, нормальное распределение является симметричным и, следовательно, для него коэффициент асимметрии равен нулю (СS = 0), а мода, медиана и МО совпадают. Область возможных значений СВ, подчиняющейся нормальному распределению – вся числовая ось

( ; ) . Интегральная функция нормального распределения имеет вид

 

 

 

1

 

 

x

 

( z m

)2

 

 

 

 

 

 

 

 

 

 

F( x )

 

 

 

 

 

 

exp

x

 

 

dz

 

 

 

 

2

2

 

 

 

x

 

 

 

 

2 x

 

 

 

 

 

 

 

 

 

 

 

 

 

.

(4.5)

 

 

 

 

 

 

 

 

 

 

Интеграл, стоящий в правой части выражения (4.5), нельзя выразить через элементарные функции, поэтому ординаты нормального закона распределения обычно представляют в виде таблиц. Чтобы не публиковать множество таблиц, для различных сочетаний тх и σх вместо СВ X рассматривают нормированную СВ t, значения которой связаны со значениями X формулой

t ( x mx ) / x .

(4.6)

В настоящее время нет необходимости пользоваться таблицами,

так как

интеграл в (4.5) может быть легко найден в любом современном математическом пакете, например, в среде Mathcad:

f ( x ) : dnorm x,m, F( x ) : pnorm x,m,

14

Рис. 4.2. Плотность f(x) и функция F(x) нормального распределения СВ при mx 0; x 0,5

Несмотря на широкое распространение, нормальное распределение не универсально. В частности, если в качестве СВ рассматривать среднегодовые расходы воды, то налицо два несоответствия: расходы воды всегда положительны, а область возможных значений для нормальной СВ определяется

интервалом ( ; ) ; для нормального закона распределения Cs = 0, а распределение среднегодовы х расходов воды (и целого ряда других гидрологических характеристик), как правило, имеет умеренную положительную асимметрию.

5 Распределение Пирсона III типа (непрерывное биномиальное распределение)

Для аппроксимации закона распределения гидрометеорологических величин с одномодальной асимметричной функцией плотности вероятности А. Фостер предложил использовать общее дифференциальное уравнение Пирсона:

dy

 

y ( z a )

 

dx

 

b0 b1z b2 z2

,

(5.1)

где Z – случайная величина, связанная с исходной СВ X соотношением

z = х /mх – 1 = k – 1;

k – модульный коэффициент; у – ордината функции плотности вероятности СВ Z; a - расстояние от центра распределения (mk) до моды (Мо); bi - параметры, изменяя которые можно получить различные типы кривых распределения.

15

Рис. 5.1. Схема построения функции плотности вероятности Пирсона III типа для случая Cs /Cv > 2 (kmin > 0)

В практике гидрологических расчетов наибольшее распространение получила кривая Пирсона III типа, для которой b2 = 0, и уравнение (5.1)

принимает вид

 

 

 

 

dy

 

y ( z a )

 

 

 

 

 

dx

b0 b1z .

(5.2)

 

Данному уравнению (5.2) соответствует целое семейство функций. Для того чтобы y(z) действительно являлась искомой функцией плотности вероятности, необходимо ввести ряд дополнительных условий:

 

 

 

 

y( z ) dz 1

; y( zmin ) 0 ;

y( ) 0 .

 

zmin

(5.3)

Интегрируя (5.2) и переходя от СВ Z к модульным коэффициентам, после ряда преобразований можно получить выражение для функции плотности

вероятности:

 

 

 

 

0

при k kmin ;

 

 

 

( k kmin ) 1

 

 

y( k )

exp k kmin

при k kmin ;

 

 

 

 

( )

 

 

 

(5.4)

где Г(α) - гамма-функция; α и β - параметры распределения, связанные с Cv и Cs случайной величины X соотношениями:

2 / Cs 2 ;

2 / Cs Cv

(5.5)

 

.

Заметим, что коэффициенты вариации и асимметрии не изменяются при замене значений СВ X на модульные коэффициенты. Минимальное значение модульного коэффициента в выражении (5.4) определяется формулой

kmin 1 2 Cv / Cs .

(5.6)

Из (5.6) следует, что

16

Cs 2 Cv при kmin 0 , Cs 2 Cv при kmin 0 ,

Cs 2 Cv при kmin 0

Таким образом, дифференциальная кривая распределения Пирсона III типа при Cs = 2Cv начинается с нуля; при Cs > 2Cv с некоторого положительного числа и, наконец, при Cs < 2Сv уходит в область отрицательных чисел.

Мода функции (5.4) при Cs < 2 выражается формулой

Mo 1 Cs Cv / 2 .

При больших значениях Cs кривая Пирсона Ш типа имеет весьма специфический вид. Из (5.5) следует, что при Cs = 2 α = 1 и функция (5.4) превращается в экспоненту, а при Cs > 2, α < 1 и функция (5.4) превращается в гиперболу.

Зная Cv и Cs, можно получить численные значения параметров kmin, α, β и записать выражение для вычисления обеспеченностей модульных коэффициентов

 

 

 

 

 

 

P( k ) y( s ) ds

 

( s kmin ) 1 exp s kmin ds

 

 

 

 

 

( )

.

(5.7)

k

 

 

k

В случае Cs = 2Сv имеем: kmin = 0, 1 / Cv2 ; (5.4), (5.7) упрощаются:

 

 

 

1

 

 

 

 

 

 

y( k )

k

exp k

P( k )

 

s 1 exp ( s ) ds

 

 

 

 

 

 

 

( )

 

 

( )

,

 

 

 

k

. (5.8)

 

 

 

 

 

 

 

Первую из формул (5.8) называют двухпараметрическим гаммараспределением. Кривая обеспеченности Пирсона Ш типа (5.7) в общем случае является трехпараметрической и однозначно определяется параметрами Сv и Cs, третий параметр mх необходимо знать для перехода от модульных коэффициентов к значениям СВ X. Кривая имеет нижний предел kmin и не ограничена верхним пределом. При Cs → 0 кривая Пирсона Ш типа стремится к нормальному распределению. Численное решение уравнений (5.7), (5.8) считалось трудоемкой задачей, поэтому ординаты кривой обеспеченности Пирсона III типа обычно представли в виде таблиц. В настоящее время для численного решения стали использовать математические пакеты, что существенно упростило задачу.

Кривая распределения Пирсона III типа имеет особое значение для гидрологов как первая кривая, широко внедренная в практику гидрологических расчетов. Впервые таблицы распределения Пирсона III типа были опубликованы А. Фостером в 1924 г.

6 Распределение Крицкого-Менкеля (трехпараметрическое гамма-распределение)

Кривая распределения вероятностей Пирсона III типа, широко используемая в прежние годы в практике гидрологических расчетов, обладает, как было показано выше, одним существенным недостатком: при Cs < 2Cv она уходит в

17

область отрицательных значений. В связи с этим неоднократно предпринимались попытки получения кривой для аппроксимации закона распределения

гидрологических величин с диапазоном изменения ( 0 x ) , и пригодной для всех реально встречающихся на практике соотношений Cs и Сv. Удачное решение этой задачи в середине сороковых годов предложили С.Н. Крицкий и М.Ф. Менкель. В качестве исходной модели они приняли кривую Пирсона III

типа при Cs = 2Cv (5.8), трансформировав аргумент z в новую переменную k = azb:

 

 

z

 

 

G( z )

 

s 1 exp ( s ) ds

 

 

 

 

 

( )

.

(6.1)

 

 

0

При этом предполагалось, что МО новой переменной равно единице, т.е.

M k M a zb 1 .

Подставляя в выражение (6.1) z (k / a)1/ b , имея в виду, что f(k)=dG(k)/dk, Крицкий и Менкель получили новое распределение с плотностью вероятности

 

 

 

 

 

k

1 / b

 

 

f ( k )

 

 

 

exp

 

k / b 1

 

 

 

 

 

 

 

 

 

 

/ b

 

 

 

 

 

a

b ( )

 

a

 

.

(6.2)

 

 

 

 

 

 

Начальный момент i-го порядка этого распределения связан с параметрами

a, α и b соотношением

 

( ib ) ai

 

 

 

 

 

i

 

M k 1

( b ) a

 

 

( ) ib

( ) b .

(6.3)

 

 

 

 

По условию М[k] = 1, приравняв (6.3) к единице, получаем выражение для а:

 

 

 

 

a

( ) b

 

 

 

 

( b ) .

(6.4)

 

 

 

 

Подставляя (6.3)

в (6.2), можно получить выражение кривой плотности

вероятности Крицкого - Менкеля, записанное через Г-функцию. Это выражение определяется двумя параметрами α и b, которые с учетом (6.2) могут быть выражены через второй и третий начальные моменты. В свою очередь, μ2 , μ3 можно выразить через Cv и Сs. Таким образом, полученное распределение будет двухпараметрическим, однако, чтобы в дальнейшем перейти от модульных коэффициентов k к искомой СВ X , необходимо знать третий параметр mx . С учетом выше сказанного описаное распределение Крицкого-Менкеля называют трехпараметрическим гамма-распределением.

Поскольку функцию обеспеченности Крицкого-Менкеля нельзя выразить через элементарные функции, ее ординаты представляют в виде таблиц (см., например, [16,20]). Таблицы составлены в модульных коэффициентах и позволяют определить значение kP% в зависимости от Cv, отношения (Cs/Сv) и расчетной обеспеченности P(%). Действующие в настоящее время в России нормативные документы [24] рекомендуют кривую Крицкого-Менкеля в качестве стандартной кривой при проведении гидрологических расчетов.

18

Вразделе II будет показано, что можно гораздо быстрее и точнее найти функцию обеспеченности Крицкого-Менкеля с помощью современных математических пакетов, например, в среде Mathcad.

Взаключение еще раз перечислим основные особенности данной кривой:

1.Кривая плотности вероятности является одномодальной с положительной асимметрией;

2.Нижним пределом кривой всегда является нуль;

3.Кривая Крицкого-Менкеля не ограничена верхним пределом;

4.При Сs = 2Сv кривая превращается в двухпараметрическое Г-распределение,

т.е. совпадает с кривой Пирсона III типа.

7 Основные задачи математической статистики

До сих пор, говоря о законах распределения случайных величин, мы не затрагивали вопроса о том, на каком основании устанавливаются эти законы распределения. Ответ на вопрос вполне определенен – в основе всех этих характеристик лежит опыт; каждое исследование случайных явлений, выполняемое методами теории вероятностей, прямо или косвенно опирается на экспериментальные данные. Каждое исследование в области случайных явлений, как бы отвлеченно оно ни было, корнями своими всегда уходит в эксперимент, в опытные данные, в систему наблюдений.

Известный математик А. Уайльд определяет математическую статистику как совокупность методов, которые дают возможность принимать оптимальные решения в условиях неопределенности. В качестве более строгого определения можно привести следующее: математическая статистика - раздел математики, посвященный математическим методам систематизации, обработки и использования статистических данных для научных и практических выводов. Фундаментальными понятиями статистической теории являются понятия

генеральной совокупности и выборки.

Генеральная совокупность обычно интерпретируется как совокупность всех возможных значений случайной величины, которые в принципе могут иметь место при данных условиях. Смысл этого понятия состоит в том, что предполагается существование некоторых вполне определенных свойств, неслучайных закономерностей, присущих данной совокупности тех свойств, которые и должны быть выяснены исследователем. Фактически эти свойства являются объективным отображением вероятностных свойств изучаемого объекта, которые могут быть охарактеризованы с помощью соответствующих законов распределения вероятностей или связанных с ними числовых параметров. Считается, что указанные свойства не изменяются во времени и присущие генеральной совокупности неслучайные закономерности сохраняют постоянным свой характер, т.е. являются устойчивыми.

Выборка - это конечный набор значений случайной величины, полученный в результате наблюдений. В гидрологии в качестве выборок можно рассматривать

19

ряды наблюдений за среднегодовыми расходами воды, максимальными и минимальными расходами и уровнями воды, среднегодовой, максимальной и минимальной температурой воздуха и т.д. Число элементов выборки называется ее объемом. Выборка называется репрезентативной, если она достаточно полно характеризует генеральную совокупность.

Все задачи математической статистики касаются вопросов обработки наблюдений над массовыми случайными явлениями, но в зависимости от характера решаемого практического вопроса и от объема имеющегося экспериментального материала эти задачи могут принимать ту или иную форму. Охарактеризуем вкратце некоторые типичные задачи математической статистики.

Задача определения закона распределения СВ (или системы СВ) по данным стучайной выборки. При обработке обширных по своему объему статистических данных часто возникает вопрос об определении законов распределения тех или иных СВ. Теоретически при достаточном количестве опытов свойственные этим СВ закономерности будут осуществляться сколь угодно точно. На практике нам всегда приходится иметь дело с ограниченным количеством экспериментальных данных; в связи с этим результаты наших наблюдений и их обработки всегда содержат больший или меньший элемент случайности. Возникает вопрос о том, какие черты наблюдаемого явления относятся к постоянным,устойчивым и действительно присущи ему, а какие являются случайными и проявляются в данной серии наблюдений только за счет ограниченного объема экспериментальных данных. Естественно, к методике обработки экспериментальных данных следует предъявить такие требования, чтобы она, по возможности,сохраняла типичные, характерные черты наблюдаемого явления и отбрасывала все несущественное, второстепенное, связанное с недостаточным объемом опытного материала. В связи с этим возникает характерная для математической статистики задача сглаживания или выравнивания статистических данных,представления их в наиболее компактном виде с помощью простых аналитических зависимостей.

Задача проверки правдоподобия гипотез. При решении такого рода задач мы обычно не располагаем настолько обширным статистическим материалом, чтобы выявляющиеся в нем статистические закономерности были в достаточной мере свободны от элементов случайности. Статистический материал может с большим или меньшим правдоподобием подтверждать или не подтверждать справедливость той или иной гипотезы. Например, может возникнуть такой вопрос: согласуются ли результаты эксперимента с гипотезой о том, что данная СВ подчинена закону распределения F(x)? Другой подобный вопрос: указывает ли наблюденная в опыте тенденция к зависимости между двумя случайными величинами на наличие действительной объективной зависимости между ними или же она объясняется случайными причинами, связанными с недостаточным объемом наблюдений? Для решения подобных вопросов математическая статистика выработала ряд специальных приемов.

Задача нахождения неизвестных параметров распределения. Часто при обработке статистического материала вовсе не возникает вопрос об определении

20