- •В.В. Нешитой
- •Введение
- •1. Основные понятия теории вероятностей и математической статистики
- •1.1. Случайные события. Испытания. Относительная частота и вероятность
- •1.2. Виды случайных событий
- •1.3. Определения вероятности
- •1.4. Основные формулы комбинаторики
- •1.5. Теорема сложения вероятностей (несовместных событий)
- •1.6. Теорема умножения вероятностей (независимых событий)
- •1.7. Закон распределения дискретной случайной величины
- •1.8. Числовые характеристики дискретной случайной величины
- •1.8.1. Математическое ожидание
- •1.8.2. Свойства математического ожидания
- •1.8.3. Дисперсия дискретной случайной величины
- •1.8.4. Свойства дисперсии
- •1.8.5. Среднее квадратическое отклонение
- •1.8.6. Одинаково распределенные взаимно независимые случайные величины
- •1.8.7. Моменты (начальные, центральные) дискретной случайной величины
- •1.10.2. Плотность распределения
- •1.11. Числовые характеристики непрерывных случайных величин
- •1.12. Примеры непрерывных распределений
- •1.12.1. Нормальный закон
- •1.12.2. Показательный закон
- •1.12.3. Закон Вейбулла
- •1.13. Элементы математической статистики
- •1.13.1. Генеральная и выборочная совокупности. Вариационный ряд. Характеристики вариационного ряда
- •1.13.2. Статистическое распределение выборки. Полигон. Гистограмма. Эмпирическая функция распределения
- •1.13.3. Статистические оценки параметров. Точность оценки, доверительная вероятность (надежность)
- •1.13.4. Метод моментов для точечной оценки параметров распределения
- •1.13.5. Метод наибольшего правдоподобия
- •2. Вероятностная модель текста и ее исследование
- •2.1. Понятие математического ожидания случайной функции, нового события и кривой роста новых событий
- •2.2. Математическое ожидание случайной функции и кривая роста новых событий. Связь с законами распределения вероятностей разных и новых событий
- •2.3. Установление статистической структуры выборки по кривой роста новых событий
- •2.4. Восстановление кривой роста новых событий по статистической структуре выборки
- •2.5. Построение систем кривых роста и непрерывных распределений новых событий
- •Построение систем кривых роста и непрерывных распределений новых событий
- •3. Обобщенные распределения. Системы непрерывных распределений
- •3.1. Методы построения обобщенных распределений
- •3.2. Построение системы непрерывных распределений методом обобщения
- •3.3. Классификация обобщенных распределений
- •Распределения группы а
- •Распределения группы б
- •Группа симметричных распределений
- •3.4. Распределения функций случайного аргумента
- •3.5. Три основные и три дополнительные системы непрерывных распределений в.Нешитого
- •3.6. Обобщение систем непрерывных распределений
- •3.6.1. Обобщение систем непрерывных распределений по первому варианту
- •Обобщение систем непрерывных распределений по первому варианту на базе четырехпараметрической плотности p(t)
- •3.6.2. Обобщение систем непрерывных распределений по второму варианту
- •Обобщение систем непрерывных распределений по второму варианту на базе четырехпараметрической плотности p(t)
- •4. Оценивание параметров обобщенных распределений. Критерии для классификации кривых. Центральная предельная теорема
- •4.1. Метод наименьших квадратов
- •Значение функции распределения f(tc)
- •4.2. Метод наибольшего правдоподобия
- •4.3. Классический метод моментов
- •4.3.3. Симметричные распределения Ic–iiIc типов
- •4.3.4. Критерии для классификации распределений по методу моментов
- •4.4. Универсальный метод моментов
- •4.4.1. Расширение трех систем непрерывных распределений
- •4.4.2. Законы распределения суммы независимых случайных величин
- •4.4.3. Центральная предельная теорема для трех систем непрерывных распределений
- •4.4.4. Законы распределения среднего выборочного
- •4.5. Устойчивый метод
- •5. Выравнивание и прогнозирование статистических распределений
- •5.1. Выбор системы непрерывных распределений для выравнивания статистических распределений
- •5.2. Вычисление выравнивающей кривой распределения по статистическим данным
- •5.2.1. Выравнивание по классическому методу моментов
- •5.2.2. Выравнивание по универсальному методу моментов
- •5.2.3. Выравнивание по устойчивому методу
- •Показатели статистического распределения (snr2v08a)
- •Распределение 3-го типа с параметрами
- •5.2.5. Выравнивающее распределение среднего выборочного
- •5.3. Прогнозирование распределений
- •5.3.1. Первая система непрерывных распределений
- •5.3.2. Вторая система непрерывных распределений
- •Распределение населения страны по среднедушевому совокупному доходу, в % к итогу (Расчет по данным обследования 90 тыс. Семейных бюджетов)
- •5.3.3. Показатели стабильности и качества выборки
- •5.4. Ранговые распределения
- •5.4.1. Форма представления ранговых распределений
- •5.4.2 Универсальный закон рассеяния публикаций
- •5.5.3. Универсальный закон старения публикаций
- •5.4.4. Ранговые распределения лексических единиц
- •6. Временные (динамические) ряды
- •6.1. Методы выделения тренда
- •6.2. Построение кривых роста для выравнивания временных рядов
- •6.2.1. Построение кривых роста с заданными свойствами
- •6.2.2. Метод обобщения
- •6.2.3. Кривые роста на базе обобщенных распределений
- •6.3. Оценивание параметров кривых роста
- •6.3.1. Уравнение прямой
- •6.3.2. Экспонента
- •6.3.3. Обобщенная кривая роста
- •6.4. Прогнозирование временных рядов
- •6.4.1. Параметрический метод прогнозирования
- •6.4.2. Непараметрический метод прогнозирования
- •Заключение
- •Приложения Приложение 1
- •Приложение 2
- •Приложение 5 Основные сведения о программах
- •Литература
- •Содержание
- •Математико-статистические
- •Методы анализа
- •В библиотечно-информационной
- •Деятельности
Показатели статистического распределения (snr2v08a)
К-во наблюдений 824
К-во интервалов 13
Ширина интервала 1
Среднее X, LOG(X) 5.287621 1.614266
Дисперсия X, LOG(X) 2.799556 .1067994
Ср. квадратич. отклонение X, LOG(X) 1.673187 .326802
Коэффициент вариации % X, LOG(X) 31.64347 20.24461
Показатель асимметрии B .026025
Показатель островершинности H 1.491061
Распределение 3-го типа с параметрами
AU = – 9.088928E-4 B = 3.820727 G = 5.17171 U = – .3448559 N= 1.263474E-3
Случайная величина X>0
P(X)=N*X^(G-1)/(1-AU*X^B)^(1–1/U)
X p(x) F(x) 1-F(x)
1 .001259 .000244 .999756
2 .021665 .008558 .991442
3 .098301 .062895 .937105
4 .214164 .219711 .780289
5 .261104 .467234 .532766
6 .200419 .704341 .295659
7 .11184 .859328 .140672
8 .052049 .938307 .061693
9 .022347 .973566 .026434
10 .009418 .988527 .011473
11 .004029 .99486 .00514
12 .001779 .997604 .002396
13 .000816 .998836 .001164
x p(x) F(x)
A 3.461031 .152336 .120441
C 4.88297 .261957 .436611
B 6.264426 .176104 .754139
Здесь уместно отметить, что использование обобщенных распределений позволяет вычислять закон распределения или наилучшее аппроксимирующее распределение, поэтому применение критериев согласия не обязательно.
5.2.4. Выравнивающее распределение суммы независимых случайных величин
Пусть распределение некоторой случайной величины Х задано таблицей (графы 1–3).
Таблица 5.2.7
Распределение случайной величины Х
Хi |
mi |
pi |
р(х) |
0 1 2 3 4 5 6 |
0 2 6 9 6 2 0 |
0 0,08 0,24 0,36 0,24 0,08 0 |
0,000074 0,076705 0,252557 0,342127 0,252557 0,076705 0,000074 |
|
Вычислим по методу моментов выравнивающее распределение.
По данным табл. 5.2.7 вычислим моменты случайной величины Х. Они равны: .
Поскольку распределение симметрично, показатель асимметрии β1=0.
Показатель островершинности
.
Предполагая, что данное распределение описывается первой системой непрерывных распределений, по методу моментов находим, что выравнивающим является распределение I типа (бeта-распределение) с параметрами
и нормирующим множителем N = 0,107546.
Распределение случайной величины Х задается плотностью
(0,068538<x<6,068538).
В табл. 5.2.7 (графа 4) приведены расчетные значения плотности р(х) при найденных оценках параметров. Они очень близки к вероятностям pi.
Пусть далее требуется найти выравнивающее распределение суммы двух независимых случайных величин Х и Y, распределения которых заданы приведенной выше табл. 5.2.7.
Эту задачу можно решить либо теоретически по правилам отыскания композиции распределений по известным плотностям слагаемых, либо эмпирически, вычислив предварительно моменты случайной величины Z=X+Y.
По формулам (4.4.33) для случайной величины Z=X+Y (здесь n=2) найдем:
Далее по формулам (4.4.34) имеем:
.
По известным моментам распределения случайной величины Z=X+Y нетрудно рассчитать параметры и нормирующий множитель выравнивающей кривой, которая тоже относится к I типу (бeта-распределение). Они равны:
.
Случайная величина Z=X+Y задана на интервале
–0,49182<Z<12,49182.
Распределение случайной величины Z=X+Y можно задать таблично. Для этого по данным табл. 5.2.7 необходимо найти все возможные значения суммы X + Y и их вероятности, которые равны произведениям вероятностей слагаемых. В табл. 5.2.8 в первых трех графах приведено распределение случайной величины Z=X+Y при условии, что Х = Y, причем случайные величины Х и Y имеют одно и то же распределение, заданное табл. 5.2.7.
Таблица 5.2.8
Распределение суммы двух независимых одинаково
распределенных случайных величин Z=X+Y
Z=X+Y |
mz |
pz |
р(z) |
1 2 3 4 5 6 7 8 9 10 11 |
– 4 24 72 132 161 132 72 24 4 – |
– 0,0064 0,0384 0,1152 0,2112 0,2576 0,2112 0,1152 0,0384 0,0064 – |
0,000209 0,005864 0,038271 0,116246 0,211528 0,255760 0,211528 0,116246 0,038271 0,005864 0,000209 |
|
|
Естественно, что моменты, вычисленные по распределению случайной величины Z, совпадают с моментами, рассчитанными ранее теоретически с помощью формул (4.4.33) по моментам случайной величины Х.
Кроме того, теоретические моменты выравнивающей кривой по четвертый порядок включительно совпадают с эмпирическими моментами, поскольку на этом равенстве основано вычисление выравнивающей кривой распределения.
Центральные моменты более высоких порядков статистического и выравнивающего распределений могут не совпадать.
Так, момент 6-го порядка случайной величины Z, рассчитанный по данным табл. 5.2.8, равен , в то время как теоретический момент 6-го порядка равен (см. формулу (4.3.9) приr = 5, γ = k, γu = 1)
,
т.е. в 1,012 раза больше эмпирического момента.
Расчетные значения плотности р(z) при найденных оценках параметров приведены в табл. 5.2.8. Они близки к соответствующим вероятностям.
Таким же путем может быть найдено распределение суммы независимых случайных величин, имеющих различные типы распределений, например, гамма и бeта-распределения.