- •В.В. Нешитой
- •Введение
- •1. Основные понятия теории вероятностей и математической статистики
- •1.1. Случайные события. Испытания. Относительная частота и вероятность
- •1.2. Виды случайных событий
- •1.3. Определения вероятности
- •1.4. Основные формулы комбинаторики
- •1.5. Теорема сложения вероятностей (несовместных событий)
- •1.6. Теорема умножения вероятностей (независимых событий)
- •1.7. Закон распределения дискретной случайной величины
- •1.8. Числовые характеристики дискретной случайной величины
- •1.8.1. Математическое ожидание
- •1.8.2. Свойства математического ожидания
- •1.8.3. Дисперсия дискретной случайной величины
- •1.8.4. Свойства дисперсии
- •1.8.5. Среднее квадратическое отклонение
- •1.8.6. Одинаково распределенные взаимно независимые случайные величины
- •1.8.7. Моменты (начальные, центральные) дискретной случайной величины
- •1.10.2. Плотность распределения
- •1.11. Числовые характеристики непрерывных случайных величин
- •1.12. Примеры непрерывных распределений
- •1.12.1. Нормальный закон
- •1.12.2. Показательный закон
- •1.12.3. Закон Вейбулла
- •1.13. Элементы математической статистики
- •1.13.1. Генеральная и выборочная совокупности. Вариационный ряд. Характеристики вариационного ряда
- •1.13.2. Статистическое распределение выборки. Полигон. Гистограмма. Эмпирическая функция распределения
- •1.13.3. Статистические оценки параметров. Точность оценки, доверительная вероятность (надежность)
- •1.13.4. Метод моментов для точечной оценки параметров распределения
- •1.13.5. Метод наибольшего правдоподобия
- •2. Вероятностная модель текста и ее исследование
- •2.1. Понятие математического ожидания случайной функции, нового события и кривой роста новых событий
- •2.2. Математическое ожидание случайной функции и кривая роста новых событий. Связь с законами распределения вероятностей разных и новых событий
- •2.3. Установление статистической структуры выборки по кривой роста новых событий
- •2.4. Восстановление кривой роста новых событий по статистической структуре выборки
- •2.5. Построение систем кривых роста и непрерывных распределений новых событий
- •Построение систем кривых роста и непрерывных распределений новых событий
- •3. Обобщенные распределения. Системы непрерывных распределений
- •3.1. Методы построения обобщенных распределений
- •3.2. Построение системы непрерывных распределений методом обобщения
- •3.3. Классификация обобщенных распределений
- •Распределения группы а
- •Распределения группы б
- •Группа симметричных распределений
- •3.4. Распределения функций случайного аргумента
- •3.5. Три основные и три дополнительные системы непрерывных распределений в.Нешитого
- •3.6. Обобщение систем непрерывных распределений
- •3.6.1. Обобщение систем непрерывных распределений по первому варианту
- •Обобщение систем непрерывных распределений по первому варианту на базе четырехпараметрической плотности p(t)
- •3.6.2. Обобщение систем непрерывных распределений по второму варианту
- •Обобщение систем непрерывных распределений по второму варианту на базе четырехпараметрической плотности p(t)
- •4. Оценивание параметров обобщенных распределений. Критерии для классификации кривых. Центральная предельная теорема
- •4.1. Метод наименьших квадратов
- •Значение функции распределения f(tc)
- •4.2. Метод наибольшего правдоподобия
- •4.3. Классический метод моментов
- •4.3.3. Симметричные распределения Ic–iiIc типов
- •4.3.4. Критерии для классификации распределений по методу моментов
- •4.4. Универсальный метод моментов
- •4.4.1. Расширение трех систем непрерывных распределений
- •4.4.2. Законы распределения суммы независимых случайных величин
- •4.4.3. Центральная предельная теорема для трех систем непрерывных распределений
- •4.4.4. Законы распределения среднего выборочного
- •4.5. Устойчивый метод
- •5. Выравнивание и прогнозирование статистических распределений
- •5.1. Выбор системы непрерывных распределений для выравнивания статистических распределений
- •5.2. Вычисление выравнивающей кривой распределения по статистическим данным
- •5.2.1. Выравнивание по классическому методу моментов
- •5.2.2. Выравнивание по универсальному методу моментов
- •5.2.3. Выравнивание по устойчивому методу
- •Показатели статистического распределения (snr2v08a)
- •Распределение 3-го типа с параметрами
- •5.2.5. Выравнивающее распределение среднего выборочного
- •5.3. Прогнозирование распределений
- •5.3.1. Первая система непрерывных распределений
- •5.3.2. Вторая система непрерывных распределений
- •Распределение населения страны по среднедушевому совокупному доходу, в % к итогу (Расчет по данным обследования 90 тыс. Семейных бюджетов)
- •5.3.3. Показатели стабильности и качества выборки
- •5.4. Ранговые распределения
- •5.4.1. Форма представления ранговых распределений
- •5.4.2 Универсальный закон рассеяния публикаций
- •5.5.3. Универсальный закон старения публикаций
- •5.4.4. Ранговые распределения лексических единиц
- •6. Временные (динамические) ряды
- •6.1. Методы выделения тренда
- •6.2. Построение кривых роста для выравнивания временных рядов
- •6.2.1. Построение кривых роста с заданными свойствами
- •6.2.2. Метод обобщения
- •6.2.3. Кривые роста на базе обобщенных распределений
- •6.3. Оценивание параметров кривых роста
- •6.3.1. Уравнение прямой
- •6.3.2. Экспонента
- •6.3.3. Обобщенная кривая роста
- •6.4. Прогнозирование временных рядов
- •6.4.1. Параметрический метод прогнозирования
- •6.4.2. Непараметрический метод прогнозирования
- •Заключение
- •Приложения Приложение 1
- •Приложение 2
- •Приложение 5 Основные сведения о программах
- •Литература
- •Содержание
- •Математико-статистические
- •Методы анализа
- •В библиотечно-информационной
- •Деятельности
5.2.3. Выравнивание по устойчивому методу
Рассмотрим примеры на выравнивание статистических распределений с помощью первой и второй систем непрерывных распределений и компьютерных программ SNR1V97, SNR2V97 и SNR2V08A.
Пример 1. На основании статистических данных о распределении предела прочности на растяжение портландцементного раствора 28-дневного возраста (см. табл. 5.2.3) найдем по формулам (4.5.13), справедливым для первой системы непрерывных распределений, статистические показатели
.
Приравнивая эти показатели соответствующим теоретическим, по номограмме (приложение 3) устанавливаем, что выравнивающее распределение относится ко II′ типу, поскольку показатель асимметрии . Первое приближение параметра(по номограмме). Программа SNR1V97 дает:k = 18,078269.
Теперь нетрудно вычислить оценки параметров β, γ, α и нормирующего множителя N. Используя формулы
,
справедливые для распределений II′ типа, найдем:
.
Выравнивающее распределение задается плотностью
.
Если теперь рассчитать значения плотности распределения в серединах интервалов и вычислить критерий согласия К. Пирсона, то получим:. При числе степеней свободыr=10–3–1=6 это соответствует вероятности , т.е. нет оснований для отклонения гипотезы о согласии выравнивающего распределения со статистическим.
Напомним, что при выравнивании по классическому методу моментов была получена вероятность , при этом выравнивающее распределение относилось к типу I с параметромβ=1.
Если вычислить по программе нижнюю и верхнюю границы доверительного интервала приР = 0,9545, то получим: хн=17,15092; хв = 25,05979. Ширина доверительного интервала равна 7,908873 и составляет 4,071323 средних квадратических отклонений. Эти данные близки к результатам, полученным ранее по классическому методу моментов.
Пример 2. На основании статистических данных о распределении предела прочности на сжатие портландцементного раствора 28-дневного возраста (см. табл. 5.2.5) найдем статистические показатели (для первой системы непрерывных распределений):
Приравнивая их теоретическим, по номограмме (приложение 3) устанавливаем, что выравнивающее распределение относится к III типу. Поскольку показатель асимметрии В* < 0, то вначале при условии В* > 0 находим оценки параметров k′, u, затем вычисляем оценку параметра k по формуле .
Итак, в первом приближении из номограммы находим: . После уточнения по методу Ньютона (по программе) имеем:u = – 0,1301965; k′ = 3,574764. Тогда k = 5,105934.
Оценки параметров β, γ, произведения αu и нормирующего множителя N рассчитываются по формулам
,
справедливым для распределений III типа. В результате вычислений по той же программе получим:
.
Выравнивающее распределение задается плотностью
.
В данном примере критерий, что соответствуетвероятности (при числе степеней свободыr = 11– 4 – 1 = 6).
Нижняя и верхняя границы доверительного интервала при P = 0,9545 равны: xн = 248,2865; xв = 388,6001. Ширина интервала равна 140,3137 и составляет 3,999015 средних квадратических отклонений.
Эти данные близки к результатам, полученным выше по универсальному методу моментов.
Пример 3. Рассмотрим распределение по длине моделей терминов по философии [7]. Статистические данные приведены в таблице 5.2.6.
Поскольку длина термина – целое положительное число, то приведенное в таблице статистическое распределение может быть аппроксимировано второй системой непрерывных распределений. Воспользуемся в данном случае компьютерной программой SNR2V08A.
После ввода статистических данных получим таблицу ПОКАЗАТЕЛЕЙ СТАТИСТИЧЕСКОГО РАСПРЕДЕЛЕНИЯ (см. ниже). В ней наряду с другими приведены показатели асимметрии В и островершинности Н и соответствующие этим показателям тип аппроксимирующего распределения и оценки его параметров.
Выбирая далее из меню ВИД РАСЧЕТА пункты: 1 – плотности вероятностей и функции распределения, 6 – координат моды С и точек перегиба А, В, – получим соответствующие расчетные значения.
Программа строит также кривую распределения. Но ниже приведены графики, построенные в Excel. Из рисунка видно, что статистическая и выравнивающая кривые близки между собой.
Таблица 5.2.6
Число слов в модели |
Число моделей с данным к-вом слов |
Относ. частота pi = mi/M | |
1 |
1 |
|
0.001214 |
2 |
19 |
|
0.023058 |
3 |
78 |
|
0.094660 |
4 |
181 |
|
0.219660 |
5 |
209 |
|
0.253640 |
6 |
172 |
|
0.208738 |
7 |
86 |
|
0.104369 |
8 |
45 |
|
0.054612 |
9 |
19 |
|
0.023058 |
10 |
8 |
|
0.009709 |
11 |
3 |
|
0.003641 |
12 |
2 |
|
0.002427 |
13 |
1 |
|
0.001214 |
|
М = 824 |
|
1 |