- •Введение
- •Основные задачи математической статистики
- •2. Генеральная совокупность, выборка
- •3. Статистический ряд. Гистограмма
- •Коэффициенты соотношений заемных и собственных средств предприятий
- •Сгруппированный ряд наблюдений
- •Числовые характеристики статистического распределения. Обработка опытов
- •5. Доверительный интервал. Доверительная вероятность
- •Методы расчета сводных характеристик выборки
- •7. Проверка статистических гипотез
- •8. Сравнение двух дисперсий нормальных генеральных совокупностей
- •9. Сравнение исправленной выборочной дисперсии с гипотетической генеральной дисперсией нормальной совокупности
- •10. Выравнивание статистических рядов
- •11. Критерии согласия
- •12. Методика вычисления теоретических частот нормального распределения
- •13. Система двух случайных величин
- •13.1. Понятие о системе нескольких случайных величин
- •13.2. Закон распределения вероятностей дискретной двумерной случайной величины
- •13.3. Вероятность попадания случайной точки в полуполосу
- •13.4. Вероятность попадания случайной точки в прямоугольник
- •13.5. Плотность совместного распределения вероятностей непрерывной двумерной случайной величины (двумерная плотность вероятности)
- •13.6. Условные законы распределения составляющих системы дискретных случайных величин
- •13.7. Условное математическое ожидание
- •13.8. Числовые характеристики системы двух случайных величин. Корреляционный момент. Коэффициент корреляции
- •13.9. Линейная регрессия. Прямые линии среднеквадратической регрессии
- •14. Элементы теории корреляции
- •14.1. Отыскание параметров выборочного уравнения прямой линии среднеквадратической регрессии по несгруппированным данным
- •Вопросы для самопроверки
- •Задачи для самостоятельного решения
- •Критические точки распределения
- •Библиографический список
- •Подписано к изданию 20.11.2007 .
- •394026 Воронеж, Московский просп., 14
Коэффициенты соотношений заемных и собственных средств предприятий
5,56 |
5,45 |
5,48 |
5,45 |
5,39 |
5,37 |
5,46 |
5,59 |
5,61 |
5,31 |
5,46 |
5,61 |
5,11 |
5,41 |
5,31 |
5,57 |
5,33 |
5,11 |
5,54 |
5,43 |
5,34 |
5,53 |
5,46 |
5,41 |
5,48 |
5,39 |
5,11 |
5,42 |
5,48 |
5,49 |
5,36 |
5,40 |
5,45 |
5,49 |
5,68 |
5,51 |
5,50 |
5,68 |
5,21 |
5,38 |
5,58 |
5,47 |
5,46 |
5,19 |
5,60 |
5,63 |
5,48 |
5,27 |
5,22 |
5,37 |
5,33 |
5,49 |
5,50 |
5,54 |
5,40 |
5,58 |
5,42 |
5,29 |
5,05 |
5,79 |
5,79 |
5,65 |
5,70 |
5,71 |
5,85 |
5,44 |
5,47 |
5,48 |
5,47 |
5,55 |
5,67 |
5,71 |
5,73 |
5,05 |
5,35 |
5,72 |
5,49 |
5,61 |
5,57 |
5,69 |
5,54 |
5,39 |
5,32 |
5,21 |
5,73 |
5,59 |
5,38 |
5,25 |
5,26 |
5,81 |
5,27 |
5,64 |
5,20 |
5,23 |
5,33 |
5,37 |
5,24 |
5,55 |
5,60 |
5,51 |
Таблица 3
Сгруппированный ряд наблюдений
Номер интервала |
Интервалы |
Середины интервалов |
|
|
|
1 |
5,05-5,15 |
5,1 |
0,05 |
0,05 |
0,5 |
2 |
5,15-5,25 |
5,2 |
0,08 |
0,13 |
0,8 |
3 |
5,25-5,35 |
5,3 |
0,12 |
0,25 |
1,2 |
4 |
5,35-5,45 |
5,4 |
0,20 |
0,45 |
2,0 |
5 |
5,45-5,55 |
5,5 |
0,26 |
0,71 |
2,6 |
6 |
5,55-5,65 |
5,6 |
0,15 |
0,86 |
1,5 |
7 |
5,65-5,75 |
5,7 |
0,10 |
0,96 |
1,0 |
8 |
5,75-5,85 |
5,8 |
0,04 |
1,00 |
0,4 |
На рис. 1, построенном по данным табл. 3, представлена гистограмма частот. Кривая соответствует плотности нормального распределения, «подобранного» к данным.
Числовые характеристики статистического распределения. Обработка опытов
Для того чтобы найти закон распределения, необходимо располагать обширным статистическим материалом, порядка нескольких сотен опытов. Однако на практике, в силу дороговизны постановки опытов, чаще приходится иметь дело с двумя – тремя десятками наблюдений, а этого не достаточно для того, чтобы найти заранее неизвестный закон распределения случайной величины. Но этот материал может быть обработан, и на его основе получены некоторые сведения о случайной величине, такие, как ее числовые характеристики: математическое ожидание, дисперсия.
С другой стороны, как часто бывает на практике, вид закона распределения заранее известен, но необходимо найти некоторые параметры, от которых он зависит, скажем, то же математическое ожидание и среднее квадратическое отклонение (для нормального закона распределения).
Рассмотрим, как найти неизвестные параметры, от которых зависит закон распределения случайной величины, по ограниченному числу опытов.
Ранее мы рассмотрели числовые характеристики случайных величин: математическое ожидание и дисперсию. Аналогичные числовые характеристики существуют и для статистических распределений. Каждой случайной величине Х соответствует ее статистическая аналогия.
Любое значение параметра, вычисленное на основе ограниченного числа опытов, всегда содержит элемент случайности. Такое приближенное, случайное значение называют оценкой параметра.
Для математического ожидания случайной величины статистической аналогией является среднее арифметическое наблюдаемых значений случайной величины:
,
где xi – значение случайной величины, наблюдаемое в i–м опыте, n - число опытов. В дальнейшем эту характеристику будем называть статистическим средним случайной величины, или выборочным средним
,
где - частота появления значения .
В дальнейшем статистические аналогии будем снабжать значком *.
Статистическая дисперсия случайной величины Х:
,
где - статистическое среднее, или выборочная дисперсия
.
Для удобства вычислений используют формулу
.
При очень большом числе опытов среднее арифметическое будет с большой вероятностью весьма близко к математическому ожиданию. Если число опытов невелико, то замена математического ожидания средним арифметическим приводит к ошибке, которая тем больше, чем меньше число опытов. Так же и с оценками других параметров. Любая из оценок случайна, и при пользовании ею неизбежны ошибки. Необходимо выбрать такую оценку, чтобы эти ошибки были по возможности минимальными.
Для того чтобы статистические оценки давали «хорошие» приближения оцениваемых параметров, они должны удовлетворять определенным требованиям.
Пусть — статистическая оценка неизвестного параметра теоретического распределения. Допустим, что по выборке объема п найдена оценка . Повторим опыт, т. е. извлечем из генеральной совокупности другую выборку того же объема и по ее данным найдем оценку . Повторяя опыт многократно, получим числа , , ..., которые, вообще говоря, различны между собой. Таким образом, оценку можно рассматривать как случайную величину, а числа , , ..., — как ее возможные значения.
Представим себе, что оценка дает приближенное значение с избытком; тогда каждое найденное по данным выборок число (i=1, 2, . . ., k) больше истинного значения . Ясно, что в этом случае и математическое ожидание (среднее значение) случайной величины больше, чем , т. е. М ( ) > 0. Очевидно, что если дает оценку с недостатком, то М ( )< 0.
Таким образом, использование статистической оценки, математическое ожидание которой не равно оцениваемому параметру, привело бы к систематическим (одного знака) ошибкам. По этой причине естественно потребовать, чтобы математическое ожидание оценки было равно оцениваемому параметру. Хотя соблюдение этого требования не устранит ошибок (одни значения больше, а другие меньше ), однако ошибки разных знаков будут встречаться одинаково часто. Иными словами, соблюдение требования М ( ) = гарантирует от получения систематических ошибок.
Несмещенной называют статистическую оценку , математическое ожидание которой равно оцениваемому параметру при любом объеме выборки, т. е. М ( ) = .
Смещенной называют оценку, математическое ожидание которой не равно оцениваемому параметру.
Однако было бы ошибочным считать, что несмещенная оценка всегда дает хорошее приближение оцениваемого параметра. Действительно, возможные значения могут быть сильно рассеяны вокруг своего среднего значения, т. е. дисперсия D ( ) может быть значительной. В этом случае найденная по данным одной выборки оценка, например , может оказаться весьма удаленной от среднего, а значит, и от самого оцениваемого параметра . Приняв в качестве приближенного значения , мы допустили бы большую ошибку. Если же потребовать, чтобы дисперсия была малой, то возможность допустить большую ошибку будет исключена. По этой причине к статистической оценке предъявляется требование эффективности.
Эффективной называют статистическую оценку, которая (при заданном объеме выборки п) имеет наименьшую возможную дисперсию.
При рассмотрении выборок большого объема (п велико!) к статистическим оценкам предъявляется требование состоятельности.
Состоятельной называют статистическую оценку, которая при п стремится по вероятности к оцениваемому параметру. Например, если дисперсия несмещенной оценки при п стремится к нулю, то такая оценка оказывается и состоятельной.
Выборочная средняя является состоятельной оценкой генерального среднего или математического ожидания, поскольку при неограниченном числе опытов выборочное среднее приближается к математическому ожиданию, и несмещенной оценкой, так как математическое ожидание от выборочной средней есть математическое ожидание случайной величины X: . При ограниченном числе опытов выборочное среднее является случайной величиной, которая, тем не менее, связана с математическим ожиданием и может дать о нем представление.
Дисперсия этой оценки равна:
.
Эффективность или неэффективность оценки зависит от вида закона распределения величины Х. Если величина Х распределена по нормальному закону, то дисперсия будет минимально возможной, то есть оценка является эффективной. Для других законов распределения это может быть не так.
Выборочная дисперсия является смещенной оценкой генеральной дисперсии. Для оценки дисперсии будем использовать так называемую «исправленную» выборочную дисперсию, которая является состоятельной и несмещенной.
= .
Оценка для дисперсии не является эффективной, однако для нормального закона распределения она является «асимптотически эффективной», то есть при увеличении n отношение дисперсии к минимально возможной неограниченно приближается к единице.
Пример. Найти выборочное среднее по выборке объема n=20:
Таблица 4
-
2560
2600
2620
2650
2700
2
3
10
4
1
Решение. Для упрощения расчетов перейдем к условным вариантам
Таблица 5
-
-60
-20
0
30
80
2
3
10
4
1
Тогда и
Замечание. В качестве числа, которое вычитывается при переходе к условным вариантам (условный нуль), обычно выбирается варианта, стоящая в середине ряда, либо та, для которой частота максимальна. В данном примере они совпадают.
Пример. Найти неисправленную выборочную дисперсию по выборке объема n=50:
Таблица 6
|
18,4 |
18,9 |
19,3 |
19,6 |
|
5 |
10 |
20 |
15 |
Решение. Перейдем к условным вариантам Тогда и
Таблица 7
-
-9
-4
0
3
5
10
20
15
Найдем выборочную дисперсию для новой варианты
Тогда, переходя к первоначальной варианте , получаем
Кроме выборочной средней и выборочной дисперсии применяются и другие характеристики вариационного ряда, такие как, мода – варианта, которая имеет наибольшую частоту, медиана – варианта, которая делит вариационный ряд на две части, равные по числу вариант и еще ряд других характеристик.