- •Введение
- •Основные задачи математической статистики
- •2. Генеральная совокупность, выборка
- •3. Статистический ряд. Гистограмма
- •Коэффициенты соотношений заемных и собственных средств предприятий
- •Сгруппированный ряд наблюдений
- •Числовые характеристики статистического распределения. Обработка опытов
- •5. Доверительный интервал. Доверительная вероятность
- •Методы расчета сводных характеристик выборки
- •7. Проверка статистических гипотез
- •8. Сравнение двух дисперсий нормальных генеральных совокупностей
- •9. Сравнение исправленной выборочной дисперсии с гипотетической генеральной дисперсией нормальной совокупности
- •10. Выравнивание статистических рядов
- •11. Критерии согласия
- •12. Методика вычисления теоретических частот нормального распределения
- •13. Система двух случайных величин
- •13.1. Понятие о системе нескольких случайных величин
- •13.2. Закон распределения вероятностей дискретной двумерной случайной величины
- •13.3. Вероятность попадания случайной точки в полуполосу
- •13.4. Вероятность попадания случайной точки в прямоугольник
- •13.5. Плотность совместного распределения вероятностей непрерывной двумерной случайной величины (двумерная плотность вероятности)
- •13.6. Условные законы распределения составляющих системы дискретных случайных величин
- •13.7. Условное математическое ожидание
- •13.8. Числовые характеристики системы двух случайных величин. Корреляционный момент. Коэффициент корреляции
- •13.9. Линейная регрессия. Прямые линии среднеквадратической регрессии
- •14. Элементы теории корреляции
- •14.1. Отыскание параметров выборочного уравнения прямой линии среднеквадратической регрессии по несгруппированным данным
- •Вопросы для самопроверки
- •Задачи для самостоятельного решения
- •Критические точки распределения
- •Библиографический список
- •Подписано к изданию 20.11.2007 .
- •394026 Воронеж, Московский просп., 14
13.9. Линейная регрессия. Прямые линии среднеквадратической регрессии
Рассмотрим двумерную случайную величину , где X и Y – зависимые случайные величины. Представим одну из величин как функцию другой. А именно, опишем приближенно величину Y в виде линейной функции величины X (точное приближение невозможно):
,
где и - параметры, которые определяем с помощью метода наименьших квадратов.
Функцию называют «наилучшим приближением» Y по методу наименьших квадратов, если математическое ожидание принимает наименьшее возможное значение; функцию называют среднеквадратической регрессией Y на X.
Теорема. Линейная средняя квадратическая регрессия Y на X имеет вид
,
где , , , , - коэффициент корреляции величин X и Y.
Коэффициент называют коэффициентом регрессии Y на X, а прямую
называют прямой среднеквадратической регрессии Y на X.
Величину называют остаточной дисперсией случайной величины Y относительно случайной величины X .Она характеризует величину ошибки, которую допускают при замене Y линейной функцией . При r= 1 остаточная дисперсия равна нулю, то есть Y и X связаны линейной функциональной зависимостью.
Аналогично, прямая среднеквадратической регрессии X на Y
.
Если r= 1, то обе прямые регрессии совпадают.
Обе прямые регрессии проходят через точку , которую называют центром совместного распределения величин X и Y.
Если обе функции регрессии Y на X и X на Y линейны, то говорят, что X и Y связаны линейной корреляционной зависимостью.
Теорема. Если двумерная случайная величина распределена нормально, то X и Y связаны линейной корреляционной зависимостью.
Уравнения прямых регрессии совпадают с уравнениями прямых среднеквадратической регрессии
.
14. Элементы теории корреляции
Во многих задачах требуется установить и оценить зависимость изучаемой случайной величины Y от одной или нескольких других величин. Рассмотрим зависимость Y от одной случайной (или не случайной) величины X.
Две случайные величины могут быть связаны либо функциональной зависимостью, либо зависимостью другого рода, называемой статистической, либо быть независимыми.
Строго функциональная зависимость реализуется редко, так как обе величины или одна из них подвержены еще действию случайных факторов, при чем среди них могут быть и общие для обеих величин (под «общими» подразумеваются такие факторы, которые воздействуют и на X и на Y). В этом случае возникает статистическая зависимость.
Например, если Y зависит от случайных факторов , а X зависит от случайных факторов то между X и Y имеется статистическая зависимость, так как среди случайных факторов есть общие, а именно: .
Статистической называют зависимость, при которой изменение одной из величин влечет изменение распределения другой. В частности, статистическая зависимость проявляется в том, что при изменении одной из величин изменяется среднее значение другой; в этом случае статистическую зависимость называют корреляционной.
Например, пусть Y – урожай зерна, X – количество удобрений. С одинаковых по площади участков земли при равных количествах внесенных удобрений снимают различный урожай, то есть Y не является функцией от X. Это объясняется влиянием случайных факторов (осадки, температура воздуха и др.). Вместе с тем, как показывает опыт, средний урожай является функцией от количества удобрений, то есть Y связан с X корреляционной зависимостью.