Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
352.doc
Скачиваний:
13
Добавлен:
30.04.2022
Размер:
2.75 Mб
Скачать

13.9. Линейная регрессия. Прямые линии среднеквадратической регрессии

Рассмотрим двумерную случайную величину , где X и Y – зависимые случайные величины. Представим одну из величин как функцию другой. А именно, опишем приближенно величину Y в виде линейной функции величины X (точное приближение невозможно):

,

где и - параметры, которые определяем с помощью метода наименьших квадратов.

Функцию называют «наилучшим приближением» Y по методу наименьших квадратов, если математическое ожидание принимает наименьшее возможное значение; функцию называют среднеквадратической регрессией Y на X.

Теорема. Линейная средняя квадратическая регрессия Y на X имеет вид

,

где , , , , - коэффициент корреляции величин X и Y.

Коэффициент называют коэффициентом регрессии Y на X, а прямую

называют прямой среднеквадратической регрессии Y на X.

Величину называют остаточной дисперсией случайной величины Y относительно случайной величины X .Она характеризует величину ошибки, которую допускают при замене Y линейной функцией . При r= 1 остаточная дисперсия равна нулю, то есть Y и X связаны линейной функциональной зависимостью.

Аналогично, прямая среднеквадратической регрессии X на Y

.

Если r= 1, то обе прямые регрессии совпадают.

Обе прямые регрессии проходят через точку , которую называют центром совместного распределения величин X и Y.

Если обе функции регрессии Y на X и X на Y линейны, то говорят, что X и Y связаны линейной корреляционной зависимостью.

Теорема. Если двумерная случайная величина распределена нормально, то X и Y связаны линейной корреляционной зависимостью.

Уравнения прямых регрессии совпадают с уравнениями прямых среднеквадратической регрессии

.

14. Элементы теории корреляции

Во многих задачах требуется установить и оценить зависимость изучаемой случайной величины Y от одной или нескольких других величин. Рассмотрим зависимость Y от одной случайной (или не случайной) величины X.

Две случайные величины могут быть связаны либо функциональной зависимостью, либо зависимостью другого рода, называемой статистической, либо быть независимыми.

Строго функциональная зависимость реализуется редко, так как обе величины или одна из них подвержены еще действию случайных факторов, при чем среди них могут быть и общие для обеих величин (под «общими» подразумеваются такие факторы, которые воздействуют и на X и на Y). В этом случае возникает статистическая зависимость.

Например, если Y зависит от случайных факторов , а X зависит от случайных факторов то между X и Y имеется статистическая зависимость, так как среди случайных факторов есть общие, а именно: .

Статистической называют зависимость, при которой изменение одной из величин влечет изменение распределения другой. В частности, статистическая зависимость проявляется в том, что при изменении одной из величин изменяется среднее значение другой; в этом случае статистическую зависимость называют корреляционной.

Например, пусть Y – урожай зерна, X – количество удобрений. С одинаковых по площади участков земли при равных количествах внесенных удобрений снимают различный урожай, то есть Y не является функцией от X. Это объясняется влиянием случайных факторов (осадки, температура воздуха и др.). Вместе с тем, как показывает опыт, средний урожай является функцией от количества удобрений, то есть Y связан с X корреляционной зависимостью.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]