- •3.8. Равномерный закон распределения
- •3.9. Показательный закон распределения
- •3.10. Нормальный закон распределения
- •3.11. Нормально распределенная случайная величина. Примеры
- •Тема 4. Элеметы математической статистики
- •4.1. Выборочный метод
- •4.2. Статистическое распределение выборки и его характеристики
- •4.3. Полигон и гистограмма
- •4.4. Точечные оценки параметров генеральной совокупности
- •4.5. Интервальная оценка (доверительный интервал) для генеральной средней
- •4.6. Доверительный интервал. Примеры
- •4.7. Понятие о критериях согласия
- •4.8. Критерий согласия Пирсона. Пример
- •Тема 5. Элементы теории корреляции
- •5.1. Виды зависимостей между случайными величинами х и у
- •5.2. Корреляционная таблица
- •5.3. Виды уравнений регрессии
- •5.4. Метод наименьших квадратов
- •5.5. Показатели тесноты корреляционной связи
- •5.6. Пример составления уравнения регрессии и оценки тесноты корреляционной связи
Тема 5. Элементы теории корреляции
5.1. Виды зависимостей между случайными величинами х и у
Х, У – количественные признаки, связанные между собой, xi, yi – их возможные значения.
Функциональная зависимость – каждому значению Х соответствует единственное значение признака У.
Статистическая зависимость – каждому значению признака Х соответствует распределение признака У.
yi |
y1 y2 … yk |
ni |
n1 n2 … nk |
Х
Корреляционная зависимость - каждому значению признака Х ставится в соответствие среднее значение признака У (условная средняя ):
. Аналогично,
– уравнение регрессии У на Х.
уравнение регрессии Х на У.
Пример 1. Площадь квадрата У есть функция от длины стороны квадрата X: У = Х2. Зависимость функциональная. Товарооборот магазина У зависит от числа торговых работников Х. Эта зависимость корреляционная.
Две основные задачи теории корреляции:
1. Определить форму корреляционной связи, т.е. определить вид уравнения регрессии.
2. Оценить тесноту корреляционной связи.
5.2. Корреляционная таблица
Все наблюдаемые значения числовых признаков X и У с соответствующими частотами записываются в так называемую корреляционную таблицу.
Пример:
Х У |
1 3 5 |
ny |
2 4 6 |
2 – 3 – 5 9 4 6 3 |
5 14 13 |
nx |
6 11 15 |
n=32 |
Числа 1, 3, 5 (вверху таблицы) показывают наблюдаемые значения признака Х. Числа 2, 4, 6 (левый столбец) показывают наблюдаемые значения признака У.
Числа внутри таблицы показывают частоту появления соответствующей пары значений (Х, У). Например, пара (1; 2) наблюдалась 2 раза, пара (3; 4) – 5 раз, пара (1; 4) не наблюдалась ни разу (соответствующие им частоты равны 0).
По данным наблюдений вычислены частоты nx, ny, n.
nx – частота появления данного значения X,
ny – частота появления данного значения У,
n – объем выборки (количество всех наблюдаемых пар (Х, У)). Так, значение Х=1 наблюдалось 2+4=6 раз, значение Х=5 наблюдалось 3+9+3=15 раз, значение y = 6 наблюдалось 4+6+3=13 раз, и т.п. Объем выборки n=6+11+15 или n=5+14+13=32. В общем виде корреляционная таблица выглядит так:
У Х |
x1 x2 … xk |
ny |
y1 y2 … ym |
n11 n12 … n1k n21 n22 … n2k ………………. nm1 nm2 … nmk |
ny1 ny2 … nym |
nx |
nx1 nx2 … nxk |
n |
nxj = n1j + n1j + … + nmj = ;
nyj = ni1 + ni2 + … + njk = ;
n = nx1 + nx2 + … + nxk = ;
n = ny1 + ny2 + … + nym = ;
Условные средние по Х:
Условные средние по У:
5.3. Виды уравнений регрессии
Вид регрессии |
Уравнение регрессии |
Сведение к линейному виду |
1. Линейная |
|
|
2. Гиперболическая |
|
|
3. Показательная |
|
|
4. Степенная |
|
|
5. Параболическая |
|
|
6. Параболическая |
|
К линейному не сводится |
В случаях 1-5 параметры линейной зависимости находятся по формулам
1-3 следующего пункта 5.4. Для случая 6 применяется непосредственно метод наименьших квадратов.