- •Расчетно-графическая работа
- •Оглавление
- •Введение
- •1.1 Постановка задачи:
- •1.2 Решение:
- •1.3. Вывод
- •Часть вторая. Корреляционный анализ в системе «statistica»
- •Исходные данные
- •2.2. Решение:
- •Окно выбора переменных для построения корреляционной матрицы
- •График распределения переменной x6 от переменной x11
- •Панель Brushing 2d (Кисть)
- •График распределения переменной x6 от переменной x11 с выделенными точками, лежащими далеко от прямой
- •График распределения переменной x6 от переменной x11 после удаления выбранных точек
- •Распределения переменной x6 от переменной x11 с подписями к выбранным точкам
- •Выбор переменных для построения графиков корреляций
- •Графики корреляционных зависимостей для переменных x4, x5, x7
- •Табличное представление корреляционной матрицы для переменных x4, x5, x7
- •Корреляционная матрица парных коэффициентов корреляции для переменных x4-x7 , x10-x13
- •Корреляционная матрица частных коэффициентов корреляции
- •2.3. Вывод
- •Кластерный анализ Вариант 32
- •3.1. Постановка задачи:
- •3.2. Решение:
- •3.2.1. Период 1995-2005
- •Дендрограмма, построенная методом одиночной связи
- •Метод k-средних
- •Средние кластерные
- •3.2.2. Период 2006-2009 Иерархический метод
- •Дендрограмма, построенная методом полной связи Дендрограмма, построенная методом Варда
- •Метод k-средних
- •Заключение
- •Библиографический список
1.2 Решение:
1) Построение интервального ряда распределения
Для построения интервального ряда находим максимальный и минимальный элементы исходных данных (функции f(x), где находим макс и мин), количество интервалов с помощью формулы (1):
(1)
Находим размер интервала с помощью формулы (2):
(2)
Получаем следующие данные, представленные в Таблице 1 (округлив, получаем, что количество интервалов приблизительно равно 8):
Таблица 2- Расчет интервалов
max |
min |
кол-во инт-ов (n) |
размер инт-ла(d) |
13,92 |
12,54 |
7,6 |
0,2 |
Находим границы интервалов (a-нижняя граница интервалов; b-верхняя граница интервалов) с помощью формул (3) и (4):
(3)
(4)
И с помощью функции частота находим частоты интервалов mi,накопленные частоты mhi и среднее значение интервала xi.
Находим среднее значение интервала по формуле (5):
(5)
Результаты представлены в Таблице 3.
Таблица 3 – Расчет интервалов и частот
a (нижняя граница интер-а) |
b (верх. граница интер-а) |
частоты m(i) |
накопленные частоты m(hi) |
ср. значение интер-а x(i) |
12,44 |
12,64 |
5 |
5 |
12,54 |
12,64 |
12,84 |
12 |
17 |
12,74 |
12,84 |
13,04 |
23 |
40 |
12,94 |
13,04 |
13,24 |
27 |
67 |
13,14 |
13,24 |
13,44 |
19 |
86 |
13,34 |
13,44 |
13,64 |
6 |
92 |
13,54 |
13,64 |
13,84 |
6 |
98 |
13,74 |
13,84 |
14,04 |
2 |
100 |
13,94 |
2) Вычисление выборочных характеристик по вариационному ряду
а) Для нахождения среднего значения выборки интервального ряда необходимо найти сумму произведений mi*xi и сумму mi, а затем их поделить. ∑mi = 100, ∑mi*xi = 10361,5,= 103,515 с помощью формулы (6):
(6)
Получаем Таблицу 4:
Таблица 4 – Расчета средних значений интервалов
a (нижняя граница интер-а) |
b (верх. граница интер-а) |
частоты m(i) |
накопленные частоты m(hi) |
ср. значение интер-а x(i) |
m(i)*x(i) |
12,44 |
12,64 |
5 |
5 |
12,54 |
62,7 |
12,64 |
12,84 |
12 |
17 |
12,74 |
152,88 |
12,84 |
13,04 |
23 |
40 |
12,94 |
297,62 |
13,04 |
13,24 |
27 |
67 |
13,14 |
354,78 |
13,24 |
13,44 |
19 |
86 |
13,34 |
253,46 |
13,44 |
13,64 |
6 |
92 |
13,54 |
81,24 |
13,64 |
13,84 |
6 |
98 |
13,74 |
82,44 |
13,84 |
14,04 |
2 |
100 |
13,94 |
27,88 |
Вычислив среднее арифметическое значение, можно заметить, чтотемпа роста курса акций 100 фирм равен 13,13 %.
Для нахождения центральных моментов необходимо найти
Δi=xi-xср. (7)
Для k=1, = == 0;
Для k=2, = = 0,0979;
Для k=3, = ==0,011178;
Для k=4, = == 0,028116.
Получаем Таблицу 5.
Таблица 5 – Расчет отклонений
Отклонение дельта(i) |
дельта(i)*m(i) |
дельта(i)^2*m(i) |
дельта(i)^3*m(i) |
дельта(i)^4*m(i) |
-0,59 |
-2,95 |
1,7405 |
-1,02689 |
0,605868 |
-0,39 |
-4,68 |
1,8252 |
-0,71183 |
0,277613 |
-0,19 |
-4,37 |
0,8303 |
-0,15776 |
0,029974 |
0,01 |
0,27 |
0,0027 |
2,7E-05 |
2,7E-07 |
0,21 |
3,99 |
0,8379 |
0,175959 |
0,036951 |
0,41 |
2,46 |
1,0086 |
0,413526 |
0,169546 |
0,61 |
3,66 |
2,2326 |
1,361886 |
0,83075 |
0,81 |
1,62 |
1,3122 |
1,062882 |
0,860934 |
Сумма |
0 |
9,79 |
1,1178 |
2,811637 |
в) Дисперсия (отклонение от среднего значения) вычисляется по формуле:
(8)
Среднее квадратическое отклонение равно квадратному корню из дисперсии
S= (9)
Оно показывает, насколько сильно результат наблюдений отличается от среднего значения.
Получаем Таблицу 6:
Таблица 6 – Дисперсия и стандартное отклонение
дисперсия |
0,0979 |
ст. отклонение |
0,312889757 |
г) Коэффициент ассиметрии вычисляется по формуле:
= (10)
Он показывает степень скошенности кривой по сравнению с нормальным распределением.
Коэффициент эксцесса вычисляется по формуле:
= (11)
Он служит для характеристики крутости, островершинности, плосковершинности кривой.
Получаем Таблицу 7:
Таблица 7 – Коэффициенты асимметрии и эксцесса
Коэф. ассиметрии |
0,364913615 |
Коэф. эксцесса |
-0,066447491 |
Коэффициент асимметрии равен 0,364913615.. Это свидетельствует о правосторонней асимметрии данного распределения, т.е. более пологий спуск справа.
Коэффициент эксцесса равен -0,066447491. Это значит, что кривая, изображающая ряд распределения, по сравнению с нормальной, имеет незначительную плосковершинность, то есть, имеет более пологую вершину, чем нормальная кривая.
Медиану находим по формуле:
Me=xme+hme* (12)
нижняя граница медианного интервала;
величина медианного интервала;
сумма частот ряда;
сумма накопленных частот в интервалах предшествующих медианному;
частота медианного интервала.
Медианным интервалом является [13.24-13.04]. = 0,2.
Моду находим по значениям максимальной частоты. Максимальная частота 27, интервал [13,24-13,04], мода находится как среднее арифметическое между ними. =.13,14
Получаем Таблицу 8:
Таблица 8 – Значение медианы и моды
Медиана |
13,08444 |
Мода |
13,14 |
Коэффициент вариации показывает, насколько сильно отличается результат конкретного наблюдения от среднего значения в % - ом отношении к среднему. Он находится как отношение среднеквадратического отклонения к среднему арифметическому.
Ѵ=S/X*100% (13)
= 2,4%.
Коэффициент вариации равный 2,4% свидетельствует о небольшом уровне колебаний затрачиваемого времени на аудиторскую проверку 100 предприятий отрасли. Так как коэффициент вариации меньше 33%, следовательно, можно сделать вывод о том, что совокупность является однородной.
3) Построение графиков гистограммы, полигона и кумуляты
Чтобы построить гистограмму, надо по горизонтальной оси отложить значения интервалов, а по вертикальной оси частоту встречаемости этих значений. Высоты прямоугольников соответствуют частотам значений, построенных на соответствующих интервалах. Самый высокий столбик показывает наиболее часто встречающиеся значения, самый низкий – реже всех встречающиеся значения.
Гистограмма показывает типичные значения, особые значения, концентрацию значения и характер данных, наличие данных в определенных группах.
Рисунок 1 - Гистограмма затрачиваемого времени на аудиторскую проверку 100 предприятий отрасли
Чтобы построить кумуляту, надо по оси OX отложить варианты ряда, по оси OY - накопленные частоты. Это представится в виде перпендикуляров к оси OX, изображаемых ломаной линией и будет характеризовать процесс концентрации изучаемого явления.
Рисунок 2 - Кумулята затрачиваемого времени на аудиторскую проверку 100 предприятий отрасли
Полигон используется при изображении дискретных вариационных рядов или интервальных по серединным значениям.
Рисунок 3 - Полигон затрачиваемого времени на аудиторскую проверку 100 предприятий отрасли