Добавил:
ДонАУиГС(Бывший ДонГУУ) Менеджмент производственной сферы (МП-20) Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Компьютерный практикум Анализ данных Вариант 2 Ответ

.docx
Скачиваний:
4
Добавлен:
22.12.2021
Размер:
259.07 Кб
Скачать

МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ ДНР

ГОУ ВПО «ДОНЕЦКАЯ АКАДЕМИЯ УПРАВЛЕНИЯ И ГОСУДАРСТВЕННОЙ СЛУЖБЫ ПРИ ГЛАВЕ ДНР»

Кафедра информационных технологий

Индивидуальная работа №1

по теме: «Анализ данных в MS EXCEL»

Вариант № 2

Выполнил: студент группы МП-20

Бережная Диана

Проверил: к.э.н.,

доцент Стешенко И.В.

Донецк, 2021 год

Оглавление

1. Описание совокупности данных валовой прибыли 3

2. Оценить взаимосвязь и взаимное влияние валовой прибыли и объема продаж. 3

Парная линейная регрессия 4

Множественная линейная регрессия 5

3. График зависимостей 6

4. Функциональная зависимость 8

5. Предсказ 8

6. Тенденция 10

З адание

1. Описание совокупности данных валовой прибыли

Рис. 1 Описательная характеристика

Выполнено описание совокупности данных при помощи Анализа данных

2. Оценить взаимосвязь и взаимное влияние валовой прибыли и объема продаж.

Рис. 2 Корреляция

На рисунке 2 выполнена оценка взаимосвязи и взаимное влияние прибыли и объема производства. Прибыль и объем производства равен 0,9 что находится близко к единице, это значит, что зависимость между данными величинами почти линейная.

Рис. 3 Корреляция с учётом цены

- Коэффициент корреляции количества объема производства 1;

- Цена и объем производства слабо связаны, коэффициент равен 0,35;

- Коэффициент объема производства сильно связан с валовой прибылью и равен 0,89;

- Валовая прибыль средне связана с ценой, коэффициент корреляции 0,59;

Парная линейная регрессия

Рис.4

Стоимость помещения = 0,00027+ Общая площадь помещения

у = 0,00027х – 0,02671

Для анализа адекватности полученного уравнения линейной регрессии в MS Excel используют параметры (см. рис. 4): коэффициент множественной корреляции (множественный R); коэффициент детерминации (R-квадрат); критерий Фишера (F-статистика); критерий Стьюдента (t-статистика).

Множественной корреляции R=0,892 говорит о сильной степени связи переменных общая площадь помещения и стоимость помещения. Однако, характер этой связи пока неясен.

Величина квадрата R2(RI) составляет 79,6%, что говорит о том, что имеющиеся статистические данные с высокой степенью точности описаны полученным уравнением регрессии.

F-статистика (критерий Фишера) F=23,506; df=1,6; p=0,06629, то есть вероятность отвергнуть верную гипотезу о незначимости коэффициента при независимой переменной составляет 0,06%.

Значение t-статистики (критерий Стьюдента). В задаче 1 для свободного члена t=-2,24060; p=0,06, то есть вероятность отвергнуть верную гипотезу о незначимости свободного члена находится близко к нулю. Для коэффициента при неизвестной t=4,84831; p=0,00013, то есть вероятность отвергнуть верную гипотезу о незначимости коэффициента при неизвестной составляет 0,00013%.

Таким образом, проанализировав все четыре вышеназванных параметра можно сделать вывод об адекватности полученного уравнения линейной регрессии.

Множественная линейная регрессия

Рис.5. Множественна линейная регрессия

По этим результатам может быть построено следующее уравнение регрессии:

CP = 0,00011х1 + 0,00079х2 – 0,08488

или

y = 0,00011х1 + 0,00079х2 – 0,08488

Коэффициент множественной корреляции R =0,967 говорит о высокой степени связи переменных ЦЕНЫ и ВАЛОВОЙ ПРИБЫЛИ. Однако, характер этой связи пока неясен.

Коэффициент детерминации R2(RI) 93,6%, что говорит о том, что имеющиеся статистические данные с высокой степенью точности могут быть описаны полученным уравнением регрессии.

F-статистика. Для задачи F=29,283; df=2,4; p=0,009, вероятность отвергнуть верную гипотезу о незначимости коэффициента при независимой переменной составляет 0,009%.

t-статистика t=-4,640; p=0,009, то есть вероятность отвергнуть верную гипотезу о незначимости свободного члена практически равна нулю.

Для коэффициента при неизвестной t=1,764; p=0,152, то есть вероятность отвергнуть верную гипотезу о незначимости коэффициента при неизвестной составляет 0,15%.

Для коэффициента при неизвестной t=3,519; p=0,024, то есть вероятность отвергнуть верную гипотезу о незначимости коэффициента при неизвестной составляет 0,024%.

3. График зависимостей

Рис. 6. Линейная

Рис. 7. Полиоминальная линия тренда 4-й степени

Рис. 8. Прогнозирование

4. Функциональная зависимость

На рисунке 7 изображена полиоминальная линия тренда четвёртой степени. Эта линия тренда немногим лучше описывает процесс, чем линейная так как R2 больше приближен к единице по сравнению с линейной. А если быть точнее, то R2 =0,9.

На рисунке 8 изображена линия тренда с прогнозом для 260, 265, 270, 280 единиц объема производства. Из рисунка видно, что прогноз, который строится по предшествующим данным при увеличении общей площади помещения, показывает стабильное повышение валовой прибыли.

5. Предсказ

Рис. 9. Предсказ

Рис. 10. Формула предсказа

Рис. 11. Предсказ с учётом цены

Сравнивая рис. 9 и рис. 11 можно заметить незначительные различия в вычислениях предсказа валовой прибыли. Различия в значениях примерно составляют всего 1,0%.

Рис. 12. Формула предсказа с учётом цены

6. Тенденция

Рис. 13. Тенденция

Рис. 14. Формула тенденции

Используя массив и формулу ТЕНДЕНЦИЯ() (рис. 14) была спрогнозирована валовая прибыль с учетом цены. Также можем заметить незначительные изменения в вычислениях валовой прибыли относительно формулы ПРЕДСКАЗ().