Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

ЛР / ЛР6 / СОИ ЛР6 ОТЧЕТ

.pdf
Скачиваний:
8
Добавлен:
25.06.2023
Размер:
488.35 Кб
Скачать

ГУАП

КАФЕДРА № 41

ОТЧЕТ ЗАЩИЩЕН С ОЦЕНКОЙ

ПРЕПОДАВАТЕЛЬ

доцент

 

 

 

М.Н. Шелест

 

 

 

 

 

 

 

 

 

должность, уч. степень, звание

 

подпись, дата

 

инициалы, фамилия

ОТЧЕТ О ЛАБОРАТОРНОЙ РАБОТЕ №6

ЛИНЕЙНАЯ РЕГРЕССИЯ

по курсу: СТАТИЧЕСКАЯ ОБРАБОТКА ИНФОРМАЦИИ

РАБОТУ ВЫПОЛНИЛ

 

 

 

 

СТУДЕНТ ГР. №

22.12.2021

 

 

 

 

 

 

 

 

 

 

 

подпись, дата

 

инициалы, фамилия

Санкт-Петербург 2021

Цель работы

Ознакомиться с функцией lm() в языке программирования R. Научиться предсказывать данные, а также представлять результаты в удобном виде.

Индивидуальный вариант

Индивидуальный вариант в соответствии с таблицей 1.

Номер варианта

Название датасета

 

 

11

DAAG::cps2

 

 

Выполнение работы

 

1) Сгенерировали набор данных для моделирования, воспользовался датасетом DAAG::cps2 в соответствии с индивидуальным вариантом. Данные датасета в соответствии с рисунком 1.

Рисунок 1 – Фрагмент данных датасета DAA G::cps2

2

2) Построили график pairs.panels(dataframe) из пакета psych, который показывает как распределены значения переменных между собой попарно.

Для этого из датасета взял переменные age (хранит возраст), educ (хранит годы обучения), re78 (хранит реальную прибыль в 1978 году). Результат выполнения пункта в соответствии с рисунком 2.

Рисунок 2 – Результат выполнения пункта 2

3

3) Построили график зависимости зависимой и независимой переменных, используя функцию ggplot(). Результат выполнения в соответствии с рисунком 3.

Рисунок 3 – Результат пункта 3

4

4) Вывели summary() получившегося результата. Для этого применили линейную регрессию к данным с помощью lm(). Результат выполнения в соответствии с рисунком 4.

Рисунок 4 – Результат пункта 4

5

5) Cгенерировали новый data.frame, состоящий из одной зависимой переменной. Длина этой переменной совпадает с длиной в исходных данных.

Затем применили функцию predict. Затем отобразили предсказанные данные на графике. Результат выполнения в соответствии с рисунком 5.

Рисунок 5 – Результат пункта 5

6

6)Улучшил модель, получаемую при выполнении функции lm(),

путем использования для независимой переменной функции poly. Результат выполнения в соответствии с рисунком 6.

Рисунок 6 – Результат пункта 6

7

7) Повторим то, что делали в предыдущем пункте только для нескольких независимых переменных. Для улучшения параметров модели воспользовались функция polym(), где для корректной работы установили аргумент raw = T. Отобразили на графике зависимая/независимые переменные с добавлением линии регрессии с доверительными интервалами. Для построения графика использовал пакет ggplot2. Результат выполнения в соответствии с рисунком 7.

Рисунок 7 – Результат пункта 7

8

8) После каждого выполнения lm() мы выводили summary() – эти данные экспортировали из R в очень удобном для представления в отчете виде.

Ознакомились с пакетом stargazer. Пример представления summary в отчете в соответствии с рисунком 8.

Рисунок 8 – Результат пункта 8

Код программы целиком представлен в Приложении А.

9

Вывод

Изучили и получили навыки практического применения способов визуализации данных из выборки R, построения графиков при помощи различных библиотек.

Результатом выполнения данной работы стал программа, разработанная средствами языка R и реализующая обработку и визуализацию данных из датафрейма.

Выполнив данную работу расширил свои знания в работе с R – языком программирования для статистической обработки данных и работы с графикой.

10

Соседние файлы в папке ЛР6