Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
40_алгоритмов_Python.pdf
Скачиваний:
8
Добавлен:
07.04.2024
Размер:
13.02 Mб
Скачать

228

Глава 7. Традиционные алгоритмы обучения с учителем

zz Она плохо справляется с пропущенными значениями. zz Она делает предположения относительно данных.

Алгоритм дерева регрессии

Алгоритм дерева регрессии (regression tree algorithm) аналогичен алгоритму дерева классификации, за исключением того, что целевая переменная является непрерывной переменной, а не категориальной.

Использование алгоритма дерева регрессии в задаче регрессии

В этом разделе мы увидим, как алгоритм дерева регрессии может быть исполь­ зован в решении задачи регрессии.

1. Сначала обучим модель, используя алгоритм дерева регрессии (рис. 7.29).

Рис. 7.29

2.Как только модель дерева регрессии будет обучена, используем ее для пред­ сказания значений:

y_pred = regressor.predict(X_test)

3. Вычислим RMSE для количественной оценки производительности модели:

from sklearn.metrics import mean_squared_error from math import sqrt sqrt(mean_squared_error(y_test, y_pred))

Получим следующий результат (рис. 7.30).

Рис. 7.30

Алгоритмы регрессии

229

Алгоритм градиентного бустинга для регрессии

Теперь попробуем применить для регрессии алгоритм градиентного бустинга. Он использует ансамбль деревьев решений, чтобы наилучшим образом выявить основные закономерности в данных.

Использование градиентного бустинга в задаче регрессии

В этом разделе мы выясним, как применить алгоритм градиентного бустинга в задаче регрессии.

1. Сначала обучим модель, используя градиентный бустинг (рис. 7.31).

Рис. 7.31

2. Как только модель обучена, используем ее для предсказания значений:

y_pred = regressor.predict(X_test)

3. Рассчитаем RMSE для количественной оценки производительности модели:

from sklearn.metrics import mean_squared_error from math import sqrt sqrt(mean_squared_error(y_test, y_pred))

4. Запустив код, получаем на выходе следующее значение (рис. 7.32).

Рис. 7.32