Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Шолле Ф. - Глубокое обучение на Python (Библиотека программиста) - 2023.pdf
Скачиваний:
6
Добавлен:
07.04.2024
Размер:
11.34 Mб
Скачать

184    Глава 5. Основы машинного обучения

по.оценкам,.полученным.в.прогонах.перекрестной.проверки.по.K.блокам..Обратите.внимание:.в.конечном.счете.обучению.и.оценке.подвергается.P ×K.моделей. (где.P.—.число.итераций),.что.может.быть.очень.затратным.

5.2.2. Выбор базового уровня

Кроме.различных.протоколов.оценки,.необходимо.также.иметь.базовый.уровень,. на.который.можно.опереться.

Обучение.модели.глубокого.обучения.немного.напоминает.пуск.ракеты,.находящейся.в.параллельном.мире,.нажатием.кнопки..Вы.не.слышите.и.не.видите,.как. ракета.взлетает..Вы.не.можете.наблюдать.многогранный.процесс.обучения.—.он. протекает.в.пространстве.с.тысячами.измерений,.и.даже.если.спроецировать. процесс.в.привычное.трехмерное.представление,.вы.все.равно.не.сможете.его. интерпретировать..Единственная.обратная.связь,.которая.у.вас.есть,.—.это.ваши. проверочные.метрики,.например.высотомер.на.невидимой.ракете.

Очень.важно.знать,.оторвалась.ли.ракета.от.поверхности.земли.в.принципе.. На.какой.высоте.был.произведен.пуск?.Ваша.модель.показывает.точность. 15.%.—.но.как.понять,.хорошо.это.или.плохо?.Прежде.чем.начать.работу.с.на- бором.данных,.всегда.нужно.выбрать.тривиальный.базовый.уровень,.который.вы. должны.превзойти..Перейдя.поставленную.черту,.вы.будете.знать,.что.движетесь. в.правильном.направлении:.ваша.модель.действительно.использует.информацию.из.входных.данных.и.генерирует.обобщающие.прогнозы..Таким.базовым. уровнем.может.быть.результат.случайного.классификатора.или.простейшего. метода,.не.имеющего.отношения.к.машинному.обучению.

Например,.в.задаче.классификации.цифр.из.набора.MNIST.простым.базовым. уровнем.мог.бы.быть.случайный.классификатор,.показывающий.точность.0,1. на.проверочных.данных;.в.задаче.IMDB.такой.же.классификатор.даст.точность. на.проверочных.данных.на.уровне.0,5..В.задаче.с.Reuters.базовая.точность.со- ставит.примерно.0,18–0,19.из-за.несбалансированности.классов..При.бинарной. классификации,.когда.90.%.образцов.принадлежат.классу.A.и.10.%.—.классу.B,. классификатор,.всегда.прогнозирующий.A,.уже.будет.иметь.точность.0,9.на. проверочных.данных.—.вашей.целью.будет.превзойти.этот.уровень.

Базовый.уровень,.на.который.можно.сослаться,.имеет.большое.значение,.когда. вы.начинаете.работу.над.задачей,.которую.прежде.никто.не.решал..Если.вы. не.можете.превзойти.тривиальное.решение,.ваша.модель.бесполезна.—.может,. вы.используете.неправильную.модель.или.задача.вообще.не.может.быть.решена. с.помощью.машинного.обучения..В.таком.случае.пора.вернуться.к.чертежной. доске.