Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Шолле Ф. - Глубокое обучение на Python (Библиотека программиста) - 2023.pdf
Скачиваний:
6
Добавлен:
07.04.2024
Размер:
11.34 Mб
Скачать

14.5. Будущее глубокого обучения    569

всех полезных программ,.очень.похожее.на.непрерывное.многообразие..Это.означает,.что.модель.глубокого.обучения,.обученная.на.результатах.миллионов. успешных.попыток.генерации.программ,.может.выработать.надежное.интуитивное представление .о.пути в пространстве программ,.по.которому.должен. идти.процесс.поиска,.чтобы.перейти.от.требований.к.соответствующей.про- грамме,.—.точно.так.же.инженер-программист.может.сразу.интуитивно.понять. общую.архитектуру.сценария,.который.он.собирается.написать,.и.представить. перечень.промежуточных.функций.и.классов,.которые.нужно.использовать. в.качестве.ступенек.на.пути.к.цели.

Помните,.что.человеческое.мышление.в.значительной.мере.руководствуется. ценностно-центрической.абстракцией,.то.есть.распознаванием.образов.и.интуи- цией..То.же.относится.и.к.синтезу..Я.ожидаю,.что.подход.на.основе.обобщенного. управления.поиском.программы.с.помощью.выявленной.эвристики.будет.вы- зывать.повышенный.интерес.исследователей.в.течение.следующих.10–20.лет.

14.5.3. Непрерывное обучение и повторное использование модульных подпрограмм

Когда.модели.станут.сложнее.и.будут.основаны.на.более.насыщенных.алгоритмических.примитивах,.эта.повышенная.сложность.потребует.увеличить.степень. повторного.использования.результатов.прежних.решений.вместо.обучения. новых.моделей.с.нуля.каждый.раз,.когда.возникает.новая.задача.или.новый. набор.данных..Многие.наборы.данных.содержат.недостаточно.информации,. чтобы.мы.могли.приступить.к.созданию.новых,.сложных.моделей.с.нуля,.и.поэтому.необходимо.будет.использовать.информацию.из.прежних.наборов.данных. (представьте,.что.вам.пришлось.бы.изучать.русский.язык.с.нуля.всякий.раз,. когда.вы.открываете.новую.книгу,.—.это.было.бы.просто.невозможно)..Обучение. моделей.с.нуля.для.каждой.новой.задачи.неэффективно.также.из-за.большого. перекрытия.между.текущими.задачами.и.прежними.

В.последние.годы.неоднократно.отмечалось.интересное.наблюдение:.обучение. одной и той же.модели.для.решения.мало.связанных.между.собою.задач.дает. в.результате.модель,.которая.лучше подходит для каждой задачи..Например,.обучение.одной.и.той.же.нейронной.модели.машинного.перевода.с.английского.на. немецкий.и.с.французского.на.итальянский.дает.в.результате.модель,.которая. лучше.подходит.для.каждой.пары.языков..Аналогично.одновременное.обучение. модели.классификации.и.сегментации.изображений.с.использованием.одной. и.той.же.сверточной.основы.дает.в.результате.модель,.которая.лучше.решает. обе.задачи..Это.вполне.объяснимо:.в.малосвязанных.задачах.всегда.какая-то часть.информации.является.общей,.в.результате.объединенная.модель.получает. доступ.к.большему.объему.информации.о.каждой.отдельной.задаче,.нежели. модель,.обучаемая.для.решения.какой-то.конкретной.задачи.

570    Глава 14. Заключение

В.настоящее.время.под.повторным.использованием.моделей.в.разных.задачах. подразумевается.использование.обученных.весов.моделей,.выполняющих.универсальные.функции,.такие.как.выделение.визуальных.признаков..Пример.этого. вы.видели.в.главе.9..В.будущем.я.ожидаю,.что.в.обиход.войдет.более.обобщенная. версия:.мы.будем.использовать.не.только.ранее.извлеченные.признаки.(веса.подмоделей),.но.также.архитектуры.моделей.и.процедуры.обучения..По.мере.того. как.модели.будут.становиться.все.более.похожими.на.программы,.мы.начнем. повторно.использовать.подпрограммы,.подобно.классам.и.функциям.в.обычных. языках.программирования.

Представьте.современный.процесс.разработки.программного.обеспечения:. решив.определенную.задачу.(например,.поддержку.HTTP-запросов.в.Python),. инженер.тут.же.упаковывает.решение.в.абстрактную.библиотеку.многократного. пользования..Другие.инженеры,.столкнувшись.с.подобной.задачей.в.будущем,. смогут.отыскать.существующие.библиотеки,.загрузить.их.и.использовать.в.своих. проектах..Похожим.способом.в.будущем.системы.метаобучения.смогут.собирать. новые.программы,.просеивая.глобальную.библиотеку.высокоуровневых.блоков. многократного.пользования..Когда.система.обнаружит,.что.ей.нужны.схожие. подпрограммы.для.нескольких.разных.задач,.она.сможет.создать.абстрактную. многоразовую.версию.подпрограммы.и.сохранить.ее.в.глобальной.библиотеке. (рис..14.13)..Такие.подпрограммы.могут.быть.геометрическими.(модули.глубокого. обучения.с.предварительно.выделенными.представлениями).или.алгоритмическими.(ближе.к.библиотекам,.которыми.пользуются.современные.программисты).

Рис. 14.13. Система метаобучения, способная быстро разрабатывать модели для конкретных задач, используя примитивы многократного пользования (алгоритмические и геометрические), и таким способом достигать экстремального обобщения

14.5.Будущее глубокого обучения    571

14.5.4.Долгосрочная перспектива

Вот.какой.я.вижу.долгосрочную.перспективу.машинного.обучения.

.Модели.будут.больше.похожи.на.программы.и.будут.обладать.возможностями,.выходящими.далеко.за.рамки.непрерывных.геометрических.преобразований.входных.данных,.которые.мы.используем.в.настоящее.время.. Эти.программы,.вероятно,.будут.ближе.к.абстрактным.ментальным.моделям,. которые.люди.выстраивают.в.своем.сознании,.и.будут.способны.к.более.широкому.обобщению.благодаря.богатой.алгоритмической.природе.

.Модели.будут.сочетать.алгоритмические модули,.реализующие.возможность. формальных.рассуждений,.поиск.и.средства.абстрагирования,.с.геометрическими модулями,.обеспечивающими.неформальное.знание.и.распознавание. шаблонов..Это.позволит.достичь.сочетания.ценностно-центрической.и.про- граммно-центрической.абстракций..AlphaGo.или.искусственный.автопилот. (системы,.для.создания.которых.потребовалось.программное.обеспечение,. созданное.вручную,.и.множество.решений,.принятых.людьми).являют.собой. ранний.пример.того,.как.может.выглядеть.подобное.сочетание.символического.и.геометрического.ИИ.

.Такие.модели.будут.создаваться.автоматически,.без.участия.людей-инжене- ров,.с.использованием.модульных.компонентов,.хранящихся.в.глобальной. библиотеке.подпрограмм.многократного.пользования.—.библиотеке,.нака- пливающей.высококачественные.модели,.обученные.ранее.на.тысячах.задач. и.наборов.данных..Часто.встречающиеся.шаблоны.решений.задач.будут. идентифицироваться.системой.метаобучения,.превращаться.в.подпрограммы. многократного.пользования.—.подобно.функциям.и.классам.в.разработке. программного.обеспечения.—.и.добавляться.в.глобальную.библиотеку.

.Процесс.поиска.возможных.комбинаций.подпрограмм.для.создания.новых.моделей.будет.дискретным.процессом.поиска.(синтезом.программы),. но.управляться.он.будет.некоторой.формой.интуиции в программном пространстве,.обеспечиваемой.глубоким.обучением.

.Упомянутая.выше.глобальная.библиотека.и.связанная.с.ней.система.моделей. смогут.достичь.уровня.экстремального обобщения,.сопоставимого.с.человеческим:.для.новой.задачи.или.ситуации.система.сможет.сконструировать. новую.работающую.модель,.использовав.очень.небольшой.объем.данных,. благодаря.широте.программных.примитивов,.поддерживающих.обобщение,. и.обширному.опыту.решения.похожих.задач..Точно.так.же.люди.быстро. осваивают.новую.сложную.видеоигру,.опираясь.на.прежний.опыт.в.других. видеоиграх,.а.не.основываются.на.простом.отображении.стимулов.в.действия..

Так.происходит.потому,.что.модели,.сформированные.на.базе.предыдущего. опыта,.являются.абстрактными.и.похожими.на.программы.

.Такую.непрерывно.развивающуюся.систему.моделей.можно.рассматривать. как.общий искусственный интеллект.(Artificial.General.Intelligence,.AGI)..