4.9.3. Алгоритм каскадной корреляции Фальмана

Адекватный выбор количества нейронов и слоев — серьезная и нерешенная проблема для нейронных сетей. Основным способом выбора остается прямой перебор различного количества слоев и определение лучшего. Для этого требуется каждый раз по-новому создавать сеть. Информация, накопленная в предыдущих сеансах обучения, теряется полностью. Начинать перебор количества нейронов можно как с заведомо избыточного, так и с недостаточного. Независимо от этого новая созданная сеть с другим количеством нейронов требует полного переобучения.

Динамическое добавление нейронов состоит во включении нейронов в действующую сеть без утраты ее параметров и частично сохраняет результаты, полученные в предыдущем обучении. Сеть начинает обучение с количеством нейронов, заведомо недостаточным для решения задачи. Для обучения используются обычные методы. Обучение происходит до тех пор, пока ошибка не перестанет убывать и не выполнится условие

, (4.8)

где t - время обучения; - пороговое значение убыли ошибки; - минимальный интервал времени обучения между добавлениями новых нейронов; t₀ - момент времени последнего добавления. Когда выполняются оба условия, добавляется новый нейрон. Веса и порог нейрона инициализируются небольшими случайными числами. Обучение снова повторяется до тех пор, пока не будут выполнены условия (4.4). График типичной зависимости ошибки от времени обучения приведен на рис.4.19.

Моменты добавления новых нейронов отмечены пунктиром. После каждого добавления ошибка сначала резко возрастает, так как параметры нейрона случайны, а затем быстро сходится к меньшему значению.

Численные эксперименты показали, что погрешность обучения при увеличении количества итераций монотонно уменьшается, тогда как погрешность обобщения снижается только до определенного момента, после чего начинает расти. График типичной динамики этих показателей представлен на рис. 4.20, где погрешность обучения E_L обозначена сплошной, а погрешность обобщения E_G пунктирной линией.

Приведенный график показывает, что слишком долгое обучение может привести к "переобучению" сети, которое выражается в слишком детальной адаптации весов к несущественным флуктуациям обучающих данных.

Такая ситуация имеет место при использовании сети с чрезмерным (по сравнению с необходимым) количеством весов, и она тем более заметна, чем больше "лишних" весов содержит сеть. Излишние веса адаптируются к любым нерегулярностям обучающих данных, которые воспринимают их в качестве важных.

Как следствие, на этапе тестирования они становятся причиной возникновения значительных погрешностей воспроизведения.

Для предупреждения переобучения в обучающем множестве выделяется область контрольных данных (подмножество V на рис. 4.15), которые в процессе обучения применяются для оперативной проверки фактически набранного уровня обобщения.

Обучение прекращается, когда погрешность обобщения на этом подмножестве достигнет минимального значения (или начнет возрастать).

<<< < Предыдущая 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 2930 / 3830 31 32 33 34 35 36 37 38 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
01.05.20224.14 Mб7Учебное пособие 700378.doc
#
01.05.20224.16 Mб7Учебное пособие 700379.doc
#
01.05.2022242.69 Кб2Учебное пособие 70038.doc
#
01.05.20224.16 Mб11Учебное пособие 700380.doc
#
01.05.20224.24 Mб3Учебное пособие 700381.doc
#
01.05.20224.28 Mб13Учебное пособие 700382.doc
#
01.05.20224.33 Mб15Учебное пособие 700383.doc
#
01.05.20224.36 Mб5Учебное пособие 700384.doc
#
01.05.20224.4 Mб3Учебное пособие 700385.doc
#
01.05.20224.42 Mб9Учебное пособие 700386.doc
#
01.05.20224.43 Mб4Учебное пособие 700387.doc