ВКР: Оптимизация эволюционного метода поиска архитектур глубоких нейросетей с использованием сжатия моделей
Описание
Аннотация
Число задач, требующих нейросетевой обработки, неуклонно растет . Уве-личиваются объемы обрабатываемых данных. Вследствие этого усложняют-ся архитектуры нейросетей, что влечет за собой большие временные затраты на их построение и обучение.
Работа посвящена оптимизации методов автоматического построения ар-хитектур глубоких нейросетей. Один из способов решения задачи определе-ния хорошей архитектуры – использование эволюционных методов поиска архитектур, предполагающих обучение популяции нейронных сетей с целью оценки их качества. Одним из таких методов является CoDeepNEAT: бла-годаря способу представления генотипов, выделяющему отдельные популя-ции для слоев сети и схем соединения слоев, он дает возможность выпол-нять поиск архитектур глубоких нейросетей. Для оптимизации эволюцион-ного поиска возможно использование MorphNet – способа автоматической оптимизации нейронных сетей, основанного на изменении размеров слоев имеющейся архитектуры. Предлагается использовать MorphNet для оптими-зации популяций нейросетей, возникающих на этапах эволюционного метода CoDeepNEAT, путем их сжатия, тем самым ускоряя поиск за счет сокраще-ния времени, необходимого на оценку качества сетей.
Предложенный подход реализован и исследован на задаче классификации изображений на кластере «Polus».
Исследования предложенного подхода показали, что разработанный ме-тод позволяет добиться ускорения по сравнению с методом CoDeepNEAT без существенных потерь в точности генерируемых сетей.
2
Содержание
1 Введение
| ................................... | |||||
| 1.1 | Цель работы | ||||
| ................................ | |||||
| 1.2 | Постановка задач | ||||
| ............................. | |||||
| 1.3 | Основные определения | ||||
| ................................ | |||||
| 1.4 | Структура работы | ||||
| | | | | | |
2 Обзор основных подходов к оптимизации архитектур нейронных сетей
| ................... | |||||||||||||
| 2.1 | Автоматическое построение архитектуры | ||||||||||||
| ................................ | |||||||||||||
| 2.1.1 | Grid Search | ||||||||||||
| .............................. | |||||||||||||
| 2.1.2 | Random Search | ||||||||||||
| ....................... | |||||||||||||
| 2.1.3 | Байесовская оптимизация | ||||||||||||
| ....................... | |||||||||||||
| 2.1.4 | Обучение с подкреплением | ||||||||||||
| ............................. | |||||||||||||
| 2.1.5 | Нейроэволюция | ||||||||||||
| .................. | |||||||||||||
| 2.2 | Оптимизация существующей архитектуры | ||||||||||||
| ............................ | |||||||||||||
| 2.2.1 | Network morphism | ||||||||||||
| ................................ | |||||||||||||
| 2.2.2 | Group Lasso | ||||||||||||
| ................................. | |||||||||||||
| 2.2.3 | MorphNet | ||||||||||||
| ...................................... | |||||||||||||
| 2.3 | Выводы | ||||||||||||
| | | | | | | | | | | | | | |
5
5
6
6
7
7
7
8
9
9
11
13
13
14
15
16
| 3 | Способы применения регуляризационной оптимизации в | ||||||||||||||||||
| 17 | |||||||||||||||||||
| CoDeepNEAT | |||||||||||||||||||
| .................. | 17 | ||||||||||||||||||
| 3.1 | Применимость в рассматриваемой задаче | ||||||||||||||||||
| ........................... | 17 | ||||||||||||||||||
| 3.2 | Особенности CoDeepNEAT | ||||||||||||||||||
| .................... | 17 | ||||||||||||||||||
| 3.3 | Эффект коэффициента регуляризации | ||||||||||||||||||
| ............................ | 18 | ||||||||||||||||||
| 3.4 | Эволюция сжатых сетей | ||||||||||||||||||
| ..................... | 19 | ||||||||||||||||||
| 3.5 | Наследование измененных генотипов | ||||||||||||||||||
| ......................... | 21 | ||||||||||||||||||
| 3.6 | Выбор оптимальной стратегии | ||||||||||||||||||
| 22 | |||||||||||||||||||
| 4 | Предлагаемый метод | ||||||||||||||||||
| ................................. | 22 | ||||||||||||||||||
| 4.1 | Описание метода | ||||||||||||||||||
| ............................. | 23 | ||||||||||||||||||
| 4.2 | Оценка эффективности | ||||||||||||||||||
| 24 | |||||||||||||||||||
| 5 | Реализация предложенного подхода | ||||||||||||||||||
| 25 | |||||||||||||||||||
| 6 | Экспериментальные исследования предложенного подхода | ||||||||||||||||||
| ............. | 25 | ||||||||||||||||||
| 6.1 | Подход к сравнению нейроэволюционных методов | ||||||||||||||||||
| ................. | 25 | ||||||||||||||||||
| 6.2 | Параметры экспериментов и конфигурации | ||||||||||||||||||
| ........................... | 26 | ||||||||||||||||||
| 6.3 | Результаты экспериментов | ||||||||||||||||||
| ...................................... | 28 | ||||||||||||||||||
| 6.4 | Выводы | ||||||||||||||||||
3
7 Заключение
8 Список литературы
29
29
4
- Введение
Задачи глубокого обучения требуют подходящей для них нейросетевой архитектуры. Нахождение хорошей архитектуры может быть непростой задачей. В последние годы активно развиваются методы автоматического построения нейросетей, особенно глубо-ких нейросетей. В этом случае временные затраты возрастают еще больше.
Для автоматизации процесса построения архитектур можно использовать нейроэ-волюционные методы. Они переносят задачу нахождения наилучшей архитектуры в область естественного отбора: нейронные сети представляются в виде генотипов, кон-курируют между собой, скрещиваются и мутируют. Таким образом находится наиболее подходящая для решения задачи архитектура.
Актуальным является разработка методов, позволяющих сократить временные рас-ходы на построение нейросетей. Методам поиска архитектур может потребоваться мно-го времени для решения задачи.
Эволюционный метод поиска архитектур предполагает обучение составляющих по-пуляцию нейронных сетей с целью оценки их приспособленности к решению задачи. MorphNet — способ автоматической оптимизации нейронных сетей, основанный на из-менении размеров слоев архитектуры с помощью регуляризации, вызывающей разре-женность. Предлагается использовать MorphNet для оптимизации популяций нейросе-тей, возникающих на этапах нейроэволюции. Сжатие архитектуры сетей, возникающих по ходу поиска, может помочь ускорить процесс. Подход MorphNet позволяет оптимизи-ровать нейронную сеть по целевому ресурсу, в качестве которого выступает количество операций с плавающей точкой. Применение соответствующего регуляризатора способ-но ускорить обучение оптимизированной сети.
1.1 Цель работы
Целью работы является оптимизация методов автоматического построения архитек-тур глубоких нейросетей. В работе рассматривается применение метода MorphNet [1] для оптимизации построения архитектур глубоких сетей с помощью нейроэволюцион-ного метода CoDeepNEAT [2] применительно к задаче классификации изображений с помощью сверточных нейронных сетей. В качестве критерия оптимизации выступает время работы нейроэволюционного метода.
1.2 Постановка задач
Задачами магистерской диссертации являются:
Характеристики ВКР
Учебное заведение
Семестр
Просмотров
1
Размер
870,5 Kb
Список файлов
Оптимизация эволюционного метода поиска архитектур глубоких нейросетей с использованием сжатия моделей.doc
Комментарии
Нет комментариев
Стань первым, кто что-нибудь напишет!
МГУ им. Ломоносова
Tortuga













