Резюме (Вероятностный метод для адаптивного времени вычислений в нейронных сетях), страница 3

PDF-файл Резюме (Вероятностный метод для адаптивного времени вычислений в нейронных сетях), страница 3 Технические науки (40642): Диссертация - Аспирантура и докторантураРезюме (Вероятностный метод для адаптивного времени вычислений в нейронных сетях) - PDF, страница 3 (40642) - СтудИзба2019-05-20СтудИзба

Описание файла

Файл "Резюме" внутри архива находится в папке "Вероятностный метод для адаптивного времени вычислений в нейронных сетях". PDF-файл из архива "Вероятностный метод для адаптивного времени вычислений в нейронных сетях", который расположен в категории "". Всё это находится в предмете "технические науки" из Аспирантура и докторантура, которые можно найти в файловом архиве НИУ ВШЭ. Не смотря на прямую связь этого архива с НИУ ВШЭ, его также можно найти и в других разделах. , а ещё этот архив представляет собой кандидатскую диссертацию, поэтому ещё представлен в разделе всех диссертаций на соискание учёной степени кандидата технических наук.

Просмотр PDF-файла онлайн

Текст 3 страницы из PDF

Структурная маска перфорации содержит позиции, используемые в следующем слое пулинга максимальное число раз.Эта маска основана на наблюдении, что при некоторых параметрах слояпулинга, например, при ядре размера 3 × 3 и шаге 2 (такие параметрыприменяются в сетях Network in Network и AlexNet), различные выходы свёрточного слоя используются разное число раз. Наконец, важностная маска перфорации учитывает относительный вклад пространственных позиций в функцию потерь. Назовём важностью позиции на выходе свёрточного слоя для конкретного изображения приближение первого порядка по Тейлору абсолютной величины изменения функции потерьпри замене истинного значения в этом выходе на ноль. Важность всехвыходных позиций может быть эффективно подсчитана при помощи алгоритма обратного распространения ошибки.

Важность пространственной позиции определим как сумму важностей позиций по всем каналам,усреднённую по объектам обучающей выборки. Важностная маска перфорации содержит пространственные позиции с наибольшей важностью.На выборке ImageNet в важностной маске преобладают центральные позиции, поскольку классифицируемый объект как правило центрирован.Также автоматически появляется решётка, характерная для структурноймаски перфорации.Преимуществом перфорированного свёрточного слоя является возможность эффективной реализации, то есть получение сокращения времени вычислений, близкое к снижению числа операций.

Для этого предлагается произвести сведение вычисления слоя к матричному умножению:из входного тензора вырезаются подтензоры, соответствующие выход11тензор Uматрица данных Mтензор Vядра Kim2row=×" ′1′%1X′" Рис. 2 — Сведение вычисления свёрточного слоя к матричному умножению.ным значениям из маски перфорации, и помещаются в строки матрицыданных (см. рис. 2). Умножение матрицы данных на матрицу ядра позволяет получить точные значения свёрточного слоя в пространственных позициях из маски перфорации.

Интерполяция пропущенных значений выполняется неявно путём индексации операций чтения в следующем слое.За счёт этого метод также достигает сокращения потребляемой памяти.Экспериментальная валидация метода производится на задаче классификации изображений. Сначала предложенные виды масок перфорации сравниваются на стандартной задаче ускорения одного свёрточного слоя сети AlexNet (выборка ImageNet). Показывается, что наилучшими являются решётчатая и важностная маски перфорации.

Затем на сетиNetwork in Network (выборка CIFAR-10) демонстрируется превосходствосоотношения скорости и качества работы перфорации над более простыми базовыми методами, такими как увеличение шага свёрточного слояи уменьшение разрешения входного изображения. Наконец, перфорацияиспользуется для ускорения целых сетей AlexNet и VGG-16 на выборкеImageNet, что свидетельствует о применимости перфорации для ускорению СНС большого размера. Рассматриваемые сети можно ускорить в двараза на CPU и на GPU с увеличением ошибки не более, чем на 2,6%.

Теоретические ускорения как правило близки к эмпирическим, что доказывает эффективность предлагаемой реализации перфорированного свёрточного слоя.В третьей главе рассматривается метод пространственноадаптивного времени вычислений (ПАВВ) для остаточных сетей. Данныйметод позволяет фокусировать вычислений на важных областях изображения, рис.

3.Сначала метод адаптивного времени вычислений (АВВ) [24], предложенный ранее для РНС, применяется к остаточным сетям, распростра1224222018161412108Рис. 3 — Детектированные объекты (слева) и карта стоимости вычисленийпредлагаемого метода ПАВВ (справа) для валидационного изображениявыборки данных COCO.

Метод ПАВВ использует больше вычислений вобластях изображения, которые похожи на объект.-+ч ы56x56x256 28x28x512224x224x31я14x14x102423+ы7x7x20484Рис. 4 — Метод адаптивного времени вычислений для остаточной сетиResNet-101.нённой архитектуре СНС. Остаточная сеть состоит из остаточных модулей, функций вида U l = U l−1 + f (U l−1 ), где f (U l−1 ) –– свёрточная нейронная подсеть, называемая остаточной функцией.

Последовательностьостаточных модулей с одинаковыми размерностями выхода будем называть остаточным блоком. В методе АВВ каждый остаточный модуль дополнительно возвращает вероятность остановки, число из отрезка [0; 1].Остаточные модули и их вероятности остановки вычисляются последовательно. Как только кумулятивная сумма вероятностей остановки достигает единицы, все последующие остаточные модули в текущем блоке пропускаются. Определим распределение остановки как вычисленные вероятности остановки, где последнее значение заменено на остаток. Величина остатка выбирается исходя из условия нормировки вероятностногораспределения. Выход блока определяется как взвешенная сумма выходов остаточных модулей с весами, равными соответствующим значениям вероятности.

Наконец, вводится стоимость вычислений, равная суммечисла выполненных остаточных модулей и величины остатка. Миними13зация стоимости вычислений увеличивает вероятность остановки у всехмодулей, кроме последнего, что приводит к более ранней остановке. Стоимость вычислений используется как регуляризатор для исходной функции потерь. Описанный метод применяется к каждому остаточному блоку сети независимо, а стоимости вычислений блоков суммируются. Такимобразом, в каждом блоке выполняются лишь первые несколько модулей,рис. 4.

Доказывается, что метод АВВ обобщает модель остаточной сети.Предлагается метод ПАВВ, идея которого заключается в применении АВВ к каждой пространственной позиции блока. У каждой позиции имеется своя вероятность остановки, а выход блока в некоторой пространственной позиции определяется как взвешенная комбинация значений остаточных модулей блока в этой же позиции. Пространственная позиция остаточного модуля называется активной, если её кумулятивнаясумма вероятностей остановки не превышает единицу.

Ясно, что на выходы блока влияют лишь значения в активных позициях, поэтому разумно вычислять только эти значения. Значения остаточных функций в неактивных позициях доопределяются нулями, что эквивалентно копированию предыдущих значений. Эффективная реализация остаточного модуля, вычисляемого лишь в активных позициях, может быть осуществленапри помощи перфорированного свёрточного слоя, предложенного во второй главе, с заменой пропускаемых значений на ноль. Доказывается, чтометод ПАВВ является обобщением метода АВВ, а значит, и остаточнойсети.Для экспериментальной валидации методы АВВ и ПАВВ применяются к модели остаточной сети ResNet-101.

Описывается проблема мёртвых остаточных модулей, присущая АВВ и ПАВВ: при «неправильной»инициализации модели последние остаточные модули блоков никогда неиспользуются. Для её решения предлагается несколько эвристик инициализации.Сначала рассматривается задача классификации изображений (выборка ImageNet). В качестве базового метода для сравнения АВВ и ПАВВиспользуется неадаптивная остаточная сеть с близким числом операций сплавающей запятой. При увеличении разрешения на этапе теста, что является стандартной практикой, ПАВВ превосходит АВВ и базовые методыпо соотношению точности и числа операций.

Показано, что превосходство ПАВВ сохраняется при увеличении разрешения на этапе обучения.Далее решается задача детекции объектов на выборке COCO. В нейиспользуются изображения с высоким разрешением, например, 1000 ×14600, что значительно превосходит стандартные 224 × 224 для классификации ImageNet. Механизм ПАВВ позволяет уменьшить время вычислений для малоинформативного фона. Используется метод детекции объектов Faster R-CNN [26], в котором остаточная сеть, извлекающая признаки,заменяется на ПАВВ. Показано, что такой подход достигает лучшего соотношения между скоростью и величиной усреднённой средней точности(mean average precision, mAP) по сравнению с базовым подходом, состоящим в использовании неадаптивной модели остаточной сети ResNet дляизвлечения признаков.

Пример детекций и карты стоимости вычисленийприведён на рис. 3.В конце главы приводятся эксперименты, показывающие, что карты стоимости вычислений ПАВВ хорошо коррелируют с визуальной значимостью. Для этого используется большая выборка cat2000, полученнаяпутём демонстрации изображений людям и измерения позиций фиксаций их глаз. Целевая карта получается как сглаженная гистограмма этихпозиций.

Используются модели ПАВВ, заранее обученные на ImageNetи COCO; дообучение на задаче предсказания визуальной значимости непроводится. Однако выполняется параметрическая обработка карт стоимости вычислений, направленная на сглаживание и учёт центральногосмещения в целевых картах из выборки cat2000. Показывается преимущество обработанных карт стоимости вычислений над базовым методом,центрированной гауссианой. Таким образом ПАВВ автоматически обучается фокусироваться на тех регионах изображения, которые кажутся важными людям, что повышает интерпретируемость СНС.В четвертой главе предлагается метод вероятностного адаптивноговремени вычислений. В его основе лежит вероятностная модель, в которой дискретные латентные переменные задают число выполняемых итераций.

Свежие статьи
Популярно сейчас
Зачем заказывать выполнение своего задания, если оно уже было выполнено много много раз? Его можно просто купить или даже скачать бесплатно на СтудИзбе. Найдите нужный учебный материал у нас!
Ответы на популярные вопросы
Да! Наши авторы собирают и выкладывают те работы, которые сдаются в Вашем учебном заведении ежегодно и уже проверены преподавателями.
Да! У нас любой человек может выложить любую учебную работу и зарабатывать на её продажах! Но каждый учебный материал публикуется только после тщательной проверки администрацией.
Вернём деньги! А если быть более точными, то автору даётся немного времени на исправление, а если не исправит или выйдет время, то вернём деньги в полном объёме!
Да! На равне с готовыми студенческими работами у нас продаются услуги. Цены на услуги видны сразу, то есть Вам нужно только указать параметры и сразу можно оплачивать.
Отзывы студентов
Ставлю 10/10
Все нравится, очень удобный сайт, помогает в учебе. Кроме этого, можно заработать самому, выставляя готовые учебные материалы на продажу здесь. Рейтинги и отзывы на преподавателей очень помогают сориентироваться в начале нового семестра. Спасибо за такую функцию. Ставлю максимальную оценку.
Лучшая платформа для успешной сдачи сессии
Познакомился со СтудИзбой благодаря своему другу, очень нравится интерфейс, количество доступных файлов, цена, в общем, все прекрасно. Даже сам продаю какие-то свои работы.
Студизба ван лав ❤
Очень офигенный сайт для студентов. Много полезных учебных материалов. Пользуюсь студизбой с октября 2021 года. Серьёзных нареканий нет. Хотелось бы, что бы ввели подписочную модель и сделали материалы дешевле 300 рублей в рамках подписки бесплатными.
Отличный сайт
Лично меня всё устраивает - и покупка, и продажа; и цены, и возможность предпросмотра куска файла, и обилие бесплатных файлов (в подборках по авторам, читай, ВУЗам и факультетам). Есть определённые баги, но всё решаемо, да и администраторы реагируют в течение суток.
Маленький отзыв о большом помощнике!
Студизба спасает в те моменты, когда сроки горят, а работ накопилось достаточно. Довольно удобный сайт с простой навигацией и огромным количеством материалов.
Студ. Изба как крупнейший сборник работ для студентов
Тут дофига бывает всего полезного. Печально, что бывают предметы по которым даже одного бесплатного решения нет, но это скорее вопрос к студентам. В остальном всё здорово.
Спасательный островок
Если уже не успеваешь разобраться или застрял на каком-то задание поможет тебе быстро и недорого решить твою проблему.
Всё и так отлично
Всё очень удобно. Особенно круто, что есть система бонусов и можно выводить остатки денег. Очень много качественных бесплатных файлов.
Отзыв о системе "Студизба"
Отличная платформа для распространения работ, востребованных студентами. Хорошо налаженная и качественная работа сайта, огромная база заданий и аудитория.
Отличный помощник
Отличный сайт с кучей полезных файлов, позволяющий найти много методичек / учебников / отзывов о вузах и преподователях.
Отлично помогает студентам в любой момент для решения трудных и незамедлительных задач
Хотелось бы больше конкретной информации о преподавателях. А так в принципе хороший сайт, всегда им пользуюсь и ни разу не было желания прекратить. Хороший сайт для помощи студентам, удобный и приятный интерфейс. Из недостатков можно выделить только отсутствия небольшого количества файлов.
Спасибо за шикарный сайт
Великолепный сайт на котором студент за не большие деньги может найти помощь с дз, проектами курсовыми, лабораторными, а также узнать отзывы на преподавателей и бесплатно скачать пособия.
Популярные преподаватели
Добавляйте материалы
и зарабатывайте!
Продажи идут автоматически
5288
Авторов
на СтудИзбе
417
Средний доход
с одного платного файла
Обучение Подробнее