Диссертация (Оптимизация размещения массивов в общей памяти), страница 4

PDF-файл Диссертация (Оптимизация размещения массивов в общей памяти), страница 4 Физико-математические науки (48659): Диссертация - Аспирантура и докторантураДиссертация (Оптимизация размещения массивов в общей памяти) - PDF, страница 4 (48659) - СтудИзба2019-06-29СтудИзба

Описание файла

Файл "Диссертация" внутри архива находится в папке "Оптимизация размещения массивов в общей памяти". PDF-файл из архива "Оптимизация размещения массивов в общей памяти", который расположен в категории "". Всё это находится в предмете "физико-математические науки" из Аспирантура и докторантура, которые можно найти в файловом архиве СПбГУ. Не смотря на прямую связь этого архива с СПбГУ, его также можно найти и в других разделах. , а ещё этот архив представляет собой кандидатскую диссертацию, поэтому ещё представлен в разделе всех диссертаций на соискание учёной степени кандидата физико-математических наук.

Просмотр PDF-файла онлайн

Текст 4 страницы из PDF

В процессе трансляции виртуального адреса в физический, нужноопределить физический адрес виртуальной страницы, в которой он находится, иприбавить к нему смещение относительно начала страница. Таким образом, приобращении к данным, находящимся в одной виртуальной странице происходиттолько одна операция трансляции виртуального адреса в физический адрес.В современных вычислительных системах производится кешированиерезультатов трансляции адресов наиболее часто используемых виртуальныхстраниц. Устройство, в котором хранятся результаты трансляции адресоввиртуальных страниц, называется кеш-памятью TLB (или буфером ассоциативнойтрансляции).

Перед трансляцией адреса виртуальной страницы в физическийадрес производится проверка на его наличие в кеш-памяти TLB. Если адресвиртуальной страницы найден в кеш-памяти TLB, то такая ситуация называетсяпопаданием в кеш-память TLB. При попадании в кеш-память TLB трансляцияадреса виртуальной страницы не производится. В случае, если искомый адресвиртуальной страницы не найден в кеш-памяти TLB, то возникает ситуацияпромаха к кеш-памяти TLB, и начинается процесс трансляции виртуальногоадреса в физический. Ввиду того, что размер кеш-памяти TLB невелик (128-51221записей), физически он часто реализуется в виде полностью ассоциативной кешпамяти. Особенностью кеш-памяти TLB является то, что при обработке промаха ккеш-памяти TLB процессор не может выполнять другие инструкции и находится всостоянии ожидания.

Более того время обработки промаха к кеш-памяти TLB внесколько раз больше чем время обработки промаха к кеш-памяти.1.2.Увеличение временной локальности данных. Метод тайлинга.Большинствосовременныхпроцессоровспособныэффективнозадействовать кеш-память при выполнении программ, имеющих высокуювременную локальность данных [4]. Временная локальность данных заключаетсяв повторном использовании одних и тех же данных за короткий промежутоквремени.

Если программа имеет высокую временную локальность данных, тоданные, к которым производится повторное обращение, не успевают вытеснятьсяиз кеш-памяти. В результате количество обращений к основной памятиснижается.Одним из основных способов увеличения временной локальности данныхявляется метод тайлинга (tiling) [6], [2], [3]. Тайлинг [78] – это преобразованиеалгоритмадляполучениямакроопераций.Получаемыеврезультатепреобразования макрооперации называются зерном вычислений или тайла.Множество операций алгоритма, составляющих зерно вычислений, выполняетсяатомарно, как одна единица вычислений.При использовании тайлинга возникает проблема выбора оптимальногоразмера блока, при котором блочная программа будет работать максимальнобыстро.

Существуют алгоритмы ([7]), которые асимптотически максимальноэффективно используют кеш-память без учета точных размеров кеш-памяти икеш-линеек. Их преимуществом является то, что они легко переносимы на разныевычислительные системы, поддерживающие кеш-память. Тем не менее былопоказано [8], что такие алгоритмы имеет меньшую производительность чемалгоритмы, в которых параметры кеш-памяти используются явно.22В качестве примера использования тайлинга рассмотрим задачу умноженияматриц.Листинг 1. Стандартный алгоритм умножения матрицfor (i=0; i<N; ++i)for (k=0; k<N; ++k)for (j=0; j<N; ++j)C[i][j] = C[i][j] + A[i][k] * B[k][j];Результатом применения тайлинга является следующий блок кода:Листинг 2. Блочное умножение матриц.for (ii = 0; ii < SIZE; ii += BLOCK_SIZE)for (kk = 0; kk < SIZE; kk += BLOCK_SIZE)for (jj = 0; jj < SIZE; jj += BLOCK_SIZE)for (i = ii; i < ii + BLOCK_SIZE && i < SIZE; i++)for (k = kk; k < kk + BLOCK_SIZE && k < SIZE; k++)for (j = jj; j < jj + BLOCK_SIZE && j < SIZE; j++)C[i][j] = C[i][j] + A[i][k] * B[k][j];Впервые тайлинг был использован в середине 80-х годов [5].

В статьеподчеркивается, что использование тайлинга в последние десятилетия сталокритически важным для достижения высокой производительности программлинейной алгебры.Недостатком тайлинга является то, что при его использовании меняетсяпорядок выполнения операций. Поэтому не всегда очевидно, является ли блочнаяпрограмма эквивалентной исходной.Количество умножений в стандартном алгоритме умножения квадратныхматриц равно n3, где n – размер матриц. Или (N/2)3/2, где N – количество входныхданных (количество элементов двух квадратных матрицы размерности n).23Если матрица размера n*n не помещается в кеш-памяти, то в кеш-памятьпопадут строка матрицы A и столбец матрицы B (все, что необходимо длявыполнения внутреннего цикла).

Над данными, попавшими в кеш-память,программавыполняетсячастью,вычисляющейскалярныепроизведения.Процессор недогружен, ожидает поступления данных.Оценим количество пересылок данных между оперативной памятью и кешпамятью. Если в кеш-памяти находится вектор-строка матрицы A, и к немуподкачиваются векторы-столбцы матрицы B, то каждый столбец матрицы B будетподкачиваться n раз. Итого, чтений из оперативной памяти будет порядка n3.Теперь рассмотрим блочный алгоритм умножения квадратных матриц.Сложность по умножениям блочного алгоритма такая же, как и у стандартного n3.Размер блоков подбирается так, чтобы умножаемые блоки поместились в кешпамяти.

Оценим количество пересылок данных между оперативной памятью икеш-памятью. Если в кеш-памяти находится блок матрицы A и к немуподкачиваются блоки матрицы B , то каждый блок матрицы Bбудетподкачиваться n/m раз. Итого, чтений блоков матрицы B из оперативной памятибудет порядка (n/m)3. Поскольку каждый блок содержит m2 чисел, общееколичество чтений чисел матрицы B из оперативной памяти будет порядка n3/m это в m раз меньше, чем при обычном умножении.В [41] подробно описаны методы подсчета локальности данных, а такжеалгоритмвыборацепочкипреобразований,приводящийкувеличениюлокальности данных.Метод разбиения задачи на подзадачи – это метод создания эффективныхпрограммдлякомпьютеровсиерархиейпамяти.Этотметодможнорассматривать, как обобщение перехода к блочному коду.Иерархия архитектуры предполагает адекватное ей разбиение задачи наподзадачи – на вычислительном устройстве каждого уровня архитектурырешается подзадача соответствующего уровня иерархии подзадач.

Разбиениезадач на подзадачи необходимо даже для простой иерархической структурыпамяти, состоящей из большой, но медленной, и из быстрой, но малой по объему24памяти. Адекватное разбиение задачи на подзадачи определяет эффективностьвсей высокопроизводительной системы. Компиляторы и процессоры выполняюттакое разбиение автоматически, но, практически, без минимизации обращений кпамяти – хорошую оптимизацию программист должен выполнять сам.Увеличение пространственной локальности данных. Переразмещение1.3.данныхВ предыдущем разделе было введено понятие временной локальностиданных. Другим важным понятием является пространственная локальностьданных [4].

Принцип пространственной локальности данных заключается вчастом обращении к данным, хранящимся в одном месте памяти. Как следует изопределения пространственной локальности данных, временная локальностьданных является ее частным случаем.1.3.1.Нестандартные размещения данныхВ современных языках программирования используются стандартныеразмещения массивов - по строкам (row-major) либо по столбцам (column-major),которые еще называются каноническими размещениями (Canonical layouts) [10].Существует также мортоновское размещение матриц. При таком методеразмещения матрица разбивается на 4 одинаковых блока.

Элементы одного блокахранятся в памяти рядом. Далее каждый блок также разбивается на 4 подблока,элементы которого хранятся рядом. Этот процесс разбиения блоков на подблокивыполняется рекурсивно до тех пор, пока размер разбиваемого блока не станетравен 1. Из определения следует, что мортоновское размещение применимотолько к квадратным матрицам, размер которых является степенью 2. На Рисунке4 представлен пример использования мортоновского размещения для матрицы8x8.

Числа, которыми отмечены элементы матрицы, означают адреса храненияэлементов в линейной памяти после размещения.25Рис. 4: Мортоновское размещение матрицы 8x8. На месте элементов.матрицы расположен относительный адрес соответствующего элемента.Мортоновское размещение может использоваться в целях уменьшенияколичества кеш-промахов [20] для различных приложений, выполняющих многоопераций над данными.

В частности, в приложениях обработки графики [21] иприложениях баз данных [22].В [9] приводится результаты оптимизации ссылочных структур хранения.Предложены 3 методики оптимизации: clustering (кластеризация), сжатие(compression) и раскраска (coloring). В методе кластеризации используетсянестандартное размещение данных, при котором используемые вместе элементыструктур находятся в одной кеш-линейке. В частности, в случае кластеризацииэлементов дерева в одной кеш-линейке стоит хранить поддерево.Если кэлементам производится параллельный доступ, то такие элементы размещаются вразных банках кеш-памяти. Использование данных методик позволило ускоритьпакеты RADIANCE на 42% и VIS на 27%.Важностьподдержкинестандартныхразмещенийвязыкахпрограммирования отмечается в [10].

Исследуется производительность 4D- имортоновского размещений. При использовании нестандартных размещений26добавляются незначительные временные расходы (2-5% от времени работыпрограммы),втовремякакскоростьвыполнениясамойпрограммыувеличивается в 1.1-2.5 раза (блочное умножение матриц, алгоритм Штрассенаумножения матриц, разложение Холецкого, сжатие изображения с помощьювейвлета Хаара).В [12] приводятся результаты сравнения блочно-рекурсивного размещения(Morton data layout) данных со стандартными размещениями. Было взятонесколько тестовых программ (Alternating Direction Implicit Kernel; умножениематриц; решение двумерной задачи Дирихле уравнения Лапласа методом Якоби;разложение Холецкого).

Свежие статьи
Популярно сейчас
Как Вы думаете, сколько людей до Вас делали точно такое же задание? 99% студентов выполняют точно такие же задания, как и их предшественники год назад. Найдите нужный учебный материал на СтудИзбе!
Ответы на популярные вопросы
Да! Наши авторы собирают и выкладывают те работы, которые сдаются в Вашем учебном заведении ежегодно и уже проверены преподавателями.
Да! У нас любой человек может выложить любую учебную работу и зарабатывать на её продажах! Но каждый учебный материал публикуется только после тщательной проверки администрацией.
Вернём деньги! А если быть более точными, то автору даётся немного времени на исправление, а если не исправит или выйдет время, то вернём деньги в полном объёме!
Да! На равне с готовыми студенческими работами у нас продаются услуги. Цены на услуги видны сразу, то есть Вам нужно только указать параметры и сразу можно оплачивать.
Отзывы студентов
Ставлю 10/10
Все нравится, очень удобный сайт, помогает в учебе. Кроме этого, можно заработать самому, выставляя готовые учебные материалы на продажу здесь. Рейтинги и отзывы на преподавателей очень помогают сориентироваться в начале нового семестра. Спасибо за такую функцию. Ставлю максимальную оценку.
Лучшая платформа для успешной сдачи сессии
Познакомился со СтудИзбой благодаря своему другу, очень нравится интерфейс, количество доступных файлов, цена, в общем, все прекрасно. Даже сам продаю какие-то свои работы.
Студизба ван лав ❤
Очень офигенный сайт для студентов. Много полезных учебных материалов. Пользуюсь студизбой с октября 2021 года. Серьёзных нареканий нет. Хотелось бы, что бы ввели подписочную модель и сделали материалы дешевле 300 рублей в рамках подписки бесплатными.
Отличный сайт
Лично меня всё устраивает - и покупка, и продажа; и цены, и возможность предпросмотра куска файла, и обилие бесплатных файлов (в подборках по авторам, читай, ВУЗам и факультетам). Есть определённые баги, но всё решаемо, да и администраторы реагируют в течение суток.
Маленький отзыв о большом помощнике!
Студизба спасает в те моменты, когда сроки горят, а работ накопилось достаточно. Довольно удобный сайт с простой навигацией и огромным количеством материалов.
Студ. Изба как крупнейший сборник работ для студентов
Тут дофига бывает всего полезного. Печально, что бывают предметы по которым даже одного бесплатного решения нет, но это скорее вопрос к студентам. В остальном всё здорово.
Спасательный островок
Если уже не успеваешь разобраться или застрял на каком-то задание поможет тебе быстро и недорого решить твою проблему.
Всё и так отлично
Всё очень удобно. Особенно круто, что есть система бонусов и можно выводить остатки денег. Очень много качественных бесплатных файлов.
Отзыв о системе "Студизба"
Отличная платформа для распространения работ, востребованных студентами. Хорошо налаженная и качественная работа сайта, огромная база заданий и аудитория.
Отличный помощник
Отличный сайт с кучей полезных файлов, позволяющий найти много методичек / учебников / отзывов о вузах и преподователях.
Отлично помогает студентам в любой момент для решения трудных и незамедлительных задач
Хотелось бы больше конкретной информации о преподавателях. А так в принципе хороший сайт, всегда им пользуюсь и ни разу не было желания прекратить. Хороший сайт для помощи студентам, удобный и приятный интерфейс. Из недостатков можно выделить только отсутствия небольшого количества файлов.
Спасибо за шикарный сайт
Великолепный сайт на котором студент за не большие деньги может найти помощь с дз, проектами курсовыми, лабораторными, а также узнать отзывы на преподавателей и бесплатно скачать пособия.
Популярные преподаватели
Добавляйте материалы
и зарабатывайте!
Продажи идут автоматически
5302
Авторов
на СтудИзбе
416
Средний доход
с одного платного файла
Обучение Подробнее