cuda_course_task_filtering (1265197)

Файл №1265197 cuda_course_task_filtering (Задания)cuda_course_task_filtering (1265197)2021-08-182021-08-18СтудИзба

Просмтор этого файла доступен только зарегистрированным пользователям. Но у нас супер быстрая регистрация: достаточно только электронной почты!

Регистрация/авторизация

Текст из файла

Лихогруд Николайn.lihogrud@gmail.comЗаданиеСвертка с квадратным ядромtmp = 0;for(ik=-r..r)for(jk=-r..r)tmp += matrix[i+ik][j+jk]*filter[ik+r][jk+r];result[i][j]=tmp;КвадратноеядроФильтрация изображенийБазовое задание Выбрать любые два фильтра из статьиhttp://habrahabr.ru/post/142818/ Разобраться с какой-либо библиотекой для работы сизображениям (предлагаю DevIL ) Реализовать загрузку, модификацию и сохранение изображенийв формате png/jpeg с палитрой RGBA Реализовать добавление к изображению рамки с шириной,равной радиусу фильтра Рамка заполняется крайними пикселами изображенияБазовое задание Написать ядро, принимающее на вход Фильтр (через константную память) Исходную матрицу с рамкой Память под матрицу-результат (тоже с рамкой) Каждая нить вычисляет один элемент матрицы-результата Ядро фильтрации передается через константную память#define MAX_KERNEL_WIDTH (2 * MAX_KERNEL_RADIUS + 1)__constant__ float kernel[MAX_KERNEL_WIDTH * MAX_KERNEL_WIDTH]__global__ void filter(cudaPitchedPtr inMatrix,cudaPitchedPtr outMatrix, int kernelRadius) {}Работа с пикселями Ядро работает с массивами пикселов, каждая нить рассчитываетпиксел выходного изображения – компоненты R, G, B Удобно использовать класс Pixel с полями uint8_t r,g,b,a; иFloatPixel с полями float r,g,b,a Через Pixel читаем/пишем память В FloatPixel накапливаем результат Для считывания/записи используем get_pixel – аналогget_elem, но приводит указатель на начало строки к типу Pixel, ане floatPixel#include <stdint.h>struct Pixel {uint8_t r,g,b,a;Оператор присваивания и конструктор копированиякопирует сразу 4 байта, а не побайтово__host__ __device__ Pixel &operator=(const Pixel &otherPixel) {*((uint32_t *)this) = (*(uint32_t *)&otherPixel);return *this;}__host__ __device__ Pixel(const Pixel &otherPixel) {*((uint32_t *)this) = (*(uint32_t *)&otherPixel);}__host__ __device__ Pixel(uint8_t r, uint8_t g, uint8_t b, uint8_t a);__host__ __device__ FloatPixel operator*(float coefficient)};Замечания к классу Pixel __host__ __device__ означают, что функция будет скомпилирована идля CPU, и для GPU При работе с памятью важно считывать/записывать пиксел одной 4байтной инструкцией, вместо 4 однобайтовых С этой целью переопределены конструктор копирования и операторприсваиванияPixel *pixels; // массив пикселовPixel pixel2 = pixels[2]; // Конструктор копированияPixels[0] = pixel1 + pixel2; // Оператор присваивания Проверьте через $cuobjdump -sass, чтобы в ассемблере не былоинструкций ST/LD c суффиксом U8FloatPixel#include <stdint.h>struct FloatPixel {float r,g,b,a;__host__ __device__ FloatPixel(float r, float g, float b, float a);Оператор сложения с другим FloatPixelдля накопления результата__host__ __device__ FloatPixel operator+(const FloatPixel &otherPixel);__host__ __device__ Pixel getPixel();};Про эрозию и наращивание В эрозии и наращивании нужно найти в окрестности элемент смаксимальной/минимальной яркостью Окрестность задается матрицей из нулей и единиц Яркость пиксела можно записать в четвертую компоненту, все равно мыеё не используем Тогда можно добавить оператор Pixel &operator>(Pixel&otherPixel), возвращающий пиксел с большей четвертойкомпонентой Яркость всех пикселов нужно посчитать один раз, на хосте или GPU, поформуле 0.3*R + 0.59*G + 0.11*B (или 0.21R + 0.72G + 0.07B)Синтетические данные Для экспериментов с большими матрицами: Добавить возможность генерации случайных матриц изчисел (не пикселов) Добавить отдельное ядро, работающее с матрицами извещественных чисел Каждая нить считает не пиксел а просто суммупроизведений элементов окрестности на коэффициентыядраТребования к базовой части Входные параметры: Радиус фильтра Размеры синтетической матрицы или файл с входнымизображением Программа: Выводися время применения фильтров Если на входе было изображение – сохраняет на дискрезультат применения двух фильтровДобавляем потоки Программа дополнительно принимает число потоков Разрежем матрицу на горизонтальные полосы почислу потоков Каждый поток рассчитывает одну из полосДобавляем потоки Для старта вычислений в нулевом потоке достаточно скопироватьпервую полосу вместе с её нижней рамкойДобавляем потоки Для старта вычислений в следующем потоке часть данных ужеЧто уже есть на GPUскопированаДобавляем потокиЧто уже есть на GPU Для следующего потока так же часть данных уже будет на GPUУскорение При помощи профилировщика подобрать радиусфильтра и размеры синтетической матрицы так, чтобыкопирования совпадали со временем выполнения Максимальное ускорениеИспользуем multi-GPU Разрезать матрицу на горизонтальные полосы почислу видеокарт Разослать по видеокартам полосы + их рамки Каждая видеокарта считает независимо свою часть С использованием потоков Использовать OpenMP3 GPUВторой фильтр & multi GPU Для применения второго фильтра понадобятся рамкиполос, вычисленные на соседних устройствах Их нужно переслать после применения первого фильтрачерез cudaMemCpyAsync()/ cudaMemcpyPeerAsync() Включить прямой доступ (peerAccess) там, где этовозможноend.

Характеристики

Тип файла

PDF-файл

Размер

1,75 Mb

Материал

Задания

Тип материала

Другое

Предмет

Технология CUDA на кластерах с GPU

Высшее учебное заведение

МГУ им. Ломоносова

Тип файла PDF

PDF-формат наиболее широко используется для просмотра любого типа файлов на любом устройстве. В него можно сохранить документ, таблицы, презентацию, текст, чертежи, вычисления, графики и всё остальное, что можно показать на экране любого устройства. Именно его лучше всего использовать для печати.

Например, если Вам нужно распечатать чертёж из автокада, Вы сохраните чертёж на флешку, но будет ли автокад в пункте печати? А если будет, то нужная версия с нужными библиотеками? Именно для этого и нужен формат PDF - в нём точно будет показано верно вне зависимости от того, в какой программе создали PDF-файл и есть ли нужная программа для его просмотра.

Список файлов учебной работы

1629236234-076f28e26573a83b41689a6974651d13.rar

Задания

DevIL

include

devil_cpp_wrapper.hpp

il.h

ilu.h

ilu_region.h

ilut.h

ilut_config.h

lib

libIL.a

libIL.la

libILU.a

libILU.la

libILUT.a

libILUT.la

DevIL Manual.pdf

DevIL Reference Guide.pdf

DevIL-master.zip

DevIL-master

DevIL

org.eclipse.cdt.make.core.ScannerConfigBuilder.launch

org.eclipse.cdt.make.core.makeBuilder.launch

.cvsignore

org.eclipse.wst.sse.core.prefs

org.eclipse.wst.validation.prefs

src-ILUT

include

Makefile.am

ilut_allegro.h

ilut_internal.h

ilut_opengl.h

ilut_states.h

msvc8

resources

IL Logo.ico

ILUT.rc

ILUT Unicode.rc

ILUT Unicode.vcproj

ILUT.dsp

ILUT.rc

ILUT.vcproj

ilut.def

resource.h

msvc9

resources

IL Logo.ico

ILUT.rc

Полное содержание архива

DevIL_manual.pdf

main.cpp

makefile.

original_file.jpg

QuantumOperation

definitions.h

header.h

helpers.cpp

kernel.cu

main.cpp

makefile.

Полное содержание архива

Поделитесь ссылкой:

Ставлю 10/10
Все нравится, очень удобный сайт, помогает в учебе. Кроме этого, можно заработать самому, выставляя готовые учебные материалы на продажу здесь. Рейтинги и отзывы на преподавателей очень помогают сориентироваться в начале нового семестра. Спасибо за такую функцию. Ставлю максимальную оценку.

Лучшая платформа для успешной сдачи сессии
Познакомился со СтудИзбой благодаря своему другу, очень нравится интерфейс, количество доступных файлов, цена, в общем, все прекрасно. Даже сам продаю какие-то свои работы.

Студизба ван лав ❤
Очень офигенный сайт для студентов. Много полезных учебных материалов. Пользуюсь студизбой с октября 2021 года. Серьёзных нареканий нет. Хотелось бы, что бы ввели подписочную модель и сделали материалы дешевле 300 рублей в рамках подписки бесплатными.

Отличный сайт
Лично меня всё устраивает - и покупка, и продажа; и цены, и возможность предпросмотра куска файла, и обилие бесплатных файлов (в подборках по авторам, читай, ВУЗам и факультетам). Есть определённые баги, но всё решаемо, да и администраторы реагируют в течение суток.

Маленький отзыв о большом помощнике!
Студизба спасает в те моменты, когда сроки горят, а работ накопилось достаточно. Довольно удобный сайт с простой навигацией и огромным количеством материалов.

Студ. Изба как крупнейший сборник работ для студентов
Тут дофига бывает всего полезного. Печально, что бывают предметы по которым даже одного бесплатного решения нет, но это скорее вопрос к студентам. В остальном всё здорово.

Спасательный островок
Если уже не успеваешь разобраться или застрял на каком-то задание поможет тебе быстро и недорого решить твою проблему.

Всё и так отлично
Всё очень удобно. Особенно круто, что есть система бонусов и можно выводить остатки денег. Очень много качественных бесплатных файлов.

Отзыв о системе "Студизба"
Отличная платформа для распространения работ, востребованных студентами. Хорошо налаженная и качественная работа сайта, огромная база заданий и аудитория.

Отличный помощник
Отличный сайт с кучей полезных файлов, позволяющий найти много методичек / учебников / отзывов о вузах и преподователях.

Отлично помогает студентам в любой момент для решения трудных и незамедлительных задач
Хотелось бы больше конкретной информации о преподавателях. А так в принципе хороший сайт, всегда им пользуюсь и ни разу не было желания прекратить. Хороший сайт для помощи студентам, удобный и приятный интерфейс. Из недостатков можно выделить только отсутствия небольшого количества файлов.

Спасибо за шикарный сайт
Великолепный сайт на котором студент за не большие деньги может найти помощь с дз, проектами курсовыми, лабораторными, а также узнать отзывы на преподавателей и бесплатно скачать пособия.