2016 Вопросы с экзамена (1186036)
Текст из файла
Примеры вопросов из теста
“Суперкомпьютеры” (2016)
Давалось 20 вопросов на 30 минут
Пользоваться можно чем угодно
В системе sigma пропускать вопросы, чтобы потом вернуться - нельзя (просто пропустить вопрос тоже нельзя)
Итоговая оценка складывается из 2-х оценок за праки и оценки за тест, но если тест на 2, то и итоговая 2, округление в пользу студента, но с учётом статистики посещения лома и джинни.
Господа, может обсудим ответы на эти вопросы?
старайтесь выбрать свой фоновый цвет, чтобы не сливаться друг с другом
при возможности оставляйте обоснование своему ответу
Ломоносов и BG, архитектура компьютеров:
-
Какой будет архитектура большинства вновь создаваемых суперкомпьютеров? (гибридной, это модно и интересно/как блюджин/еще какой-то вариант)
гибридной
-
сколько соседей у узлов BG
6
-
Где в блюджин используется топология/информационная сеть “дерево”
вроде как при коллективных операциях MPI
-
у Blue Gena максимально 4 потока на узле? да, см. сл вопрос
-
Сколько потоков в процессоре, который стоит в блюджине (видимо речь об узле?)
4
-
Blue Gene: при каком методе запуска доступно больше всего памяти:
- SMP
- Dual
- VN
- всем одинаково
SMP? если имеется в виду “доступной одному процессу”, то SMP
Ну да, в этом главный вопрос
http://hpc.cmc.msu.ru/bgp/jobs/modes - цитата:
В каждом из режимов MPI-процессам доступен приблизительно следующий объем памяти:
-
VN — 472 МБ
-
DUAL — 978 МБ
-
SMP — 1992 МБ
это на процесс. Если запускать с числом узлов N при разном кол-ве процессов, то у тебя на каждом узле 2гб памяти и будет одинаково всегда. Так что, грубо говоря, вопрос фиксируешь ты кол-во процессов или узлов при запуске в разных режимах. Либо вопрос вообще про память на 1 процесс и тогда то, что выделено зеленым верно.
-
был вопрос про архитектуру Ломоносова
3? или 4? “Используется для коллективных операций и коммуникатора WORLD”, так что скорее 3
6. Ну тор, все дела
2?
1,2. 4? я думаю без 4, т.к. я бы считал домашним в этом вопросе домашний на access
без 4 вроде, потому что на parallel.ru есть такое:
1. Быстрое хранилище (tier 1) – предназначено для проведения расчетов.
2.Основное хранилище (tier 2) – предназначено для хранения рабочих данных пользователя (например данные проекта над которым пользователь работает в данный момент)
3.Хранилище архивных данных (tier 3) – предназначено для хранения данных, которые в данный момент пользователю не нужны, но понадобятся в будущем, и хранения архивов данных.
Домашняя директория пользователя (/home/users/$user) расположена на быстром хранилище (tier 1).
Важно:доступ с вычислительных узлов на основное хранилище (tier 2) или хранилище архивных данных (tier 3) невозможен. Тоже думаю, что без 4.
Ок: 1,2
6 4
Да-да, ошибочка,4 То есть число потоков не ограничено?
Имеется в виду 4 потока, а вариант ответа 3
Спасибо
5
Ресурс параллелизма, сложность алгоритмов:
-
Сложность алгоритма перемножения плотных прямоугольных матриц? - ответ O(N^3)
-
Вычислительная сложность перемножения квадратных плотных матриц: o(n),o(NN),o(nnn), нет правильного ответа ( у меня была вычислительная Мощность)
мощность - O(N)?
Сложность плотных - O(N^3)
Это сложность такая, мощность = сложность/объем входных-выходных данных
А тыртышников говорил, что матрицы за N^log_2(7) перемножаются…
Ну в теории они вообще за N^2 перемножаются, но на практике получается N^(2.38)^) :)
Ф Л У Д И Л К А
че вы хотите от поповой. она может еще мощность со сложностью сама перепутала
автограф в зачетке и ведомости хотим. тогда обязательно посмотри в конце что жирным шрифтом выделено в параметрах sbatch Affinity/Multi-core options? В конце этого гугл дока, внимательней!!! Подумой!!! ох петросянчик (ЖЖ(((
интересно, каковы шансы, что вопросы будут те же самые?
50/50, раз не знаем, то энтропия максимальна, значит распределение равномерное. Это не равномерное распределение, равномерное - непрерывное, а это дискретное
ну эти наверное не удалят, но добавят новые
всем удачи
-
вид параллелизма в двойном цикле
-
конечный
-
координатный
-
скошенный
-
нет верного ответа
скошенный?
+++
O(n)+
5+
Сопряженные градиенты и скорейший спуск, разбиение сетки:
-
название метода и типа что это за метод, например метод скорейшего спуска
-
является ли метод сопряженных градиент обобщением метода скор спуска?
По идее 2, но тут немного не такой оператор лапласа.
Это оператор лапласа со знаком минус, и 2 верно. Я про то, что там сверху не du, d^2 u должно быть, не?Хм, да, действительно, но больше похоже на их опечатку (составителей теста/книги), чем на то, что так было задумано. Ну просто это скрин же откуда-то (из книги/статьи).Варианта “не является задачей”, увы,не предусмотрено. Ну ок, остановимся на 2.
3? Вроде бы матрица должны быть симметричной и положительно определенной, а не только невырожденной. Может 1?
Судя по всему на последующий 2-х изображениях один и тот же вопрос, то есть “перечисленных выше” значит “перечисленных и выше и ниже”
^ 1 (так как обмениваться нужно границами, а тут граница совпадает со всей подобластью [линия], в итоге вся сетка гоняется)
1? скорее 2
А, перепутал. Я тоже за 2. Вот тут
https:/я/drive.google.com/drive/folders/0B0X-oQW4pjUUd2htak5UUWFsemc на второй картинке об этом.
1?вроде да да
да
1?
вроде да
CUDA:
-
Про cuda kernel<<< >>> - найти верные сигнатуры запуска, какие будут параметры запуска
-
Для каких задач используются графические ускорители:
-обработка видео
-обработка изображений
-общие вычисления
-обращения к файловой системе
-программирование рекурсивных функций
-
Укажите верные утверждения:
-cuda - расширение c/c++ +
-cuda специально для nvidia sad but true, vendor lock
-cuda это расширение Fortran
cuda теперь вообще поверх LLVM идёт, какой хочешь фронтенд теперь пиши, хоть NodeJS
-
CUDA только для nvidia ГПУ AMD вроде всё держится за OpenCL
Upd: не все GPU, proof: https://developer.nvidia.com/cuda-gpus , тут говорят только про тегру и некоторые другие - чисто может кому интересно
-
Какие опции команды sbatch позволяют ограничить количество выделенных GPU-карт при выбранном определенном количестве узлов?
- -gpu 1
- -p gpu 1
- -s gpu 0
- используются все GPU
все GPU?++
вроде да
-
Фрагмент кода:
строка1- cudaMemcpyAsync(arr1, arr2, count, cudaMemcpyHostToDevice, st1);
строка2- kernel«count / 256, 256, 0, st2 »(arr1, arr3, count);
строка3- cudaMemcpyAsync(arr2, arr1, count, cudaMemcpyDeviceToHost, st1);
- могут выполниться параллельно строки1,3 и строка 2?
- строка3 выполняется после строки1
-
Про cuda memcpyasync: откуда куда пересылка данных; указать правильные утверждения про вызов cudaMemcpy(ar1, ar2, count, cudaMemcyHostToDevice)
На последующих 2-х изображениях есть разница в коде. Вообще у Колганова много похожих, но немного отличающихся вопросов.
1,4? Или без 4?
вроде без 4, потому что одновременно выполняется ядро, где меняется arr1, и копируется arr1 в arr2.
без 4 5. Так как 2 и 3 строки запущены в разных потоках, а kernel мутирует arr1. Поэтому в третьей строке может быть скопирована рандомная белиберда.
2,3 почему не подходят? первая строка же вроде бы синхронная операция, которая блокирует все потоки?
Да,точно, чёт думал там Async
В итоге 1,2,3
2,4? + верно второе, там поток st1 != st2 Понял, спасибо
2,3,4?+
-для игр гонять нейронки, зарабатывать на кеггле резюме и призовые фонды
лол,много уже на кэгле заработал(призовых фондов)?
а для общего назначения? матрицы ж на нём тоже неплохо множатся
просто тут не сказано типа для того, что хорошо параллелится. Матрицы параллелятся,но есть типа много чего, что на проце гораздо быстрей из-за кешей (и не параллелится).
Короче в любом случае под вопросом это
2,3 Почему 2?Конструктор dim3(5,55,1,1) скорее всего упадет, потому что 4 параметра. Да, по этой логике отметил
1 - Можно ли запускать с нулем нитей? Просто не запуститься тогда?
Хрен его знает, cuda host api толком нигде не прописан, nvidia должна была закрыться со стыда от такой хуйни
1?
1,2,3 +
Опять же, можно ли как с 0 блоками запустить (как в 5 варианте)?
3,5,6? CUDA есть на Fortran, C/C++ и является технологией NVidia То есть 1,5,6 или как?1,5,6
В лекциях не было про фортран, кто как думает надо ответить?СUDA вообще на LLVM есть, пиши фронтенд и будет тебе счастьеhttps://developer.nvidia.com/cuda-llvm-compiler
Можно по человечески?
1,5,6,7+
Турбулентность:
-
Что такое число Рейнольдса (отношение вязкости к инерции как-то так) --- или инерции к вязкости
-
Причина возникновения турбулентности
-
коеффициент рейнольдса? - вязкость и инерция
-
Какие уравнения используются для описания осредненных характеристик турбулентных течений? навье-стокс? Рейнолдса?
2,4?
Вроде да
Характеристики
Тип файла документ
Документы такого типа открываются такими программами, как Microsoft Office Word на компьютерах Windows, Apple Pages на компьютерах Mac, Open Office - бесплатная альтернатива на различных платформах, в том числе Linux. Наиболее простым и современным решением будут Google документы, так как открываются онлайн без скачивания прямо в браузере на любой платформе. Существуют российские качественные аналоги, например от Яндекса.
Будьте внимательны на мобильных устройствах, так как там используются упрощённый функционал даже в официальном приложении от Microsoft, поэтому для просмотра скачивайте PDF-версию. А если нужно редактировать файл, то используйте оригинальный файл.
Файлы такого типа обычно разбиты на страницы, а текст может быть форматированным (жирный, курсив, выбор шрифта, таблицы и т.п.), а также в него можно добавлять изображения. Формат идеально подходит для рефератов, докладов и РПЗ курсовых проектов, которые необходимо распечатать. Кстати перед печатью также сохраняйте файл в PDF, так как принтер может начудить со шрифтами.