Главная » Все файлы » Просмотр файлов из архивов » PDF-файлы » 2006 Ответы на экзаменационные вопросы по ПОД (Lilalbrother)

2006 Ответы на экзаменационные вопросы по ПОД (Lilalbrother), страница 8

PDF-файл 2006 Ответы на экзаменационные вопросы по ПОД (Lilalbrother), страница 8 Суперкомпьютерное моделирование и технологии (64127): Ответы (шпаргалки) - 11 семестр (3 семестр магистратуры)2006 Ответы на экзаменационные вопросы по ПОД (Lilalbrother): Суперкомпьютерное моделирование и технологии - PDF, страница 8 (64127) - СтудИзба2020-08-25СтудИзба

Описание файла

PDF-файл из архива "2006 Ответы на экзаменационные вопросы по ПОД (Lilalbrother)", который расположен в категории "". Всё это находится в предмете "суперкомпьютерное моделирование и технологии" из 11 семестр (3 семестр магистратуры), которые можно найти в файловом архиве МГУ им. Ломоносова. Не смотря на прямую связь этого архива с МГУ им. Ломоносова, его также можно найти и в других разделах. .

Просмотр PDF-файла онлайн

Текст 8 страницы из PDF

Bрегистры, 64 штуки по 32 разряда.Скалярные регистры: S-регистры, 8 штук по 64 разряда, для хранения аргументов ирезультатов скалярной арифметики, иногда содержат операнд для векторных команд. Tрегистры, 64 штуки по 64 разряда. Скалярные регистры используются для выполнения какскалярных, так и векторных команд.Векторные регистры: V-регистры, 8 штук на 128 64-разрядных слова каждый. Векторныерегистры используются только для выполнения векторных команд.Регистр длины вектора: 8 разрядов.Регистр маски вектора: 128 разрядов.Функциональные устройстваФУ исполняют свой набор команд и могут работать одновременно друг с другом. Все ФУконвейерные и делятся на четыре группы: адресные, скалярные, векторные и для работы сплавающей точкой.Адресные ФУ (2): целочисленное сложение/вычитание, целочисленное умножение.Скалярные ФУ (4): целочисленное сложение/вычитание, логические поразрядныеоперации, сдвиг, число единиц/число нулей до первой единицы.Векторные ФУ (5-7): целочисленное сложение/вычитание, сдвиг, логические поразрядныеоперации (1-2), число единиц/число нулей до первой единицы (1-2), умножение битовыхматриц (0-1).

Предназначены для выполнения только векторных команд.ФУ с плавающей точкой (3): сложение/вычитание, умножение, нахождение обратнойвеличины. Предназначены для выполнения как векторных, так и скалярных команд.Векторные ФУ и ФУ с плавающей точкой продублированы: векторные командыразбивают 128 элементов векторных регистров на четные и нечетные, обрабатываемыеодновременно двумя конвейерами (pipe 0, pipe 1). Когда завершается выполнениеочередной пары операций результаты записываются на соответствующие четные инечетные позиции выходного регистра.

В полностью скалярных операциях,использующих ФУ с плавающей точкой, работает только один конвейер.ФУ имеют различное число ступеней конвейера, но каждая ступень срабатывает за одинтакт, поэтому при полной загрузке все ФУ могут выдавать результат каждый такт.22. Параллелизм в архитектуре компьютера CRAY C90 (6 особенностейархитектуры).Конвейеризация выполнения командВсе основные операции, выполняемые процессором: обращения в память, обработкакоманд и выполнение инструкций являются конвейерными.Независимость функциональных устройствБольшинство ФУ в CRAY C90 являются независимыми, поэтому несколько операциймогут выполняться одновременно.

Для операции A=(B+C)*D*E порядок выполненияможет быть следующим (все аргументы загружены в S регистры). Генерируются триинструкции: умножение D и E, сложение B и C и умножение результатов двухпредыдущих операций. Первые две операции выполняются одновременно, затем третья.Векторная обработкаВекторная обработка увеличивает скорость и эффективность обработки за счет того, чтообработка целого набора (вектора) данных выполняется одной командой.

Скоростьвыполнения операций в векторном режиме приблизительно в 10 раз выше скоростискалярной обработки. Для фрагмента типаDo i = 1, nA(i) = B(i)+C(i)End Doв скалярном режиме потребуется сгенерировать целую последовательность команд:прочитать элемент B(I), прочитать элемент C(I), выполнить сложение, записать результатв A(I), увеличить параметр цикла, проверить условие цикла. В векторном режиме этотфрагмент преобразуется в: загрузить порцию массива B, загрузить порцию массива C (этидве операции будут выполняться со сдвигом в один такт, т.е.

практически одновременно),векторное сложение, запись порции массива в память, если размер массивов большедлины векторных регистров, то повторить эту последовательность некоторое число раз.Перед тем, как векторная операция начнет выдавать результаты, проходит некотороевремя (startup), связанное с заполнением конвейера и подкачкой аргументов. Чем большедлина векторов, тем менее заметным оказывается влияние данного начальногопромежутка времени на все время выполнения программы.Векторные операции, использующие различные ФУ и регистры, могут выполнятьсяпараллельно.Зацепление функциональных устройствАрхитектура CRAY Y-MP C90 позволяет использовать регистр результатов векторнойоперации в качестве входного регистра для последующей векторной операции, т.е.

выходсразу подается на вход. Это называется зацеплением векторных операций. Вообще говоря,глубина зацепления может быть любой, например, чтение векторов, выполнение операциисложения, выполнение операции умножения, запись векторов.Дублирование конвееров. Векторные ФУ и ФУ с плавающей точкой продублированы:векторные команды разбивают 128 элементов векторных регистров на четные и нечетные,обрабатываемые одновременно двумя конвейерами (pipe 0, pipe 1). Когда завершаетсявыполнение очередной пары операций результаты записываются на соответствующиечетные и нечетные позиции выходного регистра. В полностью скалярных операциях,использующих ФУ с плавающей точкой, работает только один конвейер.16 таких процессоров.Многопроцессорная обработка: multiprogramming, multitaskingMultiprogramming - выполнение нескольких независимых программ на различныхпроцессорах.Multitasking - выполнение одной программы на нескольких процессорах.23.

Векторизация программ, необходимые условия векторизации, препятствия длявекторизации.Независимость командТип операндов одинаковыйШаг одинаковый24. Причины уменьшения производительности компьютера CRAY C90: законАмдала, секционирование векторных операций, время разгона конвейера.Анализ факторов, снижающих реальную производительность компьютеров, начнемс обсуждения известного закона Амдала. Смысл его сводится к тому, что время работыпрограммы определяется ее самой медленной частью.

В самом деле, предположим, чтоодна половина некоторой программы - это сугубо последовательные вычисления. Тогдавне всякой зависимости от свойств другой половины, которая может идеальновекторизоваться либо вообще выполняться мгновенно, ускорения работы всей программыболее чем в два раза мы не получим.Влияние данного фактора надо оценивать с двух сторон. Во-первых, по природесамого алгоритма все множество операций программы Г разбивается на последовательныеоперации Г1 и операции Г2, исполняемые в векторном режиме. Если доляпоследовательных операций велика, то программист сразу должен быть готов к тому, чтобольшого ускорения он никакими средствами не получит и, быть может, следует уже наэтом этапе подумать об изменении алгоритма.Во-вторых, не следует сбрасывать со счетов и качество компилятора, которыйможет не распознать векторизуемость отдельных конструкций и, тем самым, часть"потенциально хороших" операций из Г2 перенести в Г1.Следующие два фактора, снижающие реальную производительность (они жеопределяют невозможность достижения пиковой производительности) секционирование длинных векторных операций на порции по 128 элементов(векторные регистры имееют 128 64 разр слова) и время начального разгона конвейера,относятся к накладным расходам на организацию векторных операций на конвейерныхфункциональных устройствах.

Временем начального разгона конвейера, в частности,определяется тот факт, что очень короткие циклы выгоднее выполнять не в векторномрежиме, а в скалярном, когда этих накладных расходов нет.В отличие от секционирования операций дополнительное время на разгонконвейера требуется лишь один раз при старте векторной операции. Это стимулирует кработе с длинными векторами данных, так как с ростом длины вектора доля накладныхрасходов в общем времени выполнения операции быстро падает.25. Причины уменьшения производительности компьютера CRAY C90: конфликтыв памяти, ограниченная пропускная способность каналов передачи данных,необходимость использования векторных регистров.Конфликты при обращении в память у компьютеров CRAY Y-MP полностьюопределяются аппаратными особенностями организации доступа к оперативной памяти.Память компьютеров CRAY Y-MP C90 в максимальной конфигурации разделена на 8секций, каждая секция - на 8 подсекций, а каждая подсекция на 16 банков памяти.

Ясно,что наибольшего времени на разрешение конфликтов потребуется при выборке данных сшагом 8*8=64, когда постоянно совпадают номера и секций и подсекций. С другойстороны, выборка с любым нечетным шагом проходит без конфликтов вообще, и в этомсмысле она эквивалентна выборке с шагом единица. Возьмем следующий пример:Do i=1,n*k,ka(i)=b(i)*s + c(i)End DoВ зависимости от значения k, т.е. шага выборки данных из памяти, происходитвыполнение векторной операции ai=bi*s+ci длины n в режиме с зацеплением.Производительность компьютера (с двумя секциями памяти) на данной операции показанав таблице 2.шаг по производительность на векторах изпамяти 100 элементов 1000 элементов 12800 элементов1240.3705.2805.12220.4444.6498.54172.9274.6280.18108.1142.8147.71671.784.586.03241.044.338.06422.125.722.312821.220.620.3Табл.2 Влияние конфликтов при обращении к памяти: производительностькомпьютера CRAY Y-MP C90 в зависимости от длины векторов и шага перемещения попамяти.Как видим, производительность падает катастрофически.

Однако еще однойнеприятной стороной конфликтов является то, что "внешних" причин их появления можетбыть много (в то время как истинная причина, конечно же, одна - неудачноерасположение данных). В самом деле, в предыдущем примере конфликты возникали прииспользовании цикла с неединичным четным шагом. Значит, казалось бы, не должно бытьникаких причин для возникновения конфликтов при работе фрагмента следующего вида:Do i=1,nDo j=1,nDo k=1,nX(i,j,k) = X(i,j,k)+P(k,i)*Y(k,j)End DoEnd DoEnd DoОднако это не совсем так и все зависит от того, каким образом описан массив X.Предположим, что описание имеет вид:DIMENSION X(40,40,100)По определению Фортрана массивы хранятся в памяти "по столбцам", следовательно приизменении последнего индексного выражения на единицу реальное смещение по памятибудет равно произведению размеров массива по предыдущим размерностям. Для нашегопримера, расстояние между соседними элементами X(i,j,k) и X(i,j,k+1) равно40*40=1600=25*64, т.е.

всегда кратно наихудшему шагу для выборки из памяти. В тожевремя, если изменить лишь описание массива, добавив единицу к первым двумразмерностям:DIMENSION X(41,41,100),то никаких конфликтов не будет вовсе. Последний пример возможного появленияконфликтов - это использование косвенной адресации. В следующем фрагментеDo j=1,nDo i=1,nXYZ(IX(i),j) = XYZ(IX(i),j)+P(i,j)*Y(i,j)End DoEnd Doв зависимости от того, к каким элементам массива XYZ реально происходит обращение,конфликтов может не быть вовсе (например, IX(i) равно i) либо их число может бытьмаксимальным (например, IX(i) равно одному и тому же значению для всех i).Следующие два фактора, снижающие производительность, определяются тем, чтоперед началом выполнения любой операции данные должны быть занесены в регистры.Для этого в архитектуре компьютера CRAY Y-MP предусмотрены три независимыхканала передачи данных, два из которых могут работать на чтение из памяти, а третий назапись.

Такая структура хорошо подходит для операций, требующих не более двухвходных векторов для выполнения в максимально производительном режиме сзацеплением, например, Ai = Bi*s+Ci.Однако операции с тремя векторными аргументами, как например Ai = Bi*Ci+Di, не могутбыть реализованы столь же оптимально. Часть времени будет неизбежно потраченовпустую на ожидание подкачки третьего аргумента для запуска операции с зацеплением,что является прямым следствием ограниченной пропускной способности каналовпередачи данных (memory bottleneck). С одной стороны, максимальнаяпроизводительность достигается на операции с зацеплением, требующей три аргумента, ас другой на чтение одновременно могут работать лишь два канала. В таблице 3 приведенапроизводительность компьютера на указанной выше векторной операции, требующей тривходных вектора B, C, D, в зависимости от их длины.длина производительность,вектора Mflop/s1057.0100278.31000435.312801 445.0Табл.3 Производительность CRAY Y-MP C90 на операции ai=bi*ci+diТеперь предположим, что пропускная способность каналов не является узкимместом.

Свежие статьи
Популярно сейчас
Как Вы думаете, сколько людей до Вас делали точно такое же задание? 99% студентов выполняют точно такие же задания, как и их предшественники год назад. Найдите нужный учебный материал на СтудИзбе!
Ответы на популярные вопросы
Да! Наши авторы собирают и выкладывают те работы, которые сдаются в Вашем учебном заведении ежегодно и уже проверены преподавателями.
Да! У нас любой человек может выложить любую учебную работу и зарабатывать на её продажах! Но каждый учебный материал публикуется только после тщательной проверки администрацией.
Вернём деньги! А если быть более точными, то автору даётся немного времени на исправление, а если не исправит или выйдет время, то вернём деньги в полном объёме!
Да! На равне с готовыми студенческими работами у нас продаются услуги. Цены на услуги видны сразу, то есть Вам нужно только указать параметры и сразу можно оплачивать.
Отзывы студентов
Ставлю 10/10
Все нравится, очень удобный сайт, помогает в учебе. Кроме этого, можно заработать самому, выставляя готовые учебные материалы на продажу здесь. Рейтинги и отзывы на преподавателей очень помогают сориентироваться в начале нового семестра. Спасибо за такую функцию. Ставлю максимальную оценку.
Лучшая платформа для успешной сдачи сессии
Познакомился со СтудИзбой благодаря своему другу, очень нравится интерфейс, количество доступных файлов, цена, в общем, все прекрасно. Даже сам продаю какие-то свои работы.
Студизба ван лав ❤
Очень офигенный сайт для студентов. Много полезных учебных материалов. Пользуюсь студизбой с октября 2021 года. Серьёзных нареканий нет. Хотелось бы, что бы ввели подписочную модель и сделали материалы дешевле 300 рублей в рамках подписки бесплатными.
Отличный сайт
Лично меня всё устраивает - и покупка, и продажа; и цены, и возможность предпросмотра куска файла, и обилие бесплатных файлов (в подборках по авторам, читай, ВУЗам и факультетам). Есть определённые баги, но всё решаемо, да и администраторы реагируют в течение суток.
Маленький отзыв о большом помощнике!
Студизба спасает в те моменты, когда сроки горят, а работ накопилось достаточно. Довольно удобный сайт с простой навигацией и огромным количеством материалов.
Студ. Изба как крупнейший сборник работ для студентов
Тут дофига бывает всего полезного. Печально, что бывают предметы по которым даже одного бесплатного решения нет, но это скорее вопрос к студентам. В остальном всё здорово.
Спасательный островок
Если уже не успеваешь разобраться или застрял на каком-то задание поможет тебе быстро и недорого решить твою проблему.
Всё и так отлично
Всё очень удобно. Особенно круто, что есть система бонусов и можно выводить остатки денег. Очень много качественных бесплатных файлов.
Отзыв о системе "Студизба"
Отличная платформа для распространения работ, востребованных студентами. Хорошо налаженная и качественная работа сайта, огромная база заданий и аудитория.
Отличный помощник
Отличный сайт с кучей полезных файлов, позволяющий найти много методичек / учебников / отзывов о вузах и преподователях.
Отлично помогает студентам в любой момент для решения трудных и незамедлительных задач
Хотелось бы больше конкретной информации о преподавателях. А так в принципе хороший сайт, всегда им пользуюсь и ни разу не было желания прекратить. Хороший сайт для помощи студентам, удобный и приятный интерфейс. Из недостатков можно выделить только отсутствия небольшого количества файлов.
Спасибо за шикарный сайт
Великолепный сайт на котором студент за не большие деньги может найти помощь с дз, проектами курсовыми, лабораторными, а также узнать отзывы на преподавателей и бесплатно скачать пособия.
Популярные преподаватели
Добавляйте материалы
и зарабатывайте!
Продажи идут автоматически
5167
Авторов
на СтудИзбе
437
Средний доход
с одного платного файла
Обучение Подробнее