20151028_msu_9_Visual (Лекции)
Описание файла
Файл "20151028_msu_9_Visual" внутри архива находится в папке "Лекции". PDF-файл из архива "Лекции", который расположен в категории "". Всё это находится в предмете "параллельные методы решения задач" из 10 семестр (2 семестр магистратуры), которые можно найти в файловом архиве МГУ им. Ломоносова. Не смотря на прямую связь этого архива с МГУ им. Ломоносова, его также можно найти и в других разделах. .
Просмотр PDF-файла онлайн
Текст из PDF
ВМК МГУВизуализация сеточных данныхМ.В.Якобовскийmail: lira@imamod.ruweb: http://lira.imamod.ruКомпьютер пользователя на порядки слабее суперкомпьютераUSA, Titan, Cray XK7, NVIDEA K20x, 27 Pflopsflops2301 TfКитай, Tianhe-1AМГУ, Ломоносов, 1.7 Pflops1 Pflops281 TfМСЦ100 T10 T1TМГУ, ЛомоносовМГУ, ЧебышевМСЦРАН1,12 TfМВС-1000М1,65 Tf100 G60 Gf10 G1G0,42 Gf19952000200520102015 г г.Workstation, one core: 1/100 000…TOP 500Москва, 2015 г.2Параллельные вычисления.Визуализация сеточных данных© Якобовский М.В.Визуализация• Скалярные• Векторные• Стационарные• Зависящие от времени• Решетки• Треугольные и тетраэдральные сеткиМосква, 2015 г.Параллельные вычисления.Визуализация сеточных данных© Якобовский М.В.3Вычислительная средаПроектПостроениегеометрическоймодели,поверхностнойи объемнойсетки.Заданиеатрибутов.Выборматематическоймодели и солверов.Сопоставлениеатрибутамначальных играничных условий,физическихпараметров.ВыборсерверавычисленийВыборсерверавизуализацииФормирование варианта заданияРасчет варианта заданияМосква, 2015 г.ВизуализациярезультатовФайлыПараллельные вычисления.результатовВизуализация сеточныхданных© Якобовский М.В.4Этапы визуализацииСеткаЗаписьСеточная функцияЧтениеФормирование объектов виртуальной сценыОтображениеМосква, 2015 г.Параллельные вычисления.Визуализация сеточных данных© Якобовский М.В.5Методы••••Распределенное иерархическое хранениеДекомпозицияОгрубление с контролируемой точностьюКлиент-серверная технология• Потоковая обработка• Хранение образовМосква, 2015 г.Параллельные вычисления.Визуализация сеточных данных© Якобовский М.В.6Визуализация в распределенных системахMeshFlow over planeIso-surfaces78910111213141516Аппроксимация ипотоковая обработка• Отображение• Копирование всех данных• Чтение• Формирование сцены• On/Off line• Расчет• ЗаписьрезультатовTecPlotOriginVISIT ParaViewEnSight OpenDX• Чтение• ФормированиесценыКлиент-сервернаятехнологияСечение регулярной 3D сеткиплоскостью• В результате сечения регулярнойкубической решетки получаетсяфрагмент неструктурированной сеткиМосква, 2015 г.Параллельные вычисления.Визуализация сеточных данных© Якобовский М.В.18Аппроксимация триангулированныхповерхностей• Алгоритмы синтеза• Алгоритмы редуцированияМосква, 2015 г.Параллельные вычисления.Визуализация сеточных данных© Якобовский М.В.19Начальная аппроксимация кривойМосква, 2015 г.Параллельные вычисления.Визуализация сеточных данных© Якобовский М.В.20Аппроксимация кривойэтап 21 векторМосква, 2015 г.Параллельные вычисления.Визуализация сеточных данных© Якобовский М.В.21Аппроксимация кривойэтап 33 вектораМосква, 2015 г.Параллельные вычисления.Визуализация сеточных данных© Якобовский М.В.22Аппроксимация кривойэтап 47 векторовМосква, 2015 г.Параллельные вычисления.Визуализация сеточных данных© Якобовский М.В.23Аппроксимация кривойэтап 515 векторовМосква, 2015 г.Параллельные вычисления.Визуализация сеточных данных© Якобовский М.В.24Методы редуцированияУдаление ребраУдаление точкиУточнение топологииМосква, 2015 г.Параллельные вычисления.Визуализация сеточных данных© Якобовский М.В.25Аппроксимация изоповерхностейМосква, 2015 г.Параллельные вычисления.Визуализация сеточных данных© Якобовский М.В.26ИзоповерхностиОшибка аппроксимации 5%Москва, 2015 г.Параллельные вычисления.Визуализация сеточных данных© Якобовский М.В.27Расчетная сеткаМосква, 2015 г.Параллельные вычисления.Визуализация сеточных данных© Якобовский М.В.28Моделирование обтекания телсферической формыСтационарное обтекание скошенной сферыM = 0.8 Re = 100Нестационарное обтекание скошенной сферыM = 0.8 Re = 100000Стационарное обтекание сферы M = 0.1 Re = 25Параллельные вычисления.Москва, 2015 г.Визуализация сеточных данныхРассчитанные траектории отмеченных частиц.
Re=25Эксперимент. Re=26.8 (Ван-Дайк М., 1986)© Якобовский М.В.29Огрубление поверхностейМосква, 2015 г.Параллельные вычисления.Визуализация сеточных данных© Якобовский М.В.30Огрубление поверхностейОшибкаКоличествоточекКоличествотреугольниковКоэффициентсжатия0%1380027357-0,1%1120211712,90,2%44780833,90,5%17530490,0Москва, 2015 г.Параллельные вычисления.Визуализация сеточных данных© Якобовский М.В.31Формирование макрографаМосква, 2015 г.Параллельные вычисления.Визуализация сеточных данных© Якобовский М.В.32Сетка микродоменоввесчисло% отн. число1230.01%1330.01%14150.03%15330.06%162280.44%171 3732.66%185 43310.54%1911 71322.73%2014 21827.59%2111 06921.48%225 73711.13%231 5052.92%241920.37%25130.03%2620.00%2710.00%Москва, 2015 г.51 538 микродоменПараллельные вычисления.Визуализация сеточных данных© Якобовский М.В.33Двухуровневое разбиениеIСетка предварительно разбиваетсяна большое число микродоменов,образующих макрографIIВершины макрографараспределяются по процессорам34Обтекание сферы1000 микродоменовМосква, 2015 г.Параллельные вычисления.Визуализация сеточных данных© Якобовский М.В.35Потоковая обработка40 процессоров, полное чтение файлаКол-во исходныхточек100 млн.252 млн.512 млн.1000 млн.Время чтенияфайлов данных,мин:сек0:084:3832:0756:54Общее времяработы, мин:секКол-во полученныхточек0:1336:51Не хватило памятиНе хватило памяти1 6813 010-40 процессоров, чтение фрагментов файлаКол-во исходныхточек регулярнойсетки252 млн.252 млн.252 млн.512 млн.512 млн.512 млн.1000 млн.1000 млн.1000 млн.Число фрагментов, накоторые разбивалсякаждый файл18648276464 - 56:54278Общее времяработы, мин:секКол-во полученныхточек изоповерхности24:514:200:1441:400:250:2683:250:452:342 9975 89111 1987 99610 99714 02619 53416 17113 21836Москва, 2015 г.Параллельные вычисления.Визуализация сеточных данных© Якобовский М.В.37Многоуровневое огрубление больших сетокТраектории невесомых частицМосква, 2015 г.Параллельные вычисления.Визуализация сеточных данных© Якобовский М.В.39Моделирование течения вокруглетательного аппаратаМосква, 2015 г.Параллельные вычисления.Визуализация сеточных данных© Якобовский М.В.40Изоповерхности поля плотностиRemoteViewerМосква, 2015 г.Параллельные вычисления.Визуализация сеточных данных© Якобовский М.В.Tecplot41Тетраэдральные сетки 108 узловМосква, 2015 г.Параллельные вычисления.Визуализация сеточных данных© Якобовский М.В.42Измельчение тетраэдральнойсеткиi 4 1 1 i = 8 T0Ti = (T0 ,0 )8 6 4Разбиениететраэдра:- 4 пирамиды- 1 октаэдрМосква, 2015 г.Разбиение октаэдра:- 8 пирамид- 6 октаэдровПараллельные вычисления.Визуализация сеточных данных© Якобовский М.В.43Тетраэдральная сетка• 70 300-> 34 422 954 узлов•401 819 * 83 -> 205 731 328 тетраэдров•Бинарный формат без сжатия-4.1 Гбайт• 500 микродоменов, 44 файла, со сжатием gzip(словарного сжатия Зива-Лемпела) - 1.8 Гбайт•Время расчета шага на 44 процессорах Xeon 3,06 Ghz- 23 секундыПараллельныевычисления.•Времячтения данныхВизуализация– 20 секундМосква, 2015 г.сеточных данных44© Якобовский М.В.Параметры сеткиСколько треугольников в2D в среднемопирается на одинузел?Москва, 2015 г.Сколько пирамид в 3D всреднем опирается наодин узел?Параллельные вычисления.Визуализация сеточных данных© Якобовский М.В.45Заполнение пространствапирамидами• На каждую из 2n точек в среднем опирается2n пирамид• Число пирамид ~ n2Москва, 2015 г.Параллельные вычисления.Визуализация сеточных данных© Якобовский М.В.46Зависимость объема хранимыхданных от числа микродоменовЧисло микродоменов150 1000 1500 2000 2500 3000Размер описания (МБ) 124 127 14515215816316838 350-> 2 356 196 узлов219 034 * 82 -> 14 018 176 тетраэдровНа 35%большечем 124Москва, 2015 г.Параллельные вычисления.Визуализация сеточных данных© Якобовский М.В.47Аппроксимация ипотоковая обработка• Отображение• Расчет• ЗаписьрезультатовTecPlotOriginVISIT ParaViewEnSight OpenDX• Копирование всех данных• Чтение• Формирование сцены• Чтение• ФормированиесценыКлиент-сервернаятехнологияРаспределенная визуализацияУдаленное рабочее местоКлиентскаячастьЛокальная илиглобальная сетьIMM Intel24Коммуникационная частьIMM CLx12РабочиеузлыКоммуникацииPACX-MPIДисковыймассивЛокальная илиглобальная сетьКоммуникацииPACX-MPIДисковыймассивРабочиеузлыОхлаждение процессора медным радиатором97.5мм, 78 медных пластин35мм до границы……100мм~1.4мм10мм……7ммCuТолщина0.3ммCPUМощность65ВтМосква, 2015 г.30x30ммПараллельные вычисления.Визуализация сеточных данных© Якобовский М.В.5050Температура над радиаторомизоповерхность 20.5 ºCМосква, 2015 г.Параллельные вычисления.Визуализация сеточных данных© Якобовский М.В.5151Изоповерхности температуры: Т=20.5, 21, 22.5 Ссетка 800*700*120=67,2 млн.
узловПоказано, чторадиаторырассматриваемойконструкции должныиметь не менее 25 ребердля предохраненияпроцессора отперегрева.Оптимальной являетсяконфигурация сколичеством реберболее 75-100, прикоторой процессор спотребляемоймощностью 65 Вт ни вкаком режиме ненагреваетсявыше 70 ºС.Москва, 2015 г.Параллельные вычисления.Визуализация сеточных данных© Якобовский М.В.5252Москва, 2015 г.Параллельные вычисления.Визуализация сеточных данных© Якобовский М.В.53Москва, 2015 г.Параллельные вычисления.Визуализация сеточных данных© Якобовский М.В.54Москва, 2015 г.Параллельные вычисления.Визуализация сеточных данных© Якобовский М.В.55Зависимость эффективности от числа ядерКонфигурация: 78 тонких ребер (0.3 мм) на радиатореСетка: 1000 х 3500 х 150 = 525 млн.Параллельная реализация: MPI + нити (8 нитей на узле)Москва, 2015 г.Параллельные вычисления.Визуализация сеточных данных© Якобовский М.В.56Схема обменов соответствует методу декомпозиции по данным:на каждом шаге обмен с ближайшими и коллективная операция- взаимодействие соседних в трёхмернойрешетке процессов для согласованиявеличин на внутренних границахМосква, 2015 г.Параллельные вычисления.Визуализация сеточных данных© Якобовский М.В.5757Схема обменов соответствует типичным итерационнымметодам на компактных шаблонах:на каждом шаге обмен с ближайшими и коллективная операция- коллективная операция редуцирования дляопределения величины шага по времениМосква, 2015 г.Параллельные вычисления.Визуализация сеточных данных© Якобовский М.В.5858Эффективность расчета 99%996 узлов 966 по 8 ядер – всего 7728 ядер,организованных в трёхмерную решетку размером 24 х 161 х 2Сетка, узловЯдерВремя, секУскорениеЭффективность525 000 000525 000 0001772811.67670.0016117274.7100.00 %94.13 %1 050 000 00011 050 000 000Москва, 2015 г.772824.2850.00316117683.72Параллельные вычисления.Визуализация сеточных данных© Якобовский М.В.100.00 %99.43 %5959Результаты тестирования производительности- асинхронные обмены,- коллективные операции редуцирования- привязка MPI-процессов к ядрам процессоровобеспечивают отсутствие деградацииэффективности (99%) на доступном числеядер при- компактном шаблоне- сетке 1 миллиард узлов- 7728 ядрахБез привязки процессов кядрам эффективностьрасчетов на числепроцессов, большем чемчисло узлов, падает довеличины порядка 70%.SpeedupEfficiency7 000120%6 000100%5 00080%4 00060%3 00040%Без привязки процессов к ядрам20%2 000Без привязки процессов кядрам1 0000%1Москва, 2015 г.101001 00010 000Параллельные вычисления.Визуализация сеточных данных© Якобовский М.В.-2 0004 000606 00060Записи двух сеточных 2d функцийМосква, 2015 г.Параллельные вычисления.Визуализация сеточных данных© Якобовский М.В.61Групповое сжатие вещественныхчиселОбнуление младших бит мантиссысжимаемый массив вещественных чиселперегруппированные массивы байтПерегруппировка байтСжатие байт стандартной библиотекойzlibМосква, 2015 г.Параллельные вычисления.Визуализация сеточных данных© Якобовский М.В.62Хранение сеточных данныхОтсечение младших бит мантиссы..f=x2+y2+z23.54 бинарный без компрессии без огрублениякомпрессия без огрубления1.000.90ошибка (%)0.800.703.1415923.141593.14153.1413.14доля от полного размера файла0.600.500.400.3010^9 узлов:1000 блоков по 10^6 узлов0.200.1023 106 427 байт0.00024610^9 узлов - 113 354 035 байт –81012141618200.1% - 0.92 битa на узел63Зависимость коэффициента сжатия от числа усеченных битСетка: 1000 х 3500 х 150 = 525 млн узлов1 6001 4001 2001 0008006004002001213282217135321142443402283391713212134711516379718023249208150949818w101_reducedw101_reducedw101_reducedw101_reducedw101_reducedw101_reducedw101_reducedw101_reduced793 457w101grid.bjn17181912.bjn13.bjn14.bjn15.bjn16.bjn17.bjn18.bjn19.bjn64Огрубление данных1.2100.81290.614160.417180.2000.511.522.566Литература1.2.Якобовский М.В.
Введение в параллельные методы решения задач: Учебное пособие / Предисл.: В.А. Садовничий. – М.: Издательство Московского университета, 2013. – 328 с., илл. – (Серия«Суперкомпьютерное образование») ISBN 978-5-211-06382-2Якобовский М.В. Библиотека ввода/вывода сеточных данных. 2007,http://lira.imamod.ru/BjnIO_3D.htmlМосква, 2015 г.Параллельные вычисления.Визуализация сеточных67данных© Якобовский М.В..