20151028_msu_9_Visual (1185576)
Текст из файла
ВМК МГУВизуализация сеточных данныхМ.В.Якобовскийmail: lira@imamod.ruweb: http://lira.imamod.ruКомпьютер пользователя на порядки слабее суперкомпьютераUSA, Titan, Cray XK7, NVIDEA K20x, 27 Pflopsflops2301 TfКитай, Tianhe-1AМГУ, Ломоносов, 1.7 Pflops1 Pflops281 TfМСЦ100 T10 T1TМГУ, ЛомоносовМГУ, ЧебышевМСЦРАН1,12 TfМВС-1000М1,65 Tf100 G60 Gf10 G1G0,42 Gf19952000200520102015 г г.Workstation, one core: 1/100 000…TOP 500Москва, 2015 г.2Параллельные вычисления.Визуализация сеточных данных© Якобовский М.В.Визуализация• Скалярные• Векторные• Стационарные• Зависящие от времени• Решетки• Треугольные и тетраэдральные сеткиМосква, 2015 г.Параллельные вычисления.Визуализация сеточных данных© Якобовский М.В.3Вычислительная средаПроектПостроениегеометрическоймодели,поверхностнойи объемнойсетки.Заданиеатрибутов.Выборматематическоймодели и солверов.Сопоставлениеатрибутамначальных играничных условий,физическихпараметров.ВыборсерверавычисленийВыборсерверавизуализацииФормирование варианта заданияРасчет варианта заданияМосква, 2015 г.ВизуализациярезультатовФайлыПараллельные вычисления.результатовВизуализация сеточныхданных© Якобовский М.В.4Этапы визуализацииСеткаЗаписьСеточная функцияЧтениеФормирование объектов виртуальной сценыОтображениеМосква, 2015 г.Параллельные вычисления.Визуализация сеточных данных© Якобовский М.В.5Методы••••Распределенное иерархическое хранениеДекомпозицияОгрубление с контролируемой точностьюКлиент-серверная технология• Потоковая обработка• Хранение образовМосква, 2015 г.Параллельные вычисления.Визуализация сеточных данных© Якобовский М.В.6Визуализация в распределенных системахMeshFlow over planeIso-surfaces78910111213141516Аппроксимация ипотоковая обработка• Отображение• Копирование всех данных• Чтение• Формирование сцены• On/Off line• Расчет• ЗаписьрезультатовTecPlotOriginVISIT ParaViewEnSight OpenDX• Чтение• ФормированиесценыКлиент-сервернаятехнологияСечение регулярной 3D сеткиплоскостью• В результате сечения регулярнойкубической решетки получаетсяфрагмент неструктурированной сеткиМосква, 2015 г.Параллельные вычисления.Визуализация сеточных данных© Якобовский М.В.18Аппроксимация триангулированныхповерхностей• Алгоритмы синтеза• Алгоритмы редуцированияМосква, 2015 г.Параллельные вычисления.Визуализация сеточных данных© Якобовский М.В.19Начальная аппроксимация кривойМосква, 2015 г.Параллельные вычисления.Визуализация сеточных данных© Якобовский М.В.20Аппроксимация кривойэтап 21 векторМосква, 2015 г.Параллельные вычисления.Визуализация сеточных данных© Якобовский М.В.21Аппроксимация кривойэтап 33 вектораМосква, 2015 г.Параллельные вычисления.Визуализация сеточных данных© Якобовский М.В.22Аппроксимация кривойэтап 47 векторовМосква, 2015 г.Параллельные вычисления.Визуализация сеточных данных© Якобовский М.В.23Аппроксимация кривойэтап 515 векторовМосква, 2015 г.Параллельные вычисления.Визуализация сеточных данных© Якобовский М.В.24Методы редуцированияУдаление ребраУдаление точкиУточнение топологииМосква, 2015 г.Параллельные вычисления.Визуализация сеточных данных© Якобовский М.В.25Аппроксимация изоповерхностейМосква, 2015 г.Параллельные вычисления.Визуализация сеточных данных© Якобовский М.В.26ИзоповерхностиОшибка аппроксимации 5%Москва, 2015 г.Параллельные вычисления.Визуализация сеточных данных© Якобовский М.В.27Расчетная сеткаМосква, 2015 г.Параллельные вычисления.Визуализация сеточных данных© Якобовский М.В.28Моделирование обтекания телсферической формыСтационарное обтекание скошенной сферыM = 0.8 Re = 100Нестационарное обтекание скошенной сферыM = 0.8 Re = 100000Стационарное обтекание сферы M = 0.1 Re = 25Параллельные вычисления.Москва, 2015 г.Визуализация сеточных данныхРассчитанные траектории отмеченных частиц.
Re=25Эксперимент. Re=26.8 (Ван-Дайк М., 1986)© Якобовский М.В.29Огрубление поверхностейМосква, 2015 г.Параллельные вычисления.Визуализация сеточных данных© Якобовский М.В.30Огрубление поверхностейОшибкаКоличествоточекКоличествотреугольниковКоэффициентсжатия0%1380027357-0,1%1120211712,90,2%44780833,90,5%17530490,0Москва, 2015 г.Параллельные вычисления.Визуализация сеточных данных© Якобовский М.В.31Формирование макрографаМосква, 2015 г.Параллельные вычисления.Визуализация сеточных данных© Якобовский М.В.32Сетка микродоменоввесчисло% отн. число1230.01%1330.01%14150.03%15330.06%162280.44%171 3732.66%185 43310.54%1911 71322.73%2014 21827.59%2111 06921.48%225 73711.13%231 5052.92%241920.37%25130.03%2620.00%2710.00%Москва, 2015 г.51 538 микродоменПараллельные вычисления.Визуализация сеточных данных© Якобовский М.В.33Двухуровневое разбиениеIСетка предварительно разбиваетсяна большое число микродоменов,образующих макрографIIВершины макрографараспределяются по процессорам34Обтекание сферы1000 микродоменовМосква, 2015 г.Параллельные вычисления.Визуализация сеточных данных© Якобовский М.В.35Потоковая обработка40 процессоров, полное чтение файлаКол-во исходныхточек100 млн.252 млн.512 млн.1000 млн.Время чтенияфайлов данных,мин:сек0:084:3832:0756:54Общее времяработы, мин:секКол-во полученныхточек0:1336:51Не хватило памятиНе хватило памяти1 6813 010-40 процессоров, чтение фрагментов файлаКол-во исходныхточек регулярнойсетки252 млн.252 млн.252 млн.512 млн.512 млн.512 млн.1000 млн.1000 млн.1000 млн.Число фрагментов, накоторые разбивалсякаждый файл18648276464 - 56:54278Общее времяработы, мин:секКол-во полученныхточек изоповерхности24:514:200:1441:400:250:2683:250:452:342 9975 89111 1987 99610 99714 02619 53416 17113 21836Москва, 2015 г.Параллельные вычисления.Визуализация сеточных данных© Якобовский М.В.37Многоуровневое огрубление больших сетокТраектории невесомых частицМосква, 2015 г.Параллельные вычисления.Визуализация сеточных данных© Якобовский М.В.39Моделирование течения вокруглетательного аппаратаМосква, 2015 г.Параллельные вычисления.Визуализация сеточных данных© Якобовский М.В.40Изоповерхности поля плотностиRemoteViewerМосква, 2015 г.Параллельные вычисления.Визуализация сеточных данных© Якобовский М.В.Tecplot41Тетраэдральные сетки 108 узловМосква, 2015 г.Параллельные вычисления.Визуализация сеточных данных© Якобовский М.В.42Измельчение тетраэдральнойсеткиi 4 1 1 i = 8 T0Ti = (T0 ,0 )8 6 4Разбиениететраэдра:- 4 пирамиды- 1 октаэдрМосква, 2015 г.Разбиение октаэдра:- 8 пирамид- 6 октаэдровПараллельные вычисления.Визуализация сеточных данных© Якобовский М.В.43Тетраэдральная сетка• 70 300-> 34 422 954 узлов•401 819 * 83 -> 205 731 328 тетраэдров•Бинарный формат без сжатия-4.1 Гбайт• 500 микродоменов, 44 файла, со сжатием gzip(словарного сжатия Зива-Лемпела) - 1.8 Гбайт•Время расчета шага на 44 процессорах Xeon 3,06 Ghz- 23 секундыПараллельныевычисления.•Времячтения данныхВизуализация– 20 секундМосква, 2015 г.сеточных данных44© Якобовский М.В.Параметры сеткиСколько треугольников в2D в среднемопирается на одинузел?Москва, 2015 г.Сколько пирамид в 3D всреднем опирается наодин узел?Параллельные вычисления.Визуализация сеточных данных© Якобовский М.В.45Заполнение пространствапирамидами• На каждую из 2n точек в среднем опирается2n пирамид• Число пирамид ~ n2Москва, 2015 г.Параллельные вычисления.Визуализация сеточных данных© Якобовский М.В.46Зависимость объема хранимыхданных от числа микродоменовЧисло микродоменов150 1000 1500 2000 2500 3000Размер описания (МБ) 124 127 14515215816316838 350-> 2 356 196 узлов219 034 * 82 -> 14 018 176 тетраэдровНа 35%большечем 124Москва, 2015 г.Параллельные вычисления.Визуализация сеточных данных© Якобовский М.В.47Аппроксимация ипотоковая обработка• Отображение• Расчет• ЗаписьрезультатовTecPlotOriginVISIT ParaViewEnSight OpenDX• Копирование всех данных• Чтение• Формирование сцены• Чтение• ФормированиесценыКлиент-сервернаятехнологияРаспределенная визуализацияУдаленное рабочее местоКлиентскаячастьЛокальная илиглобальная сетьIMM Intel24Коммуникационная частьIMM CLx12РабочиеузлыКоммуникацииPACX-MPIДисковыймассивЛокальная илиглобальная сетьКоммуникацииPACX-MPIДисковыймассивРабочиеузлыОхлаждение процессора медным радиатором97.5мм, 78 медных пластин35мм до границы……100мм~1.4мм10мм……7ммCuТолщина0.3ммCPUМощность65ВтМосква, 2015 г.30x30ммПараллельные вычисления.Визуализация сеточных данных© Якобовский М.В.5050Температура над радиаторомизоповерхность 20.5 ºCМосква, 2015 г.Параллельные вычисления.Визуализация сеточных данных© Якобовский М.В.5151Изоповерхности температуры: Т=20.5, 21, 22.5 Ссетка 800*700*120=67,2 млн.
узловПоказано, чторадиаторырассматриваемойконструкции должныиметь не менее 25 ребердля предохраненияпроцессора отперегрева.Оптимальной являетсяконфигурация сколичеством реберболее 75-100, прикоторой процессор спотребляемоймощностью 65 Вт ни вкаком режиме ненагреваетсявыше 70 ºС.Москва, 2015 г.Параллельные вычисления.Визуализация сеточных данных© Якобовский М.В.5252Москва, 2015 г.Параллельные вычисления.Визуализация сеточных данных© Якобовский М.В.53Москва, 2015 г.Параллельные вычисления.Визуализация сеточных данных© Якобовский М.В.54Москва, 2015 г.Параллельные вычисления.Визуализация сеточных данных© Якобовский М.В.55Зависимость эффективности от числа ядерКонфигурация: 78 тонких ребер (0.3 мм) на радиатореСетка: 1000 х 3500 х 150 = 525 млн.Параллельная реализация: MPI + нити (8 нитей на узле)Москва, 2015 г.Параллельные вычисления.Визуализация сеточных данных© Якобовский М.В.56Схема обменов соответствует методу декомпозиции по данным:на каждом шаге обмен с ближайшими и коллективная операция- взаимодействие соседних в трёхмернойрешетке процессов для согласованиявеличин на внутренних границахМосква, 2015 г.Параллельные вычисления.Визуализация сеточных данных© Якобовский М.В.5757Схема обменов соответствует типичным итерационнымметодам на компактных шаблонах:на каждом шаге обмен с ближайшими и коллективная операция- коллективная операция редуцирования дляопределения величины шага по времениМосква, 2015 г.Параллельные вычисления.Визуализация сеточных данных© Якобовский М.В.5858Эффективность расчета 99%996 узлов 966 по 8 ядер – всего 7728 ядер,организованных в трёхмерную решетку размером 24 х 161 х 2Сетка, узловЯдерВремя, секУскорениеЭффективность525 000 000525 000 0001772811.67670.0016117274.7100.00 %94.13 %1 050 000 00011 050 000 000Москва, 2015 г.772824.2850.00316117683.72Параллельные вычисления.Визуализация сеточных данных© Якобовский М.В.100.00 %99.43 %5959Результаты тестирования производительности- асинхронные обмены,- коллективные операции редуцирования- привязка MPI-процессов к ядрам процессоровобеспечивают отсутствие деградацииэффективности (99%) на доступном числеядер при- компактном шаблоне- сетке 1 миллиард узлов- 7728 ядрахБез привязки процессов кядрам эффективностьрасчетов на числепроцессов, большем чемчисло узлов, падает довеличины порядка 70%.SpeedupEfficiency7 000120%6 000100%5 00080%4 00060%3 00040%Без привязки процессов к ядрам20%2 000Без привязки процессов кядрам1 0000%1Москва, 2015 г.101001 00010 000Параллельные вычисления.Визуализация сеточных данных© Якобовский М.В.-2 0004 000606 00060Записи двух сеточных 2d функцийМосква, 2015 г.Параллельные вычисления.Визуализация сеточных данных© Якобовский М.В.61Групповое сжатие вещественныхчиселОбнуление младших бит мантиссысжимаемый массив вещественных чиселперегруппированные массивы байтПерегруппировка байтСжатие байт стандартной библиотекойzlibМосква, 2015 г.Параллельные вычисления.Визуализация сеточных данных© Якобовский М.В.62Хранение сеточных данныхОтсечение младших бит мантиссы..f=x2+y2+z23.54 бинарный без компрессии без огрублениякомпрессия без огрубления1.000.90ошибка (%)0.800.703.1415923.141593.14153.1413.14доля от полного размера файла0.600.500.400.3010^9 узлов:1000 блоков по 10^6 узлов0.200.1023 106 427 байт0.00024610^9 узлов - 113 354 035 байт –81012141618200.1% - 0.92 битa на узел63Зависимость коэффициента сжатия от числа усеченных битСетка: 1000 х 3500 х 150 = 525 млн узлов1 6001 4001 2001 0008006004002001213282217135321142443402283391713212134711516379718023249208150949818w101_reducedw101_reducedw101_reducedw101_reducedw101_reducedw101_reducedw101_reducedw101_reduced793 457w101grid.bjn17181912.bjn13.bjn14.bjn15.bjn16.bjn17.bjn18.bjn19.bjn64Огрубление данных1.2100.81290.614160.417180.2000.511.522.566Литература1.2.Якобовский М.В.
Введение в параллельные методы решения задач: Учебное пособие / Предисл.: В.А. Садовничий. – М.: Издательство Московского университета, 2013. – 328 с., илл. – (Серия«Суперкомпьютерное образование») ISBN 978-5-211-06382-2Якобовский М.В. Библиотека ввода/вывода сеточных данных. 2007,http://lira.imamod.ru/BjnIO_3D.htmlМосква, 2015 г.Параллельные вычисления.Визуализация сеточных67данных© Якобовский М.В..
Характеристики
Тип файла PDF
PDF-формат наиболее широко используется для просмотра любого типа файлов на любом устройстве. В него можно сохранить документ, таблицы, презентацию, текст, чертежи, вычисления, графики и всё остальное, что можно показать на экране любого устройства. Именно его лучше всего использовать для печати.
Например, если Вам нужно распечатать чертёж из автокада, Вы сохраните чертёж на флешку, но будет ли автокад в пункте печати? А если будет, то нужная версия с нужными библиотеками? Именно для этого и нужен формат PDF - в нём точно будет показано верно вне зависимости от того, в какой программе создали PDF-файл и есть ли нужная программа для его просмотра.