Высокопроизводительные парал. вычисления на кластерных системах. Воеводин (2005) (1186026), страница 14
Текст из файла (страница 14)
Рассмотренный в работе алгоритм допускает эффективную последовательную реализацию, связанную с использованием одинарнойточности и оптимизацией работы с памятью.2. Данный алгоритм допускает эффективное распараллеливание спочти линейным ускорением.3. К сожалению, алгоритм является экспоненциальным по числумоментов исполнения опциона.
Несмотря на эффективную параллельную реализацию, на 4-х процессорах Intel® Itanium® 2 вычисления дляодного эксперимента занимают более двух часов при d = 7.4. В настоящее время мы работаем над реализацией другого алгоритма, являющегося линейным по числу моментов исполнения опциона, что позволит вычислять значение опциона при d > 7.Литература1.
Ширяев А.Н. Основы стохастической финансовой математики. В 2 т.– М.:Фазис, 1998.2. Boyle P.P., Broadie M., Glasserman P. Monte Carlo methods for security pricing // Journal of Economic Dynamics and Control, June 1997. V. 21.P. 1267–1321.3. Broadie M., Glasserman P. Pricing American-style securities using simulation // Journal of Economic Dynamics and Control, June 1997. V. 21.P.
1323–1352.4. Black F., Scholes M. The pricing options and corporate liabilities // Journal of Political Economy, 1973. V. 3. P. 637–659.5. (R) Intel, логотип Intel, логотип Intel Inside, Intel Centrino, Intel Pentium, Intel Celeron, Intel Itanium, Intel Xeon, Intel SpeedStep являются товар66ными знаками, либо зарегистрированными товарными знаками, права накоторые принадлежат корпорации Intel или ее подразделениям на территории США и других стран.Все фирменные наименования, товарные знаки, знаки обслуживания ииные обозначения и наименования являются объектами прав их законныхправообладателейАНАЛИЗ ЭФФЕКТИВНОСТИ РАСПАРАЛЛЕЛЕННОГОАЛГОРИТМА КОНЕЧНО-ЭЛЕМЕНТНОГО РЕШЕНИЯТРЕХМЕРНЫХ НЕЛИНЕЙНЫХ ЗАДАЧ ДИНАМИКИКОНСТРУКЦИЙ НА КЛАСТЕРАХА.В.
Гордиенко, А.В. Дудник, А.И. Кибец, Ю.И. КибецНИИ механики Нижегородского госуниверситетаВ [1] изложен распараллеленный алгоритм конечно-элементнойметодики [2] решения трехмерных нелинейных задач динамики конструкций. Данный алгоритм реализован в рамках вычислительной системы (ВС) «Динамика-3» [3] и на ряде примеров исследована его эффективность.Постановка задачи. Метод решенияВ [1, 2] рассматриваются трехмерные задачи нестационарного деформирования конструкций, включающих массивные тела и оболочки.Конструкции могут быть выполнены из кусочно однородных, изотропных, упругопластических материалов и подкреплены дискретной системой криволинейных стержней, воспринимающих усилия растяжения-сжатия.
Допускается, что количество армирующих стержней сравнительно невелико и их расположение в основном материале можетбыть нерегулярным. Отдельные конструктивные элементы могут вступать в контакт друг с другом или взаимодействовать с внешними телами.Определяющая система уравнений сплошной среды формулируется в переменных Лагранжа.
Уравнение движения выводятся из вариационного принципа Журдена. Кинематические соотношения формулируются в метрике текущего состояния. В качестве уравнений состояниядля традиционных материалов используются соотношения теории течения с кинематическим и изотропным упрочнением. Бетон рассматривается как разномодульная, упругая, физически нелинейная среда,свойства которой зависят от вида напряженно-деформированного со67стояния (НДС) и текущего уровня поврежденности материала [4]. Воснову модели хрупкого разрушения разномодульных материалов положен критерий максимальных нормальных напряжений.
На контактирующих поверхностях задаются условия непроникания. Гипотезы,принятые в теории тонкостенных элементов конструкций вводятся наэтапе дискретизации определяющей системы уравнений. Благодаряэтому можно упростить стыковку разных типов конструктивных элементов и учесть особенности их напряженно-деформированного состояния.Решение задачи при заданных начальных и граничных условияхосновано на методе конечных элементов и явной конечно-разностнойсхеме интегрирования по времени типа «крест» [2]. Для учета дискретного расположения подкрепляющих стержней разработан конечныйэлемент, описывающий взаимодействие сплошной среды и арматуры[5].
Согласно [5] напряжения в стержне заменяются статически эквивалентными силами узлов КЭ сетки основного материала, что позволяетучесть дискретность армирующей системы, не вводя дополнительныхстепеней свободы в конечно-элементную модель конструкции.Метод распараллеливанияВ дискретном аналоге уравнений движения матрица масс являетсядиагональной и не возникает необходимости в ее обращении. Благодаря этому расчетная схема обладает большим параллелизмом по данными вычислениям.
В настоящей работе для ее распараллеливания былприменен метод пространственной декомпозиции расчетной области(domain decomposition method) [1, 6, 7], в соответствии с которым вычисления в разных точках расчетной области распределяются в разныеузлы кластера. Алгоритм решения задачи на каждом временном слоераспадается на две части: последовательную и параллельную. Основной объем вычислений (определение компонент деформаций, напряжений, узловых сил, интегрирование уравнений движения и т.д.) осуществляется параллельно.
В последовательной части происходит согласование рассчитанных величин, полученных на разных узлах кластера [1].Оценка эффективности параллельных вычисленийОтладка и тестирование модернизированной версии ВС «Динамика 3» производились на кластере, включающем в себя два узла - персональные ЭВМ на базе процессоров Intel Pentium IV с тактовой частотой2.0 ГГц.
Объем оперативной памяти каждого узла составляет 512 Мб.68В качестве коммуникационной среды использовалась сеть Ethernet,обеспечивающая обмен данными со скоростью до 80 Мбит/с, и интерфейс обмена сообщениями mpich-1.2.5. Операционная система кластера – Linux ASP 7.3.Эффективность работы распараллеленного варианта ВС «Динамика-3»оценивалась на ряде тестовых задач. В частности, рассмотрен изгибжестко заделанной на торцах железобетонной балки [5] под действиемимпульса давления. Расчеты проводились на сетках, содержащих от10000 до 160000 конечных элементов.
Проведено сравнение временирешения задачи на одном и двух процессорах. На основе этих данныхпостроена диаграмма зависимости эффективности вычислений [6], отколичества конечных элементов сетки расчетной области (см. рисунок).Эффективность вычислений в зависимости от числа КЭ0.90.80.70.60.50.40.30.20.1010000200004000080000120000160000Согласно полученным результатам максимальная эффективностьна данном кластере достигается при решении задачи на сетках, имеющих от 80000 до 120000 КЭ, и составляет более 80%. Причиной этомуследует считать пропускные характеристики коммуникационной среды. При малом числе КЭ загруженность процессоров узлов небольшаяи время вычислений значительно меньше времени обмена данными.
Сувеличением числа КЭ доля вычислений возрастает до тех пор, покаобъем данных пересылаемых за единицу времени не достигает величины пропускной способности коммуникационной среды. Дальнейшееувеличение числа КЭ приводит к увеличению нагрузки на коммуникационную среду при обмене данными между узлами кластера и сниже69нию эффективности параллельных вычисленийВ процессе счета необходимость обмена данными между вычислительными узлами возникает при согласовании расчетных величин награницах смежных подобластей, принадлежащих различным узлам ипри вычислении сил в контактных зонах. Доля этих последовательныхчастей алгоритма в общем времени решения задачи зависит от двухфакторов: конкретного вида расчетной области и способа ее разбиенияна подобласти.
Очевидно, что увеличение участков границ смежныхподобластей требует большего времени на согласование узловых сил искоростей между ними. То же самое справедливо и для зон контакта.Поэтому для повышения эффективности вычислений на кластере необходимо еще на этапе подготовки исходных данных для решения задачиминимизировать размеры границ сшивки подобластей и зон контакта.Еще одним моментом, на который следует обратить внимание, является то, что при образовании пластических деформаций или зон разрушения активизируется соответствующая процедура корректировкинапряженно-деформированного состояния, требующая дополнительных вычислительных затрат. Это так же необходимо учитывать приразбиении расчетной области на подобласти, поскольку даже при одинаковом количественном распределении конечных элементов междувычислительными узлами, возможна их различная загруженность впроцессе решения задачи.Работа выполнена при частичном финансировании Российскогофонда фундаментальных исследований (код проекта 05-08-33618-а) иведомственной научной программы «Развитие научного потенциалавысшей школы» (проект № 4661).Литература1.
Баженов В.Г., Гордиенко А.В., Кибец А.И., Лаптев П.В. Адаптацияпоследовательной методики решения нелинейных задач динамики конструкций для многопроцессорных ЭВМ // Материалы IV Международногонаучно-практического семинара и Всероссийской молодежной школ «Высокопроизводительные параллельные вычисления на кластерных системах» / Под редакцией члена-корреспондента РАН В.А.Сойфера, Самара,30сентября – 2 октября 2004 г. Самара. 2004. С. 20–25.2.
Баженов В.Г., Кибец А.И. Численное моделирование трехмерныхзадач нестационарного деформирования упругопластических конструкцийметодом конечного элемента // Изв. PAH МТТ. 1994. № 1. С. 52–59.3. Сертификат соответствия Госстандарта России № РОССRU.ME20.H00338.704. Баженов В.Г., Гордиенко А.В., Дудник А.В., Кибец А.И., ТороповВ.В. Применение метода конечных элементов для решения трехмерныхзадач деформирования и разрушения кирпичной кладки при взрывном нагружении // Вестник ННГУ. Серия Механика. 2004. Вып.