Пресс-центр

Моделирование тепловых процессов в грунтах: NVIDIA Tesla K20 против Intel Core i7

Проблема

boxshot-frost-3d.jpg

В настоящее время моделирование тепловых процессов в грунтах необходимо при строительстве шахт, тоннелей, в том числе тоннелей метро, котлованов для возведения плотин, и строительстве других сооружений на слабых и водоносных грунтах, где применяют технологию искусственной заморозки грунта. Особенно актуально выполнение теплотехнических расчетов при проектировании зданий и различных сооружений, трубопроводов, автомобильных и железных дорог, возводимых на территории распространения многолетнемерзлых грунтов. Для решения этих задач компанией Simmakers был разработан программный комплекс Frost 3D, предназначенный для трехмерного моделирования тепловых процессов в грунтах с учетом фильтрации и теплового воздействия различных сооружений и охлаждающих устройств, термостабилизирующих грунт.

Решение таких тепловых задач осуществляется на многомиллионных сетках, поскольку масштаб области моделирования – сотни метров, где размерность некоторых элементов, таких, как теплоизоляционных материалов, труб охлаждающих устройств, - сантиметры, а прогноз необходимо выполнять на несколько лет. На практике такие расчеты можно выполнить только с использованием параллельных вычислений.

Решение

В настоящее время все большую популярность в области параллельных вычислений завоевывает технология GPGPU – использование графических ускорителей для вычислений общего назначения. В связи с этим компания Simmakers совместно с NVIDIA и Forsite провели исследование увеличения производительности вычислительных алгоритмов программы Frost3D при переносе распараллеленного расчетного механизма с CPU на GPU.

С целью исследования скорости вычислений на различных аппаратных средствах было создано несколько тестовых задач с различным размером расчетной сетки:

1) 1 млн. ячеек (100x100x100); 5) 27 млн. ячеек (300x300x300);
2) 3,4 млн. ячеек (150x150x150); 6) 42.9 млн. ячеек (350x350x350);
3) 8 млн. ячеек (200x200x200); 7) 64 млн. ячеек (400x400x400); 
4) 15.6 млн. ячеек (250x250x250); 8) 91 млн. ячеек (450x450x450).

На этих расчетных сетках решалась трехмерная двухфазная задача Стефана – нестационарная задача нелинейной теплопроводности с фазовыми превращениями. Для эффективного распараллеливания вычислений, код расчетного механизма был написан в двух версиях: для центральных процессоров Intel – на языке C++ с поддержкой директив распараллеливания OpenMP, а для графических процессоров NVIDIA– на языке CUDA C++.

Ниже на гистограмме представлено ускорение вычислений относительно Core i7, получаемое на различных графических процессорах для тестовых моделей с разными размерами расчетной сетки.

График 1

Далее на графике показана зависимость затрачиваемого времени от типа процессора при решении тепловой задачи в расчетной области в виде куба с размерами 20x20x20 метров.

График 2

Объем памяти использованных для тестирования программы Frost 3D видеокарт NVIDIA GeForce (2 Гб) позволяет моделировать задачи теплопроводности с числом узлов до 42 миллионов. Графический процессор NVIDIA Tesla K20 имеет в распоряжении 5 Гб памяти, что дает возможность производить расчет на сетках до 105 миллионов узлов.

В то же время, используемые в тесте процессоры компании Intel могут использовать до 32 Гб оперативной памяти, это позволит рассчитывать в программе Frost 3D тепловые задачи на сетках, состоящих из 690 миллионам узлов, учитывая, что как минимум 1 Гб оперативной памяти используется другими процессами системы.

ЗНАЧЕНИЕ

В качестве демонстрации возможностей CUDA и OpenMP версий расчетного механизма был произведен расчет опубликованной ранее прикладной задачи: моделирование заморозки грунта по периметру атомной электростанции «Фукусима». Расчет выполнялся на персональном компьютере с использованием процессора Intel Core i7 и на сервере с ускорителем NVIDIA Tesla K20. Время решения этой задачи получилось следующее: Intel Core i7 —58 минут, Tesla K20 — 6 минут.

«Полученные результаты тестирования GPU-версии приложения Frost 3D превзошли наши самые смелые ожидания, - говорит Дмитрий Евланов, управляющий директор компании Simmakers. – С нетерпением ждем возможности протестировать приложение на новейшем ускорителе NVIDIA Tesla K40».