Aппаратное обеспечения для решения задач механики сыпучих сред
Report
Share
Report
Share
1 of 20
More Related Content
Aппаратное обеспечения для решения задач механики сыпучих сред
1. ЗАО «КАДФЕМ Си-Ай-Эс»
Аппаратное обеспечения для решения
задач механики сыпучих сред
Юрий Новожилов
Руководитель направления HPC
yury.novozhilov@cadfem-cis.ru
14. СПЕЦИАЛИЗАЦИЯ В ОБЛАСТИ ПРОФЕССИОНАЛЬНОЙ ГРАФИКИ
Наша компания специализируется на производстве
профессиональных графических решений.
Основные направления:
• Супервычислительные станции
• Вычислительные комплексы HPC
• Виртуализация рабочих мест проектировщиков
• Видео стены и масштабная визуализация
15. Ключевые особенности:
Поддержка многоядерных процессоров v3/v4
Поддержка проф. граф. процессоров NVIDIA®
Quadro и Tesla
Низкий уровень шума
Поддержка СВО замкнутого цикла*
Поддержка нестандартных частот CPU
Система мониторинга
ГРАФИЧЕСКИЕ СУПЕРВЫЧИСЛИТЕЛЬНЫЕ СТАНЦИИ
16. ОСОБЕННОСТИ ИСПОЛЬЗОВАНИЯ GPU В ROCKY
Вычислительные алгоритмы заложенные в Rocky получают
значительный прирост производительности при использовании GPU
NVIDIA
• 8 – 14 раз по сравнению с 4-х ядерными рабочими станциями
• 2 – 3 кратный прирост в сравнении с 16-ти ядерными серверами
Rocky не требует использования специализированных
вычислительных GPU*
17. НАШИ РЕКОМЕНДАЦИИ: GPU В ROCKY
Форм-фактор решателя определяет выбор GPU
Rocky на данный момент не поддерживает более одного GPU
Следует обращать внимание на объем памяти GPU особенно для
задач с несферическими частицами.
Выводы:
- оптимальный выбор для сервера Tesla K40
- оптимальный выбор для рабочей станции - QUADRO M5000
- идеальный выбор для рабочей станции: QUADRO K1200 + M5000
(Maximus/ MultiGPU)
18. ЦЕНТР КОМПЕТЕНЦИИ
• поиск оптимальных решений
• сравнительное и нагрузочные тестирование
• решение проблем с производительностью
• поиск “узких” мест
• тест-драйв технических новинок
20. Ключевые особенности:
Процессор: 2 x 22 Core Intel Xeon® E5v3 / v4
Память: max 1536Gb DDR4 ECC
GPU: 8 x ускорителей NVIDIA® TESLA
LAN: 2 x Intel® 1000Mb/s
InfiniBand card 56Gb/s*
8 x SAS / SATA SSD
Производительность: SP~ 41Tflops
ВЫЧИСЛИТЕЛЬНЫЕ КОМПЛЕКСЫ [HPC]
Editor's Notes
Аппаратное обеспечение и IT-решения
Эффективность систем автоматизации инженерных расчетов напрямую зависит и от аппаратных средств. Для ускорения инженерных расчетов мы планируем, реализуем и обслуживаем ИТ-решения от автономных рабочих станций до серверов для высокопроизводительных облачных вычислений. Мы поможем Вам разработать и согласовать техническое задание на поставку и внедрение программно-аппаратного комплекса с учетом требований и специфики решаемых задач, обеспечим поставку готовой, сконфигурированной под Ваши требования, отлаженной системы.
Мы также оказываем поддержку в проектировании и реализации вычислительного центра, оптимизированного с точки зрения автоматизации инженерных расчетов, причем наши услуги охватывают весь спектр: от планирования и формирования до обеспечения текущей эксплуатации вычислительных ресурсов. Таким образом, Вы всегда можете положиться на эксплуатационную готовность и производительность своих систем.
Эффективное использование всего потенциала программного и аппаратного обеспечения:
снижение времени расчета;
расчет более подробных моделей;
повышение точности расчетов.
Добрый день, меня зовут Евгений Зверев, технический директор компании Форсайт. Я отвечаю за продажи высокопроизводительных решений и систем визуализации.
В первую очередь хочу выразить благодарность Юрию Новожилову и компании Кадфем за предоставленную возможность совместного тестирования нового программного продукта.
Кратко хочу рассказать о профиле нашей деятельности.
Итак наша компания специализируется на комплексных поставках профессиональных графических решений таких как:
Графические станции для визуализации и инженерных расчетов
Персональные суперкомпьютеры и вычислительные кластеры на базе ускорителей NVIDIA TESLA
- Системы масштабной визуализации и отображения, т.е видеостены и видеоконтроллеры.
Виртуализация инженерных рабочих мест
К сожалению формат данной презентации не позволяет развернуто рассказать о каждом направлении, а так же обо всех новых GPU технологиях, поэтому постараюсь максимально кратко и сжато пробежаться по одной из тем. Итак тема моей презентации это: АППАРАТНЫЕ РЕШЕНИЯ ДЛЯ ВИЗУАЛИЗАЦИИ И РАСЧЕТОВ.
В ходе нашего эксперимента мы использовали тестовый стенд на базе нашего типового решения, графической станции Forsite HPC, предлагаю кратко ознакомиться с основными особенностями данного решения:
Поддержка многоядерных процессоров v3/v4 (буквально в следующем месяце Intel анонсирует новое поколение процессоров Intel Xeon, топовая модификация будет иметь 22 ядра. )
Поддержка проф. граф. процессоров NVIDIA® Quadro и Tesla
Позвольте сделать небольшой акцент именно на достаточно нестандартной системе охлаждения нашей рабочей станции.
Достаточно часто мы сталкивались с ситуацией, когда графические станции и суперкомпьютеры устанавливались в офисном помещении, и пользователи жаловались на сильный уровень шума, который явно не способствал комфортной работе.
Именно поэтому в наших рабочих станциях мы используем замкнутые системы жидкостного охлаждения. Более того подобные системы значительно эффективнее обеспечивают отвод тепла от центрального процессора, что позволяет без риска повысить тактовые частоты на процессорах с разблокированным множителем.
Важный аспект любого эксперимента это
Система мониторинга
Не важно проводим ли мы тестовый эксперимент или считаем реальную задачу, важно иметь полное понимание что происходит с рабочей станцией. Это позволяет вовремя диагностировать возможные проблемы, и найти узкие места в нашей системе.
Вернемся к результатам, которые озвучил Юрий в предыдущей части презентации:
Вычислительные алгоритмы заложенные в Rocky получают значительный прирост производительности при использовании GPU NVIDIA
8 – 14 раз по сравнению с 4-х ядерными рабочими станциями
2 – 3 раза по сравнению в 16-ти ядерными серверами
Первоначальный вывод к которому мы пришли :
Rocky не требует использования специализированных вычислительных GPU,*
На следующем слайде разберем данный момент более подробно.
На данном слайде я хочу дать небольшие рекомендации, как достичь максимальной эффективности при расчетах на GPU в Rocky
В первую очередь при проектировании расчетной системы надо определить для себя форм-фактор нашей будущей вычислительной системы.
Почему это важно?
Дело в том что ускорители предназначенные для установки в серверную платформу и в рабочую станцию, имеют разную систему охлаждения, а именно для установки в сервера используются ускорители с пассивной системой охлаждения Tesla K80 / K40
Отсутствие возможности расчета на нескольких GPU делает неэффективным применение TESLA K80, если сервер используется только для Rocky, особенно явно это заметно для задач со сферическими частицами.
K80 представляет из себя двухчиповую карту, и в наших расчетах полностью задействован только 1 чип. Таким образом оптимальный вариант для использования в вычислительном сервере
Игровая карта 980Ti показывает отличный результат, особенно если вспомнить тот факт, что это самая доступная по цене карта, но в задачах с несферическими частицами утилизация памяти GPU составляет около 100%. Таким образом в случае наличия более сложной задачи, есть вероятность что оперативной памяти графического ускорителя будет явно мало.
Если у Вас есть задача, но в данный момент у вас нет понимания какое программно-аппаратное решение будет для Вас оптимальным, предварительное тестирование поможет определиться с выбором правильного решения.
В тестовой лаборатории нашей компании развернуты универсальные демонстрационные стенды на которых Вы можете произвести необходимое функциональное и нагрузочное тестирования на различных конфигурациях оборудования, а так же смоделировать различные сценарии.
В случае если у Вас возникли вопросы технического характера, прошу обращаться, - на данном слайде мои контактные данные.
Спасибо за внимание.
Вопросы?