Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                
SlideShare a Scribd company logo
ЗАО «КАДФЕМ Си-Ай-Эс»
Аппаратное обеспечения для решения
задач механики сыпучих сред
Юрий Новожилов
Руководитель направления HPC
yury.novozhilov@cadfem-cis.ru
Консалтинг в области высокопроизводительных вычислений
2© ЗАО «КАДФЕМ Си-Ай-Эс», 2015
Компания ЗАО «КАДФЕМ Си-Ай-Эс» на постоянной основе занимается поставкой и
настройкой высокопроизводительных вычислительных систем:
• Установка и настройка программного обеспечения
• Проектирование, внедрение и поддержка вычислительных центров
• Поставка вычислительных комплексов для проведения инженерных расчетов
Через наши руки каждый год проходят десятки проектов в области HPC
Построение вычислительной инфраструктуры
для решения задач методом дискретных
элементов (DEM)
3© ЗАО «КАДФЕМ Си-Ай-Эс», 2016
Тестовая задача – конвейерная система
4© ЗАО «КАДФЕМ Си-Ай-Эс», 2016
Бункер
Первый
конвейер
Промежуточный
бункер
Второй
конвейер
Удельный весь руды 3 300 кг/м3
Производительность 10 000 т/час
Общая длина лент ≈ 20 м
Скорость ленты 4 м/c
Перепад высот 10 м
Гранулометрический состав
5© ЗАО «КАДФЕМ Си-Ай-Эс», 2016
В расчете участвует около 1 000 000 частиц
Расчет I
Сферические частицы
Расчет II
Несферические частицы
(скругленные многоугольники – 3, 5, 7 сторон)
Размер частицы, мм Состав, % по массе
22 30
25 35
30 30
35 5
Тестовый стенд
6© ЗАО «КАДФЕМ Си-Ай-Эс», 2016
• Intel Xeon E5-2667v3 3.2ГГц 8C x2
• 128 Гб оперативной памяти DDR4
• SSD INTEL 240GB S3500 Series x2
• Windows 8.1 Professional
• NVIDIA Tesla K40m
• NVIDIA Tesla K80
• NVIDIA Quadro M5000
Расчет I: Сферические частицы
7© ЗАО «КАДФЕМ Си-Ай-Эс», 2016
100%
200%
300%
400%
500%
600%
700%
800%
0
1000
2000
3000
4000
5000
6000
7000
4 ядра
CPU
8 ядер
CPU
16 ядер
CPU
Tesla
K40M
Tesla
K80
Quadro
M5000
Эффективностьработырешателя
Времявыполнениярасчета,с
Расчет II: Несферические частицы
8© ЗАО «КАДФЕМ Си-Ай-Эс», 2016
100%
300%
500%
700%
900%
1100%
1300%
1500%
0
5000
10000
15000
20000
25000
30000
35000
4 ядра
CPU
8 ядер
CPU
16 ядер
CPU
Tesla
K40M
Tesla
K80
Quadro
M5000
Эффективностьработырешателя
Времявыполнениярасчета,с
Эффективность GPU при разных постановках
9© ЗАО «КАДФЕМ Си-Ай-Эс», 2016
0%
200%
400%
600%
800%
1000%
1200%
Tesla
K40M
Tesla
K80
Quadro
M5000
Времявыполнениярасчета,с
Сферические частицы Несферические частицы
Дополнительная статистика работы решателя
10© ЗАО «КАДФЕМ Си-Ай-Эс», 2016
Потребление оперативной памяти на решателем при работе в различных
режимах. Данные приводятся для зачади с 1 000 000 активных частиц.
Сферические
частицы
Несферические
частицы
CPU 4.0 Гб 8.0 Гб
CPU + GPU 2.1 Гб + 2.5 Гб 2.8 Гб + 4 Гб
Итоги тестирования
11© ЗАО «КАДФЕМ Си-Ай-Эс», 2016
• В настоящий момент для работы Rocky не требуется многоядерных
серверов
• Вычислительные алгоритмы задолженные в Rocky получают
значительный прирост производительности от GPU NVIDIA
• 8 – 14 раз по сравнению с 4-х ядерными рабочими станциями
• 2 – 3 раза по сравнению в 16-ти ядерными серверами
Оптимальным решением является рабочая станция с мощным
графическим процессором NVIDIA
Спасибо за внимание!
Юрий Новожилов
Руководитель направления HPC
yury.novozhilov@cadfem-cis.ru
© ЗАО «КАДФЕМ Си-Ай-Эс», 2016
АППАРАТНЫЕ РЕШЕНИЯ
ДЛЯ ВИЗУАЛИЗАЦИИ И РАСЧЕТОВ
Компания Форсайт | Евгений Зверев
e.zverev@fs-c.ru
СПЕЦИАЛИЗАЦИЯ В ОБЛАСТИ ПРОФЕССИОНАЛЬНОЙ ГРАФИКИ
Наша компания специализируется на производстве
профессиональных графических решений.
Основные направления:
• Супервычислительные станции
• Вычислительные комплексы HPC
• Виртуализация рабочих мест проектировщиков
• Видео стены и масштабная визуализация
Ключевые особенности:
 Поддержка многоядерных процессоров v3/v4
 Поддержка проф. граф. процессоров NVIDIA®
Quadro и Tesla
 Низкий уровень шума
 Поддержка СВО замкнутого цикла*
 Поддержка нестандартных частот CPU
 Система мониторинга
ГРАФИЧЕСКИЕ СУПЕРВЫЧИСЛИТЕЛЬНЫЕ СТАНЦИИ
ОСОБЕННОСТИ ИСПОЛЬЗОВАНИЯ GPU В ROCKY
Вычислительные алгоритмы заложенные в Rocky получают
значительный прирост производительности при использовании GPU
NVIDIA
• 8 – 14 раз по сравнению с 4-х ядерными рабочими станциями
• 2 – 3 кратный прирост в сравнении с 16-ти ядерными серверами
Rocky не требует использования специализированных
вычислительных GPU*
НАШИ РЕКОМЕНДАЦИИ: GPU В ROCKY
Форм-фактор решателя определяет выбор GPU
Rocky на данный момент не поддерживает более одного GPU
Следует обращать внимание на объем памяти GPU особенно для
задач с несферическими частицами.
Выводы:
- оптимальный выбор для сервера Tesla K40
- оптимальный выбор для рабочей станции - QUADRO M5000
- идеальный выбор для рабочей станции: QUADRO K1200 + M5000
(Maximus/ MultiGPU)
ЦЕНТР КОМПЕТЕНЦИИ
• поиск оптимальных решений
• сравнительное и нагрузочные тестирование
• решение проблем с производительностью
• поиск “узких” мест
• тест-драйв технических новинок
Компания FORSITE | Евгений Зверев
e.zverev@fs-c.ru
+7 (911) 215-63-22
Ключевые особенности:
 Процессор: 2 x 22 Core Intel Xeon® E5v3 / v4
 Память: max 1536Gb DDR4 ECC
 GPU: 8 x ускорителей NVIDIA® TESLA
 LAN: 2 x Intel® 1000Mb/s
 InfiniBand card 56Gb/s*
 8 x SAS / SATA SSD
 Производительность: SP~ 41Tflops
ВЫЧИСЛИТЕЛЬНЫЕ КОМПЛЕКСЫ [HPC]

More Related Content

Aппаратное обеспечения для решения задач механики сыпучих сред

  • 1. ЗАО «КАДФЕМ Си-Ай-Эс» Аппаратное обеспечения для решения задач механики сыпучих сред Юрий Новожилов Руководитель направления HPC yury.novozhilov@cadfem-cis.ru
  • 2. Консалтинг в области высокопроизводительных вычислений 2© ЗАО «КАДФЕМ Си-Ай-Эс», 2015 Компания ЗАО «КАДФЕМ Си-Ай-Эс» на постоянной основе занимается поставкой и настройкой высокопроизводительных вычислительных систем: • Установка и настройка программного обеспечения • Проектирование, внедрение и поддержка вычислительных центров • Поставка вычислительных комплексов для проведения инженерных расчетов Через наши руки каждый год проходят десятки проектов в области HPC
  • 3. Построение вычислительной инфраструктуры для решения задач методом дискретных элементов (DEM) 3© ЗАО «КАДФЕМ Си-Ай-Эс», 2016
  • 4. Тестовая задача – конвейерная система 4© ЗАО «КАДФЕМ Си-Ай-Эс», 2016 Бункер Первый конвейер Промежуточный бункер Второй конвейер Удельный весь руды 3 300 кг/м3 Производительность 10 000 т/час Общая длина лент ≈ 20 м Скорость ленты 4 м/c Перепад высот 10 м
  • 5. Гранулометрический состав 5© ЗАО «КАДФЕМ Си-Ай-Эс», 2016 В расчете участвует около 1 000 000 частиц Расчет I Сферические частицы Расчет II Несферические частицы (скругленные многоугольники – 3, 5, 7 сторон) Размер частицы, мм Состав, % по массе 22 30 25 35 30 30 35 5
  • 6. Тестовый стенд 6© ЗАО «КАДФЕМ Си-Ай-Эс», 2016 • Intel Xeon E5-2667v3 3.2ГГц 8C x2 • 128 Гб оперативной памяти DDR4 • SSD INTEL 240GB S3500 Series x2 • Windows 8.1 Professional • NVIDIA Tesla K40m • NVIDIA Tesla K80 • NVIDIA Quadro M5000
  • 7. Расчет I: Сферические частицы 7© ЗАО «КАДФЕМ Си-Ай-Эс», 2016 100% 200% 300% 400% 500% 600% 700% 800% 0 1000 2000 3000 4000 5000 6000 7000 4 ядра CPU 8 ядер CPU 16 ядер CPU Tesla K40M Tesla K80 Quadro M5000 Эффективностьработырешателя Времявыполнениярасчета,с
  • 8. Расчет II: Несферические частицы 8© ЗАО «КАДФЕМ Си-Ай-Эс», 2016 100% 300% 500% 700% 900% 1100% 1300% 1500% 0 5000 10000 15000 20000 25000 30000 35000 4 ядра CPU 8 ядер CPU 16 ядер CPU Tesla K40M Tesla K80 Quadro M5000 Эффективностьработырешателя Времявыполнениярасчета,с
  • 9. Эффективность GPU при разных постановках 9© ЗАО «КАДФЕМ Си-Ай-Эс», 2016 0% 200% 400% 600% 800% 1000% 1200% Tesla K40M Tesla K80 Quadro M5000 Времявыполнениярасчета,с Сферические частицы Несферические частицы
  • 10. Дополнительная статистика работы решателя 10© ЗАО «КАДФЕМ Си-Ай-Эс», 2016 Потребление оперативной памяти на решателем при работе в различных режимах. Данные приводятся для зачади с 1 000 000 активных частиц. Сферические частицы Несферические частицы CPU 4.0 Гб 8.0 Гб CPU + GPU 2.1 Гб + 2.5 Гб 2.8 Гб + 4 Гб
  • 11. Итоги тестирования 11© ЗАО «КАДФЕМ Си-Ай-Эс», 2016 • В настоящий момент для работы Rocky не требуется многоядерных серверов • Вычислительные алгоритмы задолженные в Rocky получают значительный прирост производительности от GPU NVIDIA • 8 – 14 раз по сравнению с 4-х ядерными рабочими станциями • 2 – 3 раза по сравнению в 16-ти ядерными серверами Оптимальным решением является рабочая станция с мощным графическим процессором NVIDIA
  • 12. Спасибо за внимание! Юрий Новожилов Руководитель направления HPC yury.novozhilov@cadfem-cis.ru © ЗАО «КАДФЕМ Си-Ай-Эс», 2016
  • 13. АППАРАТНЫЕ РЕШЕНИЯ ДЛЯ ВИЗУАЛИЗАЦИИ И РАСЧЕТОВ Компания Форсайт | Евгений Зверев e.zverev@fs-c.ru
  • 14. СПЕЦИАЛИЗАЦИЯ В ОБЛАСТИ ПРОФЕССИОНАЛЬНОЙ ГРАФИКИ Наша компания специализируется на производстве профессиональных графических решений. Основные направления: • Супервычислительные станции • Вычислительные комплексы HPC • Виртуализация рабочих мест проектировщиков • Видео стены и масштабная визуализация
  • 15. Ключевые особенности:  Поддержка многоядерных процессоров v3/v4  Поддержка проф. граф. процессоров NVIDIA® Quadro и Tesla  Низкий уровень шума  Поддержка СВО замкнутого цикла*  Поддержка нестандартных частот CPU  Система мониторинга ГРАФИЧЕСКИЕ СУПЕРВЫЧИСЛИТЕЛЬНЫЕ СТАНЦИИ
  • 16. ОСОБЕННОСТИ ИСПОЛЬЗОВАНИЯ GPU В ROCKY Вычислительные алгоритмы заложенные в Rocky получают значительный прирост производительности при использовании GPU NVIDIA • 8 – 14 раз по сравнению с 4-х ядерными рабочими станциями • 2 – 3 кратный прирост в сравнении с 16-ти ядерными серверами Rocky не требует использования специализированных вычислительных GPU*
  • 17. НАШИ РЕКОМЕНДАЦИИ: GPU В ROCKY Форм-фактор решателя определяет выбор GPU Rocky на данный момент не поддерживает более одного GPU Следует обращать внимание на объем памяти GPU особенно для задач с несферическими частицами. Выводы: - оптимальный выбор для сервера Tesla K40 - оптимальный выбор для рабочей станции - QUADRO M5000 - идеальный выбор для рабочей станции: QUADRO K1200 + M5000 (Maximus/ MultiGPU)
  • 18. ЦЕНТР КОМПЕТЕНЦИИ • поиск оптимальных решений • сравнительное и нагрузочные тестирование • решение проблем с производительностью • поиск “узких” мест • тест-драйв технических новинок
  • 19. Компания FORSITE | Евгений Зверев e.zverev@fs-c.ru +7 (911) 215-63-22
  • 20. Ключевые особенности:  Процессор: 2 x 22 Core Intel Xeon® E5v3 / v4  Память: max 1536Gb DDR4 ECC  GPU: 8 x ускорителей NVIDIA® TESLA  LAN: 2 x Intel® 1000Mb/s  InfiniBand card 56Gb/s*  8 x SAS / SATA SSD  Производительность: SP~ 41Tflops ВЫЧИСЛИТЕЛЬНЫЕ КОМПЛЕКСЫ [HPC]

Editor's Notes

  1. Аппаратное обеспечение и IT-решения Эффективность систем автоматизации инженерных расчетов напрямую зависит и от аппаратных средств. Для ускорения инженерных расчетов мы планируем, реализуем и обслуживаем ИТ-решения от автономных рабочих станций до серверов для высокопроизводительных облачных вычислений. Мы поможем Вам разработать и согласовать техническое задание на поставку и внедрение программно-аппаратного комплекса с учетом требований и специфики решаемых задач, обеспечим поставку готовой, сконфигурированной под Ваши требования, отлаженной системы. Мы также оказываем поддержку в проектировании и реализации вычислительного центра, оптимизированного с точки зрения автоматизации инженерных расчетов, причем наши услуги охватывают весь спектр: от планирования и формирования до обеспечения текущей эксплуатации вычислительных ресурсов. Таким образом, Вы всегда можете положиться на эксплуатационную готовность и производительность своих систем. Эффективное использование всего потенциала программного и аппаратного обеспечения: снижение времени расчета; расчет более подробных моделей; повышение точности расчетов.
  2. Добрый день, меня зовут Евгений Зверев, технический директор компании Форсайт. Я отвечаю за продажи высокопроизводительных решений и систем визуализации. В первую очередь хочу выразить благодарность Юрию Новожилову и компании Кадфем за предоставленную возможность совместного тестирования нового программного продукта.
  3. Кратко хочу рассказать о профиле нашей деятельности. Итак наша компания специализируется на комплексных поставках профессиональных графических решений таких как: Графические станции для визуализации и инженерных расчетов Персональные суперкомпьютеры и вычислительные кластеры на базе ускорителей NVIDIA TESLA - Системы масштабной визуализации и отображения, т.е видеостены и видеоконтроллеры. Виртуализация инженерных рабочих мест К сожалению формат данной презентации не позволяет развернуто рассказать о каждом направлении, а так же обо всех новых GPU технологиях, поэтому постараюсь максимально кратко и сжато пробежаться по одной из тем. Итак тема моей презентации это: АППАРАТНЫЕ РЕШЕНИЯ ДЛЯ ВИЗУАЛИЗАЦИИ И РАСЧЕТОВ.
  4. В ходе нашего эксперимента мы использовали тестовый стенд на базе нашего типового решения, графической станции Forsite HPC, предлагаю кратко ознакомиться с основными особенностями данного решения: Поддержка многоядерных процессоров v3/v4 (буквально в следующем месяце Intel анонсирует новое поколение процессоров Intel Xeon, топовая модификация будет иметь 22 ядра. ) Поддержка проф. граф. процессоров NVIDIA® Quadro и Tesla Позвольте сделать небольшой акцент именно на достаточно нестандартной системе охлаждения нашей рабочей станции. Достаточно часто мы сталкивались с ситуацией, когда графические станции и суперкомпьютеры устанавливались в офисном помещении, и пользователи жаловались на сильный уровень шума, который явно не способствал комфортной работе. Именно поэтому в наших рабочих станциях мы используем замкнутые системы жидкостного охлаждения. Более того подобные системы значительно эффективнее обеспечивают отвод тепла от центрального процессора, что позволяет без риска повысить тактовые частоты на процессорах с разблокированным множителем. Важный аспект любого эксперимента это Система мониторинга Не важно проводим ли мы тестовый эксперимент или считаем реальную задачу, важно иметь полное понимание что происходит с рабочей станцией. Это позволяет вовремя диагностировать возможные проблемы, и найти узкие места в нашей системе.
  5. Вернемся к результатам, которые озвучил Юрий в предыдущей части презентации: Вычислительные алгоритмы заложенные в Rocky получают значительный прирост производительности при использовании GPU NVIDIA 8 – 14 раз по сравнению с 4-х ядерными рабочими станциями 2 – 3 раза по сравнению в 16-ти ядерными серверами Первоначальный вывод к которому мы пришли : Rocky не требует использования специализированных вычислительных GPU,* На следующем слайде разберем данный момент более подробно.
  6. На данном слайде я хочу дать небольшие рекомендации, как достичь максимальной эффективности при расчетах на GPU в Rocky В первую очередь при проектировании расчетной системы надо определить для себя форм-фактор нашей будущей вычислительной системы. Почему это важно? Дело в том что ускорители предназначенные для установки в серверную платформу и в рабочую станцию, имеют разную систему охлаждения, а именно для установки в сервера используются ускорители с пассивной системой охлаждения Tesla K80 / K40 Отсутствие возможности расчета на нескольких GPU делает неэффективным применение TESLA K80, если сервер используется только для Rocky, особенно явно это заметно для задач со сферическими частицами. K80 представляет из себя двухчиповую карту, и в наших расчетах полностью задействован только 1 чип. Таким образом оптимальный вариант для использования в вычислительном сервере Игровая карта 980Ti показывает отличный результат, особенно если вспомнить тот факт, что это самая доступная по цене карта, но в задачах с несферическими частицами утилизация памяти GPU составляет около 100%. Таким образом в случае наличия более сложной задачи, есть вероятность что оперативной памяти графического ускорителя будет явно мало.
  7. Если у Вас есть задача, но в данный момент у вас нет понимания какое программно-аппаратное решение будет для Вас оптимальным, предварительное тестирование поможет определиться с выбором правильного решения.  В тестовой лаборатории нашей компании развернуты универсальные демонстрационные стенды на которых Вы можете произвести необходимое функциональное и нагрузочное тестирования на различных конфигурациях оборудования, а так же смоделировать различные сценарии.
  8. В случае если у Вас возникли вопросы технического характера, прошу обращаться, - на данном слайде мои контактные данные. Спасибо за внимание. Вопросы?