Через тернии к звёздам процессор ARM в высокопроизводительных вычислениях Вячеслав Елагин, Специалист по продажам Высокопроизводительных компьютерных

Save this PDF as:
 WORD  PNG  TXT  JPG

Размер: px
Начинать показ со страницы:

Download "Через тернии к звёздам процессор ARM в высокопроизводительных вычислениях Вячеслав Елагин, Специалист по продажам Высокопроизводительных компьютерных"

Транскрипт

1 Через тернии к звёздам процессор ARM в высокопроизводительных вычислениях Вячеслав Елагин, Специалист по продажам Высокопроизводительных компьютерных систем 25 сентября 2018

2 Уверенное партнёрство с HPE признанным лидером HPCрынка #1 Поставщик энергоэффективных суперкомпьютеров Top500 1 #1 HPE лидер мирового HPC рынка с долей 35,9% 3 #1 HPE Apollo 6000 Gen10 самые безопасные серверы стандартной архитектуры для НРС #1 HPE имело самое большое число систем в Top500, 122 системы (24,4)% #1 #1 HPE анонсировала первую в мире Memory-Driven вычислительную архитектуру: основная веха для проекта The Machine HPE SGI 8600, обеспечивают самую быструю в отрасли параллельную обработку 6

3 Портфель HPE специально разработанный для HPC HPC Индустриальные решения Финансовые услуги Наука, Исследования, госструктуры Бионауки, здравоохранение EDA / CAE Промышленность Добыча, энергетика Погода и исследования климата Консультационные, профессиональные и операторские услуги HPE Flexible Capacity for HPC, HPE Datacenter Care for Hyperscale Supercomputing / Корпоративные / Коммерческие HPC HPE Performance Software Suite HPE SGI 8600 HPE Apollo 6000 Gen10 HPE Apollo 2000 Gen10 Жидкостное охлаждение, обеспечивающее лучшие показатели производительности, плотности и эффективности Экстремальные вычислительная мощность и высокая плотность Мост к корпоративной горизонтально масштабируемой архитектуре Open Source Software HPE Software Commercial HPC Software HPE Performance Software Cluster Manager HPE Performance Software Message Passing Interface Новые HPC СХД для HPC In-memory HPC Выбор фабрик HPE Apollo 6500 Gen10 HPE Apollo sx40 HPE Apollo 70 HPE Apollo 4000 HPE Superdome Flex - Intel Omni-Path Architecture ГПУ вычислитель масштаба стойки для задач обучения нейронных сетей и inference НРС-оптимизированные стандартные отраслевые серверы поддерживающие самые последние технологии NVIDIA GPU Революционная HPC технология на базе процессоров ARM Вертикальная масштабируемость, НРС в общей памяти, UV Technologies - Mellanox InfiniBand - HPE FlexFabric Network

4 HPE Apollo 70: Веха на пути к Exascale

5 Программа HPE Exascale (инновации масштаба системы) Подход к новым рубежам HPC Сотрудничество с заказчиками Разработка передовых платформ Hewlett Packard Labs / The Machine Memory-Driven Computing Протокол GenZ и фабрика HPC Storage HPE Performance Software Suite HPC Product Group Exascale HPC Silicon Design Lab SiPh NVM VLSI Разработка протокола Серверы Apollo Экспертиза в системах с общей памятью

6 Apollo 70 ключевая веха в развитии передовых технологий HPE Comanche Программа раннего доступа HPE Apollo 70 Будущее - not POR 2P arm Proto Platform 2P Arm Platform Arm + Machine platform SoC SoC Prototype / Pre-Production Silicon Cavium ThunderX2 Production Silicon Cavium ThunderX TBD Gen-Z (Machine) enabled architecture Развитие экосистемы arm Принятие arm HPC Прототипирование The Machine Внедрение Gen-Z

7 Программа Catalyst UK: ускорение принятия ARM в UK Цели программы Deployment: Deployment of HPC clusters at multiple sites in UK, supported for 3-year period providing access to the UK academic community Adoption: Early adoption of ARM for HPC in UK Applications: Customer-driven porting and opt Collaboration: Leveraging the success Project Comanche model of customer-centric collaboration; but based instead on Early Ship HPE Apollo 70 product Exascale: Establish foundation for Exascale collaboration Индустриальные партнёры HPE: Apollo 70, HPE Insight CMU, HPE Performance Software - Cluster Manager, HPE Performance Software Message Passing Interface ARM: Allinea Studio (Compiler, Libraries, Forge-DDT & MAP), OpenHPC Mellanox: OFED, HPC-X, OpenMPI, OpenSHMEM, MXM, SHArP SuSE: SLES, OpenStack, HPC Module Cavium: Thunder-X2 SoC, technical support Qualcomm: Centriq SoC, technical support Сотрудничество в UK EPCC: WRF, OpenFOAM, Rolls Royce Hydra opt, 2 PhD candidates Leicester: Data-intensive apps, genomics, MOAB Torque, DiRAC collab Bristol: VASP, CASTEP, Gromacs, CP2K, Unified Model, Hydra, NAMD, Oasis, NEMO, OpenIFS, CASINO, LAMMPS UK Government: Dept. for Bus., Energy & Industrial Strategy (BEIS) Конфигурации Typical for each site: 64 Apollo Compute Nodes: Cavium 32c, 2.2 GHz 128 GB memory IB EDR CX5 Clos cores 6 CL4300 Services/Storage: Qualcomm Centriq Метрики успешности Intended outcomes include: Critical HPC apps ported and demonstrated ISV engagements and demonstrations Demonstrated performance improvements Publications and follow-on collaborations Bugs filed, fixed & up-streamed to open source HPE will deliver >12,000 cores across 3 sites; amongst the largest ARM HPC deployments in the world

8 Система HPE Apollo 70 Обзор

9 Почему мы создали систему HPE Apollo 70? Первая специально разработанная НРС-система на базе ARM от HPE Комплексное ARM-решение, обеспечивающее гибкость и выбор HPE стимулирует усилия нескольких поставщиков для ускорения внедрения ARM в HPC HPC-платформа готовая к применению в продуктиве Спроектировано для масштаба многих стоек

10 Гибкость и выбор с помощью нового законченного armрешения Двухпроцессорный arm HPC сервер Два процессора Marvel (Cavium) ThunderX2, до 32 custom ядер arm v8.1 на socket Построена на успешной программе раннего доступа Ключевые ISV партнёры вовлечены в портирование/создание, оптимизацию, валидацию и поддержку arm приложений Лидерская пропускная способность памяти На 33% большая пропускная способность памяти, чем у стандартных двухпроцессорных серверов Надёжная среда разработки программного обеспечения для HPC Интегрированная и валидированная среда разработки приложений для HPC систем HPE HPE предоставляет комплексное arm решение для HPC рынка

11 Готовая (production-ready) HPC платформа Специально построенная HPC платформа Использует проверенную HPE HPC системную архитектуру В основе десятилетняя ведущая инженерная экспертиза в HPC HPE Management Tools HPE Performance Cluster Manager Сокращает время до внедрения и и увеличивает производительность HPE Pointnext Консультационные и профессиональные услуги и поддержка первого уровня (Tier1) Гибкие модели потребления инфраструктуры HPE Performance Tools Мирового класса HPE Message Passing Interface (MPI) Оптимальная производительность кластера #1 HPC производитель по доле мирового рынка

12 Создана для масштабирования Плотность Компактная архитектура х4 в 2U До 64 ядер на узел Более ядер на стойку Гибкость 2 варианта узлов 2P узел половинной ширины в 1U 2P+2 ГПУ PCIe половинной ширины в 2U Масштабируемость Mellanox EDR InfiniBand 100 Гб/с Масштабируется до тысяч узлов Интегрированная подсистема хранения 2 M ГБ SSD/узел 8 LFF на шасси Разработан для развёртывания больших HPC кластеров

13 Система HPE Apollo Технические спецификации

14 Система HPE Apollo 70 Детальные технические спецификации можно найти в документе QuickSpecs До 4 серверов в 2U Спецификации Система HPE Apollo 70 Процессор Cavium 64-bit Arm v8.1-a ThunderX2 Процессоры / ядра / частота 2 процессора/ до 32 ядер/ до 2,2 ГГц Память (тип, max, разъёмы) Поддержка DIMM DDR до 512 ГБ на узел (16x32 ГБ); 16 разъёмов DIMM Отсеки для дисков 8 LFF HDD/SSD 2 внутренних 2280 M.2 на узел; до 960 ГБ/SSD HPE AR44z 1U Arm compute server HPE AR64z 2U Arm compute server I/O однопортовый Mellanox CX Гб/с VPI адаптер (IB или Ethernet) двухпортовый SFP+ 10 GbE Mellanox CX4 LOM Однопортовая RJ-45 1 GbE NIC только управление 1x USB, 1x VGA, 1x UART Расширяемость До 2 ГПУ или дополнительные PCIe Вид сзади с одним AR64z и двумя AR44z Управление инфраструктурой IPMI.2.0 Compliant Источники питания с горячей заменой Гарантия и поддержка 3/3/3 Два 1600 Вт

15 Сервер HPE Apollo 70 В деталях Вид внутри: Dual Cavium ThunderX2 SoCs 2 2 x M.2 (2280 FF) 3 PCIe x16 expansion (2U tray only) DDR4 DIMM (8 RDIMMs per SoC) GbE dual port LOM 6 1x QSFP Gb/s NIC (IB or Ethernet) OCP 7 Single Port RJ-45 1GbE NIC Mgmt only 8 PCIe x16 expansion (2U tray only) 2 3

16 32 MB Distributed Cache Gen2 Cavium Coherent Processor Interconnect CN99XX Architecture Up to 32 custom Arm v8.1 cores IO Subsystem Trust Zone Power Management Quad-issue, Fully OOO, Quad-threaded 32KB L1 I/D Cache; 256KB L2 per core 32 MB distributed L3 cache (1 MB per core) 8 DDR4 Memory Controllers 2 x SATA 3.0 & USB3 for boot Socketed LGA for most flexibility Process Node: 16nm FinFet 56 lanes PCIe Gen3 X16, x8, x4,x2,x1 32 Cores CCPI2 CCPI2 Up to 2.5 GHZ 2x SATA v3 Memory Controllers DDR4 DDR4 DDR4 DDR4 DDR4 DDR4 DDR4 DDR4

17 HPE HPC Software для Arm Обзор

18 Портфель HPE Performance Software Supported* HPE HPC Software Validated Integrated Open Source Software Commercial HPC Software Performance Optimized HPE предоставляет интегрированную и проверенную высокопроизводительную среду приложений для HPC систем HPE *Поддержка не включает компоненты Open Source

19 HPC Software для 64-бит Arm Программный стек Экосистема разработки ПО и приложений Разработка ПО Управление нагрузкой HPE Performance Software - Message Passing Interface PBS Professional for Arm Allinea Studio Arm C/C++ Compiler Arm Fortran Compiler Arm Forge Arm Performance Libraries Arm Performance Reports Forge Professional TotalView GNU compilers Системное ПО Системное управление ПО фабрики HPE Performance Software Cluster Manager Операционные системы RHEL for Arm 7.4+ SLES 12 SP3+ for Arm Bright Cluster Manager Bright Machine Learning & Big Data add-on Sept 2018 (8.2)

20 HPE System Management это про: Устойчивость и безопасность Операционная эффективность HPC масштаб Производительность системы Обеспечивает полностью интегрированное системное управление для HPC систем HPE System Setup Software updates Hardware management Power management Image management

21 HPE Performance Software Cluster Manager Полное и централизованное управление кластером Устойчивость и безопасность Операционная эффективность HPC масштаб Производительность системы

22 HPE Apollo 70 System Услуги HPE Pointnext Services ваш гид для плавного и гладкого путешествия

23 Услуги от HPE Pointnext Возьмите по максимуму от ваших HPC IT получите бизнес-результат быстрее Экспертиза Time to Value Масштабируемость Доступность Понимание целей и предполагаемых результатов Партнёр для создания инфраструктуры для инноваций Быстрая доставка услуг Оставайтесь впереди своих конкурентов Помогает упростить сложность Управление HPC IT в масштабе Максимизирует производительность Сохраняет ваши HPC IT всегда доступными Разработка дизайна, миграция ключевых рабочих нагрузок, модернизация существующих ИТ-систем Сохраняйте рост бизнеса при развёртывании, миграции и тонкой настройки ваших HPC IT Управляйте производительностью по мере необходимости, платите за то, что вы используете и сотрудничайте с экспертами Быстрый доступ к технической экспертизе в НРС для операционных услуг

24 HPE Astra Самый большой arm суперкомпьютер

25 HPE поставила самый большой arm-суперкомпьютер HPE Astra для Sandia National Laboratory Министерства энергетики США

26 HPЕ на Суперкомпьютерных днях в России Стенд: 7, все технические подробности и другие интересности, расширенная презентация Мастер-класс: «Разворачиваем и администрируем вычислительный кластер для машинного обучения» от Стрижака С. и Лебедева А. 24 сентября 14:10-15:50 зал «Полянка»

27 В заключении 1. HPE один из признанных лидеров на рынке высокопроизводительных вычислений 2. HPE планирует дальнейшую разработку продуктов для НРС, предоставляя заказчикам максимально возможную гибкость для построения НРС-решений 3. HPE Apollo 70 первый сервер корпоративного уровня для НРС на базе процессоров arm 4. Создана полная экосистема для разработки НРС-приложений для платформы arm. 5. Платформа HPE Apollo 70 имеет полный пакет сопровождения сервисными услугами, такими же, как традиционные архитектуры 6. Системы HPE Apollo 70 уже нашли своё применение в области НРС

28 Спасибо Контакты: Вячеслав Елагин