Мощность10
![]() Power10 СКМ | |
Общая информация | |
---|---|
Запущен | 2021 |
Разработано | IBM , партнеры OpenPower |
Общий производитель | |
Производительность | |
Макс. процессора Тактовая частота | от +3,5 ГГц до +4 ГГц |
Кэш | |
L1 Кэш | 48+32 КБ на ядро |
Кэш L2 | 2 МБ на ядро |
Кэш L3 | 120 МБ на чип |
Архитектура и классификация | |
Технологический узел | 7 нм |
Микроархитектура | Р10 |
Набор инструкций | Power ISA ( Power ISA v.3.1 ) |
Физические характеристики | |
Ядра |
|
Упаковка |
|
Розетка |
|
История | |
Предшественник | POWER9 |
POWER , PowerPC и Power ISA. Архитектуры |
---|
NXP (ранее Freescale и Motorola) |
ИБМ |
|
IBM/Нинтендо |
Другой |
Ссылки по теме |
Отменено выделено серым цветом , историческое — курсивом |
Power10 — это суперскалярное , многопоточное , многоядерное семейство микропроцессоров , основанное на с открытым исходным кодом Power ISA и анонсированное в августе 2020 года на конференции Hot Chips ; системы с процессорами Power10. Общедоступно с сентября 2021 г. на сервере IBM Power10 Enterprise E1080.
Процессор спроектирован так, чтобы иметь 15 ядер , но запасное ядро будет включено в комплект поставки во время производства, чтобы экономически эффективно решить проблемы с производительностью .
Процессоры на базе Power10 будут производиться компанией Samsung по 7-нм техпроцессу с 18 слоями металла и 18 миллиардами транзисторов на корпусе толщиной 602 мм. 2 кремниевый штамп . [1] [2] [3] [4]
Основными особенностями Power10 являются более высокая производительность на ватт и улучшенная архитектура памяти и ввода-вывода с упором на рабочие нагрузки искусственного интеллекта (ИИ). [5]
Дизайн
[ редактировать ]каждое ядро Power10 увеличено вдвое В большинстве функциональных блоков по сравнению с его предшественником POWER9 . Ядро имеет восьмипоточную многопоточность (SMT8) и имеет кэши L1 для инструкций объемом 48 КБ и кэши данных объемом 32 КБ , большой кэш L2 объемом 2 МБ и очень большой резервный буфер трансляции (TLB) с 4096 записями. [3] Циклы задержки для различных этапов кэша и TLB были значительно сокращены. Каждое ядро имеет восемь секций выполнения, каждый из которых содержит один блок с плавающей запятой (FPU), арифметико-логический блок (ALU), предсказатель ветвления , блок загрузки-сохранения и SIMD-движок , способный передавать 128-битные (64+64) инструкции из новые инструкции префикса/фьюза Power ISA v.3.1. на 128 записей (64 однопоточных) Каждый срез выполнения может обрабатывать 20 инструкций каждая, подкрепленных общей таблицей инструкций с 512 записями и подаваемых в очередь загрузки и очередь хранения на 80 записей (40 однопоточных). Улучшенные функции прогнозирования ветвей удвоили точность. Ядро имеет четыре механизма матричной математической помощи (MMA), [6] для лучшей обработки SIMD-кода, особенно для матричного умножения инструкций , где рабочие нагрузки вывода ИИ имеют 20-кратное увеличение производительности. [7]
Процессор имеет два «полушария» по восемь ядер каждое, совместно использующих кэш-память третьего уровня объемом 64 МБ, всего 16 ядер и кэш-память третьего уровня объемом 128 МБ. Из-за проблем с производительностью по крайней мере одно ядро всегда отключено, что уменьшает объем кэша L3 на 8 МБ до пригодных для использования в общей сложности 15 ядер и 120 МБ кэша L3. Каждый чип также имеет восемь криптоускорителей , разгружающих общие алгоритмы, такие как AES и SHA-3 .
Увеличенное стробирование тактовой частоты и переработанная микроархитектура на каждом этапе, а также инструкции Fuse/Prefix, позволяющие выполнять больше работы с меньшим количеством рабочих единиц, а также более интеллектуальный кэш с меньшими задержками в памяти и эффективной маркировкой адресов, уменьшающей промахи в кэше, позволяют ядру Power10 потреблять вдвое меньше энергии, чем СИЛА9. В сочетании с улучшениями вычислительных мощностей до 30% производительность всего процессора на ватт в 2,6 раза выше, чем у его предшественника. А в случае установки двух ядер на один и тот же модуль — до 3 раз быстрее при том же бюджете мощности.
Поскольку ядра могут работать как восемь логических процессоров, каждое из 15-ядерных процессоров выглядит для операционной системы как 120 ядер . В двухчиповом модуле это составляет 240 одновременных потоков на один сокет .
ввод/вывод
[ редактировать ]Чипы имеют полностью переработанную архитектуру памяти и ввода-вывода с использованием открытого интерфейса процессора Coherent Accelerator (OpenCAPI) и интерфейса открытой памяти (OMI). Использование последовательной связи памяти вне микросхемы с контроллерами сокращает количество сигнальных линий, идущих к микросхеме и от нее, увеличивает пропускную способность и позволяет процессору гибко использовать технологию памяти. [4]
Power10 поддерживает широкий спектр типов памяти, включая DDR3–DDR5, GDDR, HBM или постоянную память. Эти конфигурации могут быть изменены клиентом, чтобы наилучшим образом соответствовать варианту использования системы.
- DDR4 – поддержка до 16 ТБ ОЗУ, 410 ГБ/с, задержка 10 нс
- GDDR6 – до 800 ГБ/с
- Постоянное хранилище – до 2 ПБ
Power10 позволяет шифровать данные без снижения производительности на каждом этапе — от оперативной памяти, через ускорители и узлы кластера до хранящихся данных.
Power10 поставляется с функцией PowerAXON, позволяющей осуществлять обмен между чипами и системами, а также шиной OpenCAPI для ускорителей, устройств ввода-вывода и других высокопроизводительных периферийных устройств с когерентной кэш-памятью . Он управляет связью между узлами в кластере одночиповых модулей (SCM) с 16 разъемами или кластере двухчиповых модулей (DCM) с 4 разъемами. Он также управляет семантикой памяти для кластеризации систем, обеспечивая доступ к загрузке/сохранению из ядра до 2 ПБ ОЗУ во всем кластере Power10. IBM называет эту функцию Memory Inception .
И OMI, и PowerAXON могут обрабатывать данные со скоростью 1 ТБ/с за пределами чипа.
Power10 включает PCIe 5 . SCM имеет 32x, а DCM - 64x 5 линий PCIe. Решение удалить поддержку NVLink из Power10 было принято из-за того, что возможности пропускной способности PCIe 5.0 делают поддержку NVLink устаревшей для случаев использования, для которых был разработан Power10. [3] Поддержка встроенного NVLink ранее была уникальным преимуществом POWER8 и POWER9.
Варианты
[ редактировать ]Чип Power10 доступен в двух вариантах, которые определяются прошивкой в упаковке. Несмотря на то, что чипы физически идентичны, а разница заложена в прошивке, она не может быть изменена ни пользователем, ни IBM после производства. [8]
- 15× цветов SMT8
- Оптимизирован для приложений с высокой пропускной способностью, но с меньшими вычислительными нагрузками.
- 30× ядер SMT4
- Оптимизирован для приложений с высокими вычислительными нагрузками, требующих сложных наборов инструкций и нескольких циклов загрузки информации в кэш.
Модули
[ редактировать ]Power10 поставляется в трех с пластиковой наземной решеткой с флип-чипом (FC-PLGA) корпусах : один однокристальный модуль (SCM) и два двухчиповых модуля (DCM и eSCM).
- SCM , однокристальный модуль – 3,6-4,15 ГГц, до 15 ядер SMT8. Возможна кластеризация до 16 розеток. x32 PCIe 5 линий. Размер модуля: 68,5×77,5 мм. Модуль имеет уникальную конфигурацию с 8 разъемами на подложке (OTF) для кабелей симметричной многопроцессорной обработки (SMP), напрямую соединяющих другие модули Power10 SCM.
- DCM , двухчиповый модуль – 3,4-4,0 ГГц, до 24 ядер SMT8. Можно объединить до четырех розеток. x64 PCIe 5 линий. DCM находится в том же температурном диапазоне, что и предыдущие предложения. Размер модуля: 74,5х85,75 мм. DCM поставляется в четырех вариантах. [9]
- ЭПЭУ — 12 ядер, 3,36-4,0 ГГц
- EPEV — 18 ядер, 3,2-4,0 ГГц
- EPGW — 24 ядра, 2,95-3,9 ГГц
- EHC8 — 24 ядра, 2,95–3,9 ГГц (для здравоохранения Северной Америки)
- eSCM , одночиповый модуль начального уровня – 3,0-3,9 ГГц, до 8 ядер SMT8. Он сочетает в себе два чипа Power10. Первый чип полностью работоспособен и имеет 4-8 активных ядер. Другой чип использует только функциональность PCIe, выступая в качестве коммутатора ввода-вывода с большим количеством линий PCIe. Эти модули eSCM могут быть объединены в кластер до четырех сокетов. Размер модуля: 74,5х85,75 мм. eSCM также называется «ioscm». [10] [11]
Системы
[ редактировать ]Предприятие
[ редактировать ]IBM Power E1080 под кодовым названием Denali — это топовый компьютер Power10 от IBM. Он состоит из 1–4 узлов Центрального электронного комплекса (CEC), каждый из которых занимает 5U пространства. Каждый узел имеет 4 процессора Power10 SCM с возможностью конфигурации с 10, 12 или 15 ядрами SMT8 на процессор и до 16 ТБ оперативной памяти OMI - DDR4 . Power E1080 изначально работает под управлением PowerVM под управлением AIX , IBM i и с прямым порядком байтов Linux . [12] Для системы E1080 также необходим системный блок управления высотой 2U для мониторинга и настройки.
Power E1080 также поддерживает до шестнадцати блоков расширения ввода-вывода, по четыре на узел CEC. Каждый блок расширения подключен к соответствующему узлу CEC двумя модулями разветвления PCIe и имеет двенадцать слотов FHFL PCIe. Четыре из этих слотов — PCIe 3.0 x16, а остальные восемь — PCIe 3.0 x8. Конфигурация с максимальной спецификацией позволяет Power E1080 поддерживать 192 карты PCIe с одним слотом в системе с 16 разъемами. [13]
Средний уровень
[ редактировать ]- IBM Power E1050 — корпус 4U. 2–4 разъема ЦП для 2–4 модулей DCM, 24–96 ядер. 64 слота памяти OMI, поддерживающие до 16 ТБ ОЗУ. 11 слотов PCIe, 8 слотов gen.5 и 3x gen.4. 10 слотов для твердотельных накопителей на базе NVMe емкостью до 64 ТБ. Используйте сочетание операционных систем Linux, AIX или IBM i. [9]
Масштабирование
[ редактировать ]Модели S могут работать под управлением Linux, IBM i и AIX. L-модели созданы для Linux, но могут запускать AIX и IBM i на 25% доступных ядер ЦП. [10]
- IBM Power S1024 и L1024 — корпус 4U. 1–2 процессорных разъема для 1–2 модулей DCM, 24–48 ядер. 32 слота памяти OMI, поддерживающие до 8 ТБ ОЗУ. 10 слотов PCIe, 8 слотов gen.5 и 2x gen.4. 16 слотов для твердотельных накопителей на базе NVMe емкостью до 102 ТБ.
- IBM Power S1022 и L1022 — корпус 2U. 1–2 процессорных разъема для 1–2 модулей DCM, 24–40 ядер. 32 слота памяти OMI, поддерживающие до 4 ТБ ОЗУ. 10 слотов PCIe, 8 слотов gen.5 и 2x gen.4. 8 слотов для твердотельных накопителей на базе NVMe емкостью до 51 ТБ.
- IBM Power S1022s — корпус 2U. 1–2 процессорных разъема для 1–2 модулей eSCM, 4–16 ядер. 16 слотов памяти OMI, поддерживающих до 2 ТБ ОЗУ. 10 слотов PCIe, 8 слотов gen.5 и 2x gen.4. 8 слотов для твердотельных накопителей на базе NVMe емкостью до 51 ТБ.
- IBM Power S1014 — корпус высотой 4U или настольная башня. 1 модуль eSCM Power10 с 4 или 8 ядрами. 8 слотов памяти OMI, поддерживающих до 1 ТБ ОЗУ. 5 слотов PCIe, 4 поколения 5 и 1 поколение 4. 16 слотов для твердотельных накопителей на базе NVMe емкостью до 102 ТБ.
- IBM Power S1012 — 2U, корпус половинной ширины или настольная башня. 1 модуль eSCM Power10 с 1, 4 или 8 ядрами. 4 слота памяти OMI, поддерживающие до 256 ГБ ОЗУ. 4 слота PCIe, 4 слота gen.5. 4 слота для твердотельных накопителей на базе NVMe емкостью до 6,4 ТБ.
Поддержка операционной системы
[ редактировать ]Сравнение с более ранними процессорами POWER
[ редактировать ]Переход на 7-нм производственный процесс приводит к значительно более высокой производительности на ватт.
Возможности PowerAXON теперь расширены до 2 ПБ единого кластерного пространства памяти, совместно используемого несколькими узлами кластера , и включают поддержку PCIe 5 .
Новые инструкции SIMD и новые типы данных, включая bfloat16 , INT4(INTEGER) и INT8(BIGINT) . [16] [17] направлены на улучшение рабочих нагрузок ИИ.
В отличие от более ранних процессоров POWER9 и POWER8, для Power10 требуется встроенное ПО стороннего производителя с закрытым исходным кодом в чувствительных к безопасности областях модуля ЦП, а также дополнительное встроенное ПО стороннего производителя с закрытым исходным кодом в необходимом внемодульном контроллере памяти. [18]
Брендинг
[ редактировать ]Power10 необычен тем, что его имя не пишется с заглавной буквы, как POWER9 и все другие предыдущие процессоры POWER. Это изменение является частью ребрендинга IBM своего предложения Power Systems, которое, начиная с Power10, теперь называется просто «Power». У Power10 также есть логотип. [19]
См. также
[ редактировать ]Ссылки
[ редактировать ]- ^ Доктор Катресс, Ян (17 августа 2020 г.). «Живой блог Hot Chips 2020: процессор IBM POWER10 на 7-нм техпроцессе Samsung» . АнандТех .
- ^ Куах, Катянна (17 августа 2020 г.). «IBM сокращает процессоры Power10 до 7 нм вместе с Samsung, которые должны быть выпущены к концу 2021 года» . Регистр .
- ^ Jump up to: а б с Шиллинг, Андреас (17 августа 2020 г.). «IBM Power10 предлагает 30 ядер с SMT8, PCIe 5.0 и DDR5» . Аппаратное обеспечение LUXX (на немецком языке).
- ^ Jump up to: а б Кеннеди, Патрик (17 августа 2020 г.). «IBM POWER10 в поисках Святого Грааля вычислений» . Сервис TheHome .
- ^ «IBM представляет процессор IBM POWER10 нового поколения» . ИБМ . 17 августа 2020 г.
- ^ Хосе Морейра, Пунит Бхат АХ и Сатиш Кумар Садасивам (15 апреля 2021 г.). Руководство по передовому опыту использования Matrix-Multiply Assist .
- ^ Рассел, Джон (17 августа 2020 г.). «IBM представляет Power10; рекламирует новую схему памяти, безопасность и логические выводы» . HPCwire .
- ^ Прикетт Морган, Тимоти (31 августа 2020 г.). «Возможные проекты IBM для систем Power10» . IT-джунгли .
- ^ Jump up to: а б Джулиано Ансельми, Марк Грегорутти, Стивен Лутц, Михаэль Маликдем, Гвидо Сомерс, Цветомир Спасов (11 июля 2022 г.). «Технический обзор и введение IBM Power E1050» (PDF) .
{{cite web}}
: CS1 maint: несколько имен: список авторов ( ссылка ) - ^ Jump up to: а б Джулиано Ансельми, Ён Хун Чо, Эндрю Лэйдлоу, Армин Рёлль, Цветомир Спасов (19 июля 2022 г.). «Технический обзор и введение IBM Power S1014, S1022s, S1022 и S1024» (PDF) .
{{cite web}}
: CS1 maint: несколько имен: список авторов ( ссылка ) - ^ Источник GitHub/OpenPower/Rainier
- ^ Так выглядит самый мощный сервер в мире
- ^ Джулиано Ансельми, Маниш Арора, Ивайло Божинов, Динил Дас, Тургут Генц, Бартломей Грабовски, Мэдисон Ли, Армин Рёлль (9 декабря 2021 г.). «Технический обзор и введение IBM Power E1080» (PDF) .
{{cite web}}
: CS1 maint: несколько имен: список авторов ( ссылка ) - ^ Ларабель, Майкл (9 августа 2020 г.). «Linux 5.9 обеспечивает дополнительную поддержку IBM POWER10, новый/более быстрый ABI системного вызова SCV» . Фороникс .
- ^ Jump up to: а б Прикетт Морган, Тимоти (6 августа 2019 г.). «Разговор о высокой пропускной способности с IBM POWER10 Architect» . Следующая платформа .
- ^ Патрицио, Энди (18 августа 2020 г.). «IBM подробно описывает процессор POWER10 следующего поколения» . Сетевой мир .
- ^ «Псевдонимы типов данных» . ИБМ . 26 августа 2020 г.
- ^ «Проблема с POWER10 связана не только с OMI» . 8 сентября 2021 г.
- ↑ Больше не нужно выкрикивать имя «Сила» (ну, кроме нашего названия здесь)