Jump to content

Мощность10

Мощность10
Power10 СКМ
Общая информация
Запущен 2021
Разработано IBM , партнеры OpenPower
Общий производитель
Производительность
Макс. процессора Тактовая частота от +3,5 ГГц до +4 ГГц
Кэш
L1 Кэш 48+32 КБ на ядро
Кэш L2 2 МБ на ядро
Кэш L3 120 МБ на чип
Архитектура и классификация
Технологический узел 7 нм
Микроархитектура Р10
Набор инструкций Power ISA ( Power ISA v.3.1 )
Физические характеристики
Ядра
  • 15 цветов SMT8
    30 ядер SMT4
Упаковка
  • ОЛЬГА СКМ и DCM
Розетка
  • 1–16
История
Предшественник POWER9

Power10 — это суперскалярное , многопоточное , многоядерное семейство микропроцессоров , основанное на с открытым исходным кодом Power ISA и анонсированное в августе 2020 года на конференции Hot Chips ; системы с процессорами Power10. Общедоступно с сентября 2021 г. на сервере IBM Power10 Enterprise E1080.

Процессор спроектирован так, чтобы иметь 15 ядер , но запасное ядро ​​будет включено в комплект поставки во время производства, чтобы экономически эффективно решить проблемы с производительностью .

Процессоры на базе Power10 будут производиться компанией Samsung по 7-нм техпроцессу с 18 слоями металла и 18 миллиардами транзисторов на корпусе толщиной 602 мм. 2 кремниевый штамп . [1] [2] [3] [4]

Основными особенностями Power10 являются более высокая производительность на ватт и улучшенная архитектура памяти и ввода-вывода с упором на рабочие нагрузки искусственного интеллекта (ИИ). [5]

каждое ядро ​​Power10 увеличено вдвое В большинстве функциональных блоков по сравнению с его предшественником POWER9 . Ядро имеет восьмипоточную многопоточность (SMT8) и имеет кэши L1 для инструкций объемом 48 КБ и кэши данных объемом 32 КБ , большой кэш L2 объемом 2 МБ и очень большой резервный буфер трансляции (TLB) с 4096 записями. [3] Циклы задержки для различных этапов кэша и TLB были значительно сокращены. Каждое ядро ​​имеет восемь секций выполнения, каждый из которых содержит один блок с плавающей запятой (FPU), арифметико-логический блок (ALU), предсказатель ветвления , блок загрузки-сохранения и SIMD-движок , способный передавать 128-битные (64+64) инструкции из новые инструкции префикса/фьюза Power ISA v.3.1. на 128 записей (64 однопоточных) Каждый срез выполнения может обрабатывать 20 инструкций каждая, подкрепленных общей таблицей инструкций с 512 записями и подаваемых в очередь загрузки и очередь хранения на 80 записей (40 однопоточных). Улучшенные функции прогнозирования ветвей удвоили точность. Ядро имеет четыре механизма матричной математической помощи (MMA), [6] для лучшей обработки SIMD-кода, особенно для матричного умножения инструкций , где рабочие нагрузки вывода ИИ имеют 20-кратное увеличение производительности. [7]

Процессор имеет два «полушария» по восемь ядер каждое, совместно использующих кэш-память третьего уровня объемом 64 МБ, всего 16 ядер и кэш-память третьего уровня объемом 128 МБ. Из-за проблем с производительностью по крайней мере одно ядро ​​всегда отключено, что уменьшает объем кэша L3 на 8 МБ до пригодных для использования в общей сложности 15 ядер и 120 МБ кэша L3. Каждый чип также имеет восемь криптоускорителей , разгружающих общие алгоритмы, такие как AES и SHA-3 .

Увеличенное стробирование тактовой частоты и переработанная микроархитектура на каждом этапе, а также инструкции Fuse/Prefix, позволяющие выполнять больше работы с меньшим количеством рабочих единиц, а также более интеллектуальный кэш с меньшими задержками в памяти и эффективной маркировкой адресов, уменьшающей промахи в кэше, позволяют ядру Power10 потреблять вдвое меньше энергии, чем СИЛА9. В сочетании с улучшениями вычислительных мощностей до 30% производительность всего процессора на ватт в 2,6 раза выше, чем у его предшественника. А в случае установки двух ядер на один и тот же модуль — до 3 раз быстрее при том же бюджете мощности.

Поскольку ядра могут работать как восемь логических процессоров, каждое из 15-ядерных процессоров выглядит для операционной системы как 120 ядер . В двухчиповом модуле это составляет 240 одновременных потоков на один сокет .

ввод/вывод

[ редактировать ]

Чипы имеют полностью переработанную архитектуру памяти и ввода-вывода с использованием открытого интерфейса процессора Coherent Accelerator (OpenCAPI) и интерфейса открытой памяти (OMI). Использование последовательной связи памяти вне микросхемы с контроллерами сокращает количество сигнальных линий, идущих к микросхеме и от нее, увеличивает пропускную способность и позволяет процессору гибко использовать технологию памяти. [4]

Power10 поддерживает широкий спектр типов памяти, включая DDR3–DDR5, GDDR, HBM или постоянную память. Эти конфигурации могут быть изменены клиентом, чтобы наилучшим образом соответствовать варианту использования системы.

  • DDR4 – поддержка до 16 ТБ ОЗУ, 410 ГБ/с, задержка 10 нс
  • GDDR6 – до 800 ГБ/с
  • Постоянное хранилище – до 2 ПБ

Power10 позволяет шифровать данные без снижения производительности на каждом этапе — от оперативной памяти, через ускорители и узлы кластера до хранящихся данных.

Power10 поставляется с функцией PowerAXON, позволяющей осуществлять обмен между чипами и системами, а также шиной OpenCAPI для ускорителей, устройств ввода-вывода и других высокопроизводительных периферийных устройств с когерентной кэш-памятью . Он управляет связью между узлами в кластере одночиповых модулей (SCM) с 16 разъемами или кластере двухчиповых модулей (DCM) с 4 разъемами. Он также управляет семантикой памяти для кластеризации систем, обеспечивая доступ к загрузке/сохранению из ядра до 2 ПБ ОЗУ во всем кластере Power10. IBM называет эту функцию Memory Inception .

И OMI, и PowerAXON могут обрабатывать данные со скоростью 1 ТБ/с за пределами чипа.

Power10 включает PCIe 5 . SCM имеет 32x, а DCM - 64x 5 линий PCIe. Решение удалить поддержку NVLink из Power10 было принято из-за того, что возможности пропускной способности PCIe 5.0 делают поддержку NVLink устаревшей для случаев использования, для которых был разработан Power10. [3] Поддержка встроенного NVLink ранее была уникальным преимуществом POWER8 и POWER9.

Варианты

[ редактировать ]

Чип Power10 доступен в двух вариантах, которые определяются прошивкой в ​​упаковке. Несмотря на то, что чипы физически идентичны, а разница заложена в прошивке, она не может быть изменена ни пользователем, ни IBM после производства. [8]

  • 15× цветов SMT8
    • Оптимизирован для приложений с высокой пропускной способностью, но с меньшими вычислительными нагрузками.
  • 30× ядер SMT4
    • Оптимизирован для приложений с высокими вычислительными нагрузками, требующих сложных наборов инструкций и нескольких циклов загрузки информации в кэш.

Power10 поставляется в трех с пластиковой наземной решеткой с флип-чипом (FC-PLGA) корпусах : один однокристальный модуль (SCM) и два двухчиповых модуля (DCM и eSCM).

  • SCM , однокристальный модуль – 3,6-4,15 ГГц, до 15 ядер SMT8. Возможна кластеризация до 16 розеток. x32 PCIe 5 линий. Размер модуля: 68,5×77,5 мм. Модуль имеет уникальную конфигурацию с 8 разъемами на подложке (OTF) для кабелей симметричной многопроцессорной обработки (SMP), напрямую соединяющих другие модули Power10 SCM.
  • DCM , двухчиповый модуль – 3,4-4,0 ГГц, до 24 ядер SMT8. Можно объединить до четырех розеток. x64 PCIe 5 линий. DCM находится в том же температурном диапазоне, что и предыдущие предложения. Размер модуля: 74,5х85,75 мм. DCM поставляется в четырех вариантах. [9]
    • ЭПЭУ — 12 ядер, 3,36-4,0 ГГц
    • EPEV — 18 ядер, 3,2-4,0 ГГц
    • EPGW — 24 ядра, 2,95-3,9 ГГц
    • EHC8 — 24 ядра, 2,95–3,9 ГГц (для здравоохранения Северной Америки)
  • eSCM , одночиповый модуль начального уровня – 3,0-3,9 ГГц, до 8 ядер SMT8. Он сочетает в себе два чипа Power10. Первый чип полностью работоспособен и имеет 4-8 активных ядер. Другой чип использует только функциональность PCIe, выступая в качестве коммутатора ввода-вывода с большим количеством линий PCIe. Эти модули eSCM могут быть объединены в кластер до четырех сокетов. Размер модуля: 74,5х85,75 мм. eSCM также называется «ioscm». [10] [11]

Предприятие

[ редактировать ]

IBM Power E1080 под кодовым названием Denali — это топовый компьютер Power10 от IBM. Он состоит из 1–4 узлов Центрального электронного комплекса (CEC), каждый из которых занимает 5U пространства. Каждый узел имеет 4 процессора Power10 SCM с возможностью конфигурации с 10, 12 или 15 ядрами SMT8 на процессор и до 16 ТБ оперативной памяти OMI - DDR4 . Power E1080 изначально работает под управлением PowerVM под управлением AIX , IBM i и с прямым порядком байтов Linux . [12] Для системы E1080 также необходим системный блок управления высотой 2U для мониторинга и настройки.

Power E1080 также поддерживает до шестнадцати блоков расширения ввода-вывода, по четыре на узел CEC. Каждый блок расширения подключен к соответствующему узлу CEC двумя модулями разветвления PCIe и имеет двенадцать слотов FHFL PCIe. Четыре из этих слотов — PCIe 3.0 x16, а остальные восемь — PCIe 3.0 x8. Конфигурация с максимальной спецификацией позволяет Power E1080 поддерживать 192 карты PCIe с одним слотом в системе с 16 разъемами. [13]

Средний уровень

[ редактировать ]
  • IBM Power E1050 — корпус 4U. 2–4 разъема ЦП для 2–4 модулей DCM, 24–96 ядер. 64 слота памяти OMI, поддерживающие до 16 ТБ ОЗУ. 11 слотов PCIe, 8 слотов gen.5 и 3x gen.4. 10 слотов для твердотельных накопителей на базе NVMe емкостью до 64 ТБ. Используйте сочетание операционных систем Linux, AIX или IBM i. [9]

Масштабирование

[ редактировать ]

Модели S могут работать под управлением Linux, IBM i и AIX. L-модели созданы для Linux, но могут запускать AIX и IBM i на 25% доступных ядер ЦП. [10]

  • IBM Power S1024 и L1024 — корпус 4U. 1–2 процессорных разъема для 1–2 модулей DCM, 24–48 ядер. 32 слота памяти OMI, поддерживающие до 8 ТБ ОЗУ. 10 слотов PCIe, 8 слотов gen.5 и 2x gen.4. 16 слотов для твердотельных накопителей на базе NVMe емкостью до 102 ТБ.
  • IBM Power S1022 и L1022 — корпус 2U. 1–2 процессорных разъема для 1–2 модулей DCM, 24–40 ядер. 32 слота памяти OMI, поддерживающие до 4 ТБ ОЗУ. 10 слотов PCIe, 8 слотов gen.5 и 2x gen.4. 8 слотов для твердотельных накопителей на базе NVMe емкостью до 51 ТБ.
  • IBM Power S1022s — корпус 2U. 1–2 процессорных разъема для 1–2 модулей eSCM, 4–16 ядер. 16 слотов памяти OMI, поддерживающих до 2 ТБ ОЗУ. 10 слотов PCIe, 8 слотов gen.5 и 2x gen.4. 8 слотов для твердотельных накопителей на базе NVMe емкостью до 51 ТБ.
  • IBM Power S1014 — корпус высотой 4U или настольная башня. 1 модуль eSCM Power10 с 4 или 8 ядрами. 8 слотов памяти OMI, поддерживающих до 1 ТБ ОЗУ. 5 слотов PCIe, 4 поколения 5 и 1 поколение 4. 16 слотов для твердотельных накопителей на базе NVMe емкостью до 102 ТБ.
  • IBM Power S1012 — 2U, корпус половинной ширины или настольная башня. 1 модуль eSCM Power10 с 1, 4 или 8 ядрами. 4 слота памяти OMI, поддерживающие до 256 ГБ ОЗУ. 4 слота PCIe, 4 слота gen.5. 4 слота для твердотельных накопителей на базе NVMe емкостью до 6,4 ТБ.

Поддержка операционной системы

[ редактировать ]

Сравнение с более ранними процессорами POWER

[ редактировать ]

Переход на 7-нм производственный процесс приводит к значительно более высокой производительности на ватт.

Возможности PowerAXON теперь расширены до 2 ПБ единого кластерного пространства памяти, совместно используемого несколькими узлами кластера , и включают поддержку PCIe 5 .

Новые инструкции SIMD и новые типы данных, включая bfloat16 , INT4(INTEGER) и INT8(BIGINT) . [16] [17] направлены на улучшение рабочих нагрузок ИИ.

В отличие от более ранних процессоров POWER9 и POWER8, для Power10 требуется встроенное ПО стороннего производителя с закрытым исходным кодом в чувствительных к безопасности областях модуля ЦП, а также дополнительное встроенное ПО стороннего производителя с закрытым исходным кодом в необходимом внемодульном контроллере памяти. [18]

Брендинг

[ редактировать ]

Power10 необычен тем, что его имя не пишется с заглавной буквы, как POWER9 и все другие предыдущие процессоры POWER. Это изменение является частью ребрендинга IBM своего предложения Power Systems, которое, начиная с Power10, теперь называется просто «Power». У Power10 также есть логотип. [19]

См. также

[ редактировать ]
  1. ^ Доктор Катресс, Ян (17 августа 2020 г.). «Живой блог Hot Chips 2020: процессор IBM POWER10 на 7-нм техпроцессе Samsung» . АнандТех .
  2. ^ Куах, Катянна (17 августа 2020 г.). «IBM сокращает процессоры Power10 до 7 нм вместе с Samsung, которые должны быть выпущены к концу 2021 года» . Регистр .
  3. ^ Jump up to: а б с Шиллинг, Андреас (17 августа 2020 г.). «IBM Power10 предлагает 30 ядер с SMT8, PCIe 5.0 и DDR5» . Аппаратное обеспечение LUXX (на немецком языке).
  4. ^ Jump up to: а б Кеннеди, Патрик (17 августа 2020 г.). «IBM POWER10 в поисках Святого Грааля вычислений» . Сервис TheHome .
  5. ^ «IBM представляет процессор IBM POWER10 нового поколения» . ИБМ . 17 августа 2020 г.
  6. ^ Хосе Морейра, Пунит Бхат АХ и Сатиш Кумар Садасивам (15 апреля 2021 г.). Руководство по передовому опыту использования Matrix-Multiply Assist .
  7. ^ Рассел, Джон (17 августа 2020 г.). «IBM представляет Power10; рекламирует новую схему памяти, безопасность и логические выводы» . HPCwire .
  8. ^ Прикетт Морган, Тимоти (31 августа 2020 г.). «Возможные проекты IBM для систем Power10» . IT-джунгли .
  9. ^ Jump up to: а б Джулиано Ансельми, Марк Грегорутти, Стивен Лутц, Михаэль Маликдем, Гвидо Сомерс, Цветомир Спасов (11 июля 2022 г.). «Технический обзор и введение IBM Power E1050» (PDF) . {{cite web}}: CS1 maint: несколько имен: список авторов ( ссылка )
  10. ^ Jump up to: а б Джулиано Ансельми, Ён Хун Чо, Эндрю Лэйдлоу, Армин Рёлль, Цветомир Спасов (19 июля 2022 г.). «Технический обзор и введение IBM Power S1014, S1022s, S1022 и S1024» (PDF) . {{cite web}}: CS1 maint: несколько имен: список авторов ( ссылка )
  11. ^ Источник GitHub/OpenPower/Rainier
  12. ^ Так выглядит самый мощный сервер в мире
  13. ^ Джулиано Ансельми, Маниш Арора, Ивайло Божинов, Динил Дас, Тургут Генц, Бартломей Грабовски, Мэдисон Ли, Армин Рёлль (9 декабря 2021 г.). «Технический обзор и введение IBM Power E1080» (PDF) . {{cite web}}: CS1 maint: несколько имен: список авторов ( ссылка )
  14. ^ Ларабель, Майкл (9 августа 2020 г.). «Linux 5.9 обеспечивает дополнительную поддержку IBM POWER10, новый/более быстрый ABI системного вызова SCV» . Фороникс .
  15. ^ Jump up to: а б Прикетт Морган, Тимоти (6 августа 2019 г.). «Разговор о высокой пропускной способности с IBM POWER10 Architect» . Следующая платформа .
  16. ^ Патрицио, Энди (18 августа 2020 г.). «IBM подробно описывает процессор POWER10 следующего поколения» . Сетевой мир .
  17. ^ «Псевдонимы типов данных» . ИБМ . 26 августа 2020 г.
  18. ^ «Проблема с POWER10 связана не только с OMI» . 8 сентября 2021 г.
  19. Больше не нужно выкрикивать имя «Сила» (ну, кроме нашего названия здесь)
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: f426c1523632f46ee58fa9b3b38b2287__1719580680
URL1:https://arc.ask3.ru/arc/aa/f4/87/f426c1523632f46ee58fa9b3b38b2287.html
Заголовок, (Title) документа по адресу, URL1:
Power10 - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)