Блэквелл (микроархитектура)

Блэквелл
Запуск	2024
Разработано	Нвидиа
Производитель	ТСМК ;
Процесс изготовления	ТСМЦ 4НП
Кодовое имя(а)	100 ГБ ; ГБ20x
Технические характеристики
Поддержка памяти	HBM3e
PCIe Поддержка	PCIe 6.0
Поддерживаемые графические API
ДиректХ	DirectX 12 Ultimate (уровень функций 12_2)
Директ3D	Директ3Д 12
Шейдерная модель	Шейдерная модель 6.8
OpenCL	ОпенCL 3.0
OpenGL	OpenGL 4.6
Вулкан	Вулкан 1.3
Поддерживаемые вычислительные API
ДРУГОЙ	Вычислительные возможности 10.x
DirectCompute	Да
Медиа-движок
Поддерживаемые кодировщики	НВЕНК
История
Предшественник	Ада Лавлейс (потребитель) ; Хоппер (центр обработки данных)
Преемник	Рубин

Blackwell — это графического процессора (GPU), микроархитектура разработанная Nvidia в качестве преемника микроархитектур Hopper и Ada Lovelace .

Название архитектуры Blackwell, названной в честь статистика и математика Дэвида Блэквелла , просочилось в 2022 году, а ускорители B40 и B100 были подтверждены в октябре 2023 года с помощью официальной дорожной карты Nvidia, показанной во время презентации для инвесторов. ^[1] Об этом было официально объявлено на программном докладе Nvidia GTC 2024 18 марта 2024 года. ^[2]

История [ править ]

В марте 2022 года Nvidia анонсировала архитектуру Hopper для центра обработки данных для ускорителей искусственного интеллекта. Спрос на продукцию Hopper был высоким на протяжении всего ажиотажа вокруг искусственного интеллекта в 2023 году. ^[3] Время выполнения заказа от заказа до доставки серверов на базе H100 составило от 36 до 52 недель из-за дефицита и высокого спроса. ^[4] Сообщается, что только в третьем квартале 2023 года Nvidia продала 500 000 ускорителей H100 на базе Hopper. ^[4] Доминирование Nvidia в области искусственного интеллекта с продуктами Hopper привело к тому, что компания увеличила свою рыночную капитализацию до более чем 2 триллионов долларов, уступив только Microsoft и Apple . ^[5]

Архитектура Блэквелла названа в честь американского математика Дэвида Блэквелла , который был известен своим вкладом в математические области теории игр , теории вероятностей , теории информации и статистики. Эти области повлияли или реализованы в конструкциях генеративных моделей искусственного интеллекта на основе трансформаторов или их алгоритмах обучения . Блэквелл был первым афроамериканским ученым, принятым в Национальную академию наук . ^[6]

В презентации Nvidia для инвесторов в октябре 2023 года дорожная карта центра обработки данных была обновлена и теперь включает ссылки на ускорители B100 и B40, а также архитектуру Blackwell. ^[7]^[8] Раньше преемник Hopper в дорожных картах значился просто как «Hopper-Next». В обновленной дорожной карте Nvidia подчеркивается переход от двухлетней периодичности выпуска продуктов для центров обработки данных к ежегодным выпускам, ориентированным на системы x86 и ARM .

На конференции по графическим технологиям (GTC) 18 марта 2024 года Nvidia официально анонсировала архитектуру Blackwell с упором на ускорители центров обработки данных B100 и B200 и сопутствующие продукты, такие как плата HGX B200 с восемью графическими процессорами и стойка NVL72 с 72 графическими процессорами. -масштабная система ^[9]. Судя по опубликованным показателям мощности и производительности, кажется, что B100 и B200 представляют собой один и тот же кристалл, но первый работает на 75% тактовой частоты B200. ^[10] Генеральный директор Nvidia Дженсен Хуанг заявил, что с Blackwell «мы создали процессор для эпохи генеративного искусственного интеллекта » и подчеркнул общую платформу Blackwell, сочетающую ускорители Blackwell с процессором Grace на базе ARM от Nvidia. ^[11]^[12] Nvidia рекламировала поддержку Blackwell со стороны руководителей Google , Meta , Microsoft , OpenAI и Oracle . ^[12] В докладе не упоминались игры.

Архитектура [ править ]

Blackwell — это архитектура, предназначенная как для вычислительных приложений в центрах обработки данных, так и для игровых приложений и приложений для рабочих станций со специальными кристаллами для каждой цели. Предполагаемые утечки указывают на то, что кристаллы ноутбука будут иметь кодовое название GN22-Xx, а соответствующие карты GeForce RTX Mobile GPU будут иметь кодовое имя GB20x. ^[13] Как и в последнем обозначении, GB200 и GB100 — это торговые марки суперчипов Nvidia Grace Blackwell для центров обработки данных, модулей, объединяющих два графических процессора Blackwell и один процессор Grace на базе Arm. ^[14]

Узел процесса [ править ]

Blackwell изготовлен на базе специального узла 4NP от TSMC . 4NP — это усовершенствование узла 4N, используемого в архитектурах Хоппера и Ады Лавлейс. Специфический для Nvidia процесс 4NP, вероятно, добавляет металлические слои к стандартной технологии TSMC N4P. ^[15] Каждый из двух вычислительных кристаллов центра обработки данных B100/B200 содержит 104 миллиарда транзисторов, что на 30% больше, чем 80 миллиардов транзисторов в Hopper предыдущего поколения. ^[16] Поскольку Blackwell не может воспользоваться преимуществами, которые дает значительное усовершенствование узла процесса, ей необходимо добиться повышения энергоэффективности и производительности за счет базовых архитектурных изменений. ^[17]

Вычислительные кристаллы в ускорителях центров обработки данных находятся на грани производства полупроводников. ^[18] Предел сетки при производстве полупроводников — это физический предел размера, который литографические машины могут вытравить на кремниевом кристалле. Ранее Nvidia почти достигла предела прицельной сетки TSMC с 814 мм GH100. ² умереть. Чтобы не ограничиваться размером кристалла, в ускорителе Nvidia B100 используются два кристалла GB100 в одном корпусе, соединенные каналом со скоростью 10 ТБ/с, который Nvidia называет интерфейсом NV-High Bandwidth (NV-HBI). NV-HBI основан на протоколе NVLink 5.0 . Генеральный директор Nvidia Дженсен Хуанг заявил в интервью CNBC , что Nvidia потратила около 10 миллиардов долларов на исследования и разработки межсоединения кристалла Blackwell NV-HBI. Опытный инженер-полупроводник Джим Келлер , работавший над архитектурами AMD K7, K12 и Zen , раскритиковал эту цифру и заявил, что того же результата можно достичь за 1 миллиард долларов, используя Ultra Ethernet, а не фирменную систему NVLink. ^[19] Два соединенных вычислительных кристалла могут действовать как большой монолитный кусок кремния с полной когерентностью кэша между обоими кристаллами. ^[20] Корпус с двумя кристаллами насчитывает 208 миллиардов транзисторов. ^[18] Эти два кристалла размещаются сверху на кремниевом переходнике, изготовленном с использованием технологии упаковки TSMC CoWoS-L 2.5D. ^[21]

Потоковый мультипроцессор [ править ]

Цвета CUDA [ править ]

CUDA Compute Capability 10.0 добавлен в Blackwell.

Тензорные ядра [ править ]

Архитектура Blackwell представляет тензорные ядра пятого поколения для вычислений ИИ и выполнения вычислений с плавающей запятой . В дата-центре Blackwell добавляет поддержку типов данных FP4 и FP6. ^[22] Предыдущая архитектура Hopper представила Transformer Engine — программное обеспечение, упрощающее квантование моделей более высокой точности (например, FP32) до более низкой точности, для чего Hopper имеет большую пропускную способность. В Transformer Engine второго поколения Blackwell добавлена поддержка новых, менее точных типов FP4 и FP6. Использование 4-битных данных обеспечивает большую эффективность и пропускную способность для вывода моделей во время генеративного обучения ИИ. ^[17] Nvidia заявляет о 20 петафлопсах (исключая двукратный прирост, который компания заявляет из-за разреженности) вычислений FP4 для суперчипа GB200 с двумя графическими процессорами. ^[23]

См. также [ править ]

Список эпонимов микроархитектур графических процессоров Nvidia

Ссылки [ править ]

^ «Корпорация Nvidia — презентация Nvidia для инвесторов, октябрь 2023 г.» . Нвидиа . Проверено 19 марта 2024 г.
^ «Платформа Nvidia Blackwell открывает новую эру вычислений» . Отдел новостей NVIDIA . Проверено 19 марта 2024 г.
^ Шевчик, Крис (18 августа 2023 г.). «Ажиотаж вокруг искусственного интеллекта означает, что Nvidia зарабатывает огромные деньги» . Аппаратное обеспечение Тома . Проверено 24 марта 2024 г.
^ Jump up to: Перейти обратно: ^а ^б Шилов, Антон (28 ноября 2023 г.). «Nvidia продала полмиллиона графических процессоров H100 AI в третьем квартале благодаря Meta и Facebook — сроки выполнения заказов увеличиваются до 52 недель: отчет» . Аппаратное обеспечение Тома . Проверено 24 марта 2024 г.
^ Кинг, Ян (19 марта 2024 г.). «Nvidia стремится расширить доминирование ИИ с помощью новых чипов Blackwell» . Yahoo! Финансы . Проверено 24 марта 2024 г.
^ Ли, Джейн Ланхи (19 марта 2024 г.). «Почему новый чип Blackwell от Nvidia является ключом к следующему этапу развития искусственного интеллекта» . Блумберг . Проверено 24 марта 2024 г.
^ «Презентация для инвесторов» (PDF) . Нвидиа . Октябрь 2023 года . Проверено 24 марта 2024 г.
^ Гарреффа, Энтони (10 октября 2023 г.). «Графический процессор следующего поколения GB200 Blackwell от NVIDIA включен в дорожную карту центров обработки данных на 2024 год» . ТвикТаун . Проверено 24 марта 2024 г.
^ «НВИДИА ГБ200 НВЛ72» . NVIDIA . Проверено 4 июля 2024 г.
^ Бирн, Джозеф (28 марта 2024 г.). «Графический процессор Monster Nvidia Blackwell обещает 30-кратное ускорение, но ожидают 3-кратного ускорения» . XPU.pub . Проверено 4 июля 2024 г.
^ Лесвинг, Киф (18 марта 2024 г.). «Генеральный директор Nvidia Дженсен Хуанг объявляет о новых чипах искусственного интеллекта: «Нам нужны более производительные графические процессоры» » . CNBC . Проверено 24 марта 2024 г.
^ Jump up to: Перейти обратно: ^а ^б Колфилд, Брайан (18 марта 2024 г.). « Мы создали процессор для эпохи генеративного искусственного интеллекта», — говорит генеральный директор Nvidia» . Нвидиа . Проверено 24 марта 2024 г.
^ «WhyCry» (8 июня 2024 г.). «Серия ноутбуков NVIDIA GeForce RTX 50 выйдет в 2025 году с вариантами GDDR7 16 ГБ, 12 ГБ и 8 ГБ» . ВидеоКардз . Проверено 4 июля 2024 г. {{cite web}}: CS1 maint: статус URL ( ссылка )
^ «Платформа NVIDIA Blackwell открывает новую эру вычислений» . Отдел новостей NVIDIA . Проверено 4 июля 2024 г.
^ Бирн, Джозеф (28 марта 2024 г.). «Графический процессор Monster Nvidia Blackwell обещает 30-кратное ускорение, но ожидают 3-кратного ускорения» . XPU.pub . Проверено 4 июля 2024 г.
^ Смит, Райан (18 марта 2024 г.). «Анонсированы архитектура NVIDIA Blackwell и ускорители B200/B100: большие объемы данных при меньшем объеме» . АнандТех . Проверено 24 марта 2024 г.
^ Jump up to: Перейти обратно: ^а ^б Прикетт Морган, Тимоти (18 марта 2024 г.). «С графическими процессорами Blackwell искусственный интеллект становится дешевле и проще, конкурировать с Nvidia становится сложнее» . Следующая платформа . Проверено 24 марта 2024 г.
^ Jump up to: Перейти обратно: ^а ^б «Платформа Nvidia Blackwell открывает новую эру вычислений» . Отдел новостей NVIDIA . 18 марта 2024 г. Проверено 24 марта 2024 г.
^ Гарреффа, Энтони (14 апреля 2024 г.). «Джим Келлер смеется над стоимостью исследований и разработок Nvidia Blackwell в 10 миллиардов долларов, ему следовало бы использовать Ethernet за 1 миллиард долларов» . ТвикТаун . Проверено 16 апреля 2024 г.
^ Хагедум, Гильберт (18 марта 2024 г.). «Технический обзор графических процессоров Nvidia B200 и GB200 AI: представлен на GTC 2024» . Гуру3D . Проверено 7 апреля 2024 г.
^ «Nvidia Blackwell «B100» будет иметь 2 кристалла и 192 ГБ памяти HBM3e, B200 — 288 ГБ» . ВидеоКардз . 17 марта 2024 г. Проверено 24 марта 2024 г.
^ Эдвардс, Бендж (18 марта 2024 г.). «Nvidia представляет Blackwell B200, «самый мощный в мире чип», предназначенный для искусственного интеллекта» . Арс Техника . Проверено 24 марта 2024 г.
^ «НВИДИА ГБ200 НВЛ72» . NVIDIA . Проверено 4 июля 2024 г.

[1] «Корпорация Nvidia — презентация Nvidia для инвесторов, октябрь 2023 г.» . Нвидиа . Проверено 19 марта 2024 г.

[2] «Платформа Nvidia Blackwell открывает новую эру вычислений» . Отдел новостей NVIDIA . Проверено 19 марта 2024 г.

[3] Шевчик, Крис (18 августа 2023 г.). «Ажиотаж вокруг искусственного интеллекта означает, что Nvidia зарабатывает огромные деньги» . Аппаратное обеспечение Тома . Проверено 24 марта 2024 г.

[Shilov-4] Jump up to: Перейти обратно: ^а ^б Шилов, Антон (28 ноября 2023 г.). «Nvidia продала полмиллиона графических процессоров H100 AI в третьем квартале благодаря Meta и Facebook — сроки выполнения заказов увеличиваются до 52 недель: отчет» . Аппаратное обеспечение Тома . Проверено 24 марта 2024 г.

[5] Кинг, Ян (19 марта 2024 г.). «Nvidia стремится расширить доминирование ИИ с помощью новых чипов Blackwell» . Yahoo! Финансы . Проверено 24 марта 2024 г.

[6] Ли, Джейн Ланхи (19 марта 2024 г.). «Почему новый чип Blackwell от Nvidia является ключом к следующему этапу развития искусственного интеллекта» . Блумберг . Проверено 24 марта 2024 г.

[7] «Презентация для инвесторов» (PDF) . Нвидиа . Октябрь 2023 года . Проверено 24 марта 2024 г.

[8] Гарреффа, Энтони (10 октября 2023 г.). «Графический процессор следующего поколения GB200 Blackwell от NVIDIA включен в дорожную карту центров обработки данных на 2024 год» . ТвикТаун . Проверено 24 марта 2024 г.

[9] «НВИДИА ГБ200 НВЛ72» . NVIDIA . Проверено 4 июля 2024 г.

[10] Бирн, Джозеф (28 марта 2024 г.). «Графический процессор Monster Nvidia Blackwell обещает 30-кратное ускорение, но ожидают 3-кратного ускорения» . XPU.pub . Проверено 4 июля 2024 г.

[11] Лесвинг, Киф (18 марта 2024 г.). «Генеральный директор Nvidia Дженсен Хуанг объявляет о новых чипах искусственного интеллекта: «Нам нужны более производительные графические процессоры» » . CNBC . Проверено 24 марта 2024 г.

[Caufield-12] Jump up to: Перейти обратно: ^а ^б Колфилд, Брайан (18 марта 2024 г.). « Мы создали процессор для эпохи генеративного искусственного интеллекта», — говорит генеральный директор Nvidia» . Нвидиа . Проверено 24 марта 2024 г.

[13] «WhyCry» (8 июня 2024 г.). «Серия ноутбуков NVIDIA GeForce RTX 50 выйдет в 2025 году с вариантами GDDR7 16 ГБ, 12 ГБ и 8 ГБ» . ВидеоКардз . Проверено 4 июля 2024 г. {{cite web}}: CS1 maint: статус URL ( ссылка )

[14] «Платформа NVIDIA Blackwell открывает новую эру вычислений» . Отдел новостей NVIDIA . Проверено 4 июля 2024 г.

[15] Бирн, Джозеф (28 марта 2024 г.). «Графический процессор Monster Nvidia Blackwell обещает 30-кратное ускорение, но ожидают 3-кратного ускорения» . XPU.pub . Проверено 4 июля 2024 г.

[16] Смит, Райан (18 марта 2024 г.). «Анонсированы архитектура NVIDIA Blackwell и ускорители B200/B100: большие объемы данных при меньшем объеме» . АнандТех . Проверено 24 марта 2024 г.

[Morgan-17] Jump up to: Перейти обратно: ^а ^б Прикетт Морган, Тимоти (18 марта 2024 г.). «С графическими процессорами Blackwell искусственный интеллект становится дешевле и проще, конкурировать с Nvidia становится сложнее» . Следующая платформа . Проверено 24 марта 2024 г.

[Nvidia_2024-03-18-18] Jump up to: Перейти обратно: ^а ^б «Платформа Nvidia Blackwell открывает новую эру вычислений» . Отдел новостей NVIDIA . 18 марта 2024 г. Проверено 24 марта 2024 г.

[19] Гарреффа, Энтони (14 апреля 2024 г.). «Джим Келлер смеется над стоимостью исследований и разработок Nvidia Blackwell в 10 миллиардов долларов, ему следовало бы использовать Ethernet за 1 миллиард долларов» . ТвикТаун . Проверено 16 апреля 2024 г.

[20] Хагедум, Гильберт (18 марта 2024 г.). «Технический обзор графических процессоров Nvidia B200 и GB200 AI: представлен на GTC 2024» . Гуру3D . Проверено 7 апреля 2024 г.

[21] «Nvidia Blackwell «B100» будет иметь 2 кристалла и 192 ГБ памяти HBM3e, B200 — 288 ГБ» . ВидеоКардз . 17 марта 2024 г. Проверено 24 марта 2024 г.

[22] Эдвардс, Бендж (18 марта 2024 г.). «Nvidia представляет Blackwell B200, «самый мощный в мире чип», предназначенный для искусственного интеллекта» . Арс Техника . Проверено 24 марта 2024 г.

[23] «НВИДИА ГБ200 НВЛ72» . NVIDIA . Проверено 4 июля 2024 г.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

[15]

[16]

[17]

[18]

[19]

[20]

[21]

[22]

[23]