Блэквелл (микроархитектура)
Запуск | 2024 |
---|---|
Разработано | Нвидиа |
Производитель | |
Процесс изготовления | ТСМЦ 4НП |
Кодовое имя(а) | 100 ГБ ГБ20x |
Технические характеристики | |
Поддержка памяти | HBM3e |
PCIe Поддержка | PCIe 6.0 |
Поддерживаемые графические API | |
ДиректХ | DirectX 12 Ultimate (уровень функций 12_2) |
Директ3D | Директ3Д 12 |
Шейдерная модель | Шейдерная модель 6.8 |
OpenCL | ОпенCL 3.0 |
OpenGL | OpenGL 4.6 |
Вулкан | Вулкан 1.3 |
Поддерживаемые вычислительные API | |
ДРУГОЙ | Вычислительные возможности 10.x |
DirectCompute | Да |
Медиа-движок | |
Поддерживаемые кодировщики | НВЕНК |
История | |
Предшественник | Ада Лавлейс (потребитель) Хоппер (центр обработки данных) |
Преемник | Рубин |
Blackwell — это графического процессора (GPU), микроархитектура разработанная Nvidia в качестве преемника микроархитектур Hopper и Ada Lovelace .
Название архитектуры Blackwell, названной в честь статистика и математика Дэвида Блэквелла , просочилось в 2022 году, а ускорители B40 и B100 были подтверждены в октябре 2023 года с помощью официальной дорожной карты Nvidia, показанной во время презентации для инвесторов. [1] Об этом было официально объявлено на программном докладе Nvidia GTC 2024 18 марта 2024 года. [2]
История [ править ]

В марте 2022 года Nvidia анонсировала архитектуру Hopper для центра обработки данных для ускорителей искусственного интеллекта. Спрос на продукцию Hopper был высоким на протяжении всего ажиотажа вокруг искусственного интеллекта в 2023 году. [3] Время выполнения заказа от заказа до доставки серверов на базе H100 составило от 36 до 52 недель из-за дефицита и высокого спроса. [4] Сообщается, что только в третьем квартале 2023 года Nvidia продала 500 000 ускорителей H100 на базе Hopper. [4] Доминирование Nvidia в области искусственного интеллекта с продуктами Hopper привело к тому, что компания увеличила свою рыночную капитализацию до более чем 2 триллионов долларов, уступив только Microsoft и Apple . [5]
Архитектура Блэквелла названа в честь американского математика Дэвида Блэквелла , который был известен своим вкладом в математические области теории игр , теории вероятностей , теории информации и статистики. Эти области повлияли или реализованы в конструкциях генеративных моделей искусственного интеллекта на основе трансформаторов или их алгоритмах обучения . Блэквелл был первым афроамериканским ученым, принятым в Национальную академию наук . [6]
В презентации Nvidia для инвесторов в октябре 2023 года дорожная карта центра обработки данных была обновлена и теперь включает ссылки на ускорители B100 и B40, а также архитектуру Blackwell. [7] [8] Раньше преемник Hopper в дорожных картах значился просто как «Hopper-Next». В обновленной дорожной карте Nvidia подчеркивается переход от двухлетней периодичности выпуска продуктов для центров обработки данных к ежегодным выпускам, ориентированным на системы x86 и ARM .
На конференции по графическим технологиям (GTC) 18 марта 2024 года Nvidia официально анонсировала архитектуру Blackwell с упором на ускорители центров обработки данных B100 и B200 и сопутствующие продукты, такие как плата HGX B200 с восемью графическими процессорами и стойка NVL72 с 72 графическими процессорами. -масштабная система [9] . Судя по опубликованным показателям мощности и производительности, кажется, что B100 и B200 представляют собой один и тот же кристалл, но первый работает на 75% тактовой частоты B200. [10] Генеральный директор Nvidia Дженсен Хуанг заявил, что с Blackwell «мы создали процессор для эпохи генеративного искусственного интеллекта » и подчеркнул общую платформу Blackwell, сочетающую ускорители Blackwell с процессором Grace на базе ARM от Nvidia. [11] [12] Nvidia рекламировала поддержку Blackwell со стороны руководителей Google , Meta , Microsoft , OpenAI и Oracle . [12] В докладе не упоминались игры.
Архитектура [ править ]
Blackwell — это архитектура, предназначенная как для вычислительных приложений в центрах обработки данных, так и для игровых приложений и приложений для рабочих станций со специальными кристаллами для каждой цели. Предполагаемые утечки указывают на то, что кристаллы ноутбука будут иметь кодовое название GN22-Xx, а соответствующие карты GeForce RTX Mobile GPU будут иметь кодовое имя GB20x. [13] Как и в последнем обозначении, GB200 и GB100 — это торговые марки суперчипов Nvidia Grace Blackwell для центров обработки данных, модулей, объединяющих два графических процессора Blackwell и один процессор Grace на базе Arm. [14]
Узел процесса [ править ]
Blackwell изготовлен на базе специального узла 4NP от TSMC . 4NP — это усовершенствование узла 4N, используемого в архитектурах Хоппера и Ады Лавлейс. Специфический для Nvidia процесс 4NP, вероятно, добавляет металлические слои к стандартной технологии TSMC N4P. [15] Каждый из двух вычислительных кристаллов центра обработки данных B100/B200 содержит 104 миллиарда транзисторов, что на 30% больше, чем 80 миллиардов транзисторов в Hopper предыдущего поколения. [16] Поскольку Blackwell не может воспользоваться преимуществами, которые дает значительное усовершенствование узла процесса, ей необходимо добиться повышения энергоэффективности и производительности за счет базовых архитектурных изменений. [17]
Вычислительные кристаллы в ускорителях центров обработки данных находятся на грани производства полупроводников. [18] Предел сетки при производстве полупроводников — это физический предел размера, который литографические машины могут вытравить на кремниевом кристалле. Ранее Nvidia почти достигла предела прицельной сетки TSMC с 814 мм GH100. 2 умереть. Чтобы не ограничиваться размером кристалла, в ускорителе Nvidia B100 используются два кристалла GB100 в одном корпусе, соединенные каналом со скоростью 10 ТБ/с, который Nvidia называет интерфейсом NV-High Bandwidth (NV-HBI). NV-HBI основан на протоколе NVLink 5.0 . Генеральный директор Nvidia Дженсен Хуанг заявил в интервью CNBC , что Nvidia потратила около 10 миллиардов долларов на исследования и разработки межсоединения кристалла Blackwell NV-HBI. Опытный инженер-полупроводник Джим Келлер , работавший над архитектурами AMD K7, K12 и Zen , раскритиковал эту цифру и заявил, что того же результата можно достичь за 1 миллиард долларов, используя Ultra Ethernet, а не фирменную систему NVLink. [19] Два соединенных вычислительных кристалла могут действовать как большой монолитный кусок кремния с полной когерентностью кэша между обоими кристаллами. [20] Корпус с двумя кристаллами насчитывает 208 миллиардов транзисторов. [18] Эти два кристалла размещаются сверху на кремниевом переходнике, изготовленном с использованием технологии упаковки TSMC CoWoS-L 2.5D. [21]
Потоковый мультипроцессор [ править ]
Цвета CUDA [ править ]
CUDA Compute Capability 10.0 добавлен в Blackwell.
Тензорные ядра [ править ]
Архитектура Blackwell представляет тензорные ядра пятого поколения для вычислений ИИ и выполнения вычислений с плавающей запятой . В дата-центре Blackwell добавляет поддержку типов данных FP4 и FP6. [22] Предыдущая архитектура Hopper представила Transformer Engine — программное обеспечение, упрощающее квантование моделей более высокой точности (например, FP32) до более низкой точности, для чего Hopper имеет большую пропускную способность. В Transformer Engine второго поколения Blackwell добавлена поддержка новых, менее точных типов FP4 и FP6. Использование 4-битных данных обеспечивает большую эффективность и пропускную способность для вывода моделей во время генеративного обучения ИИ. [17] Nvidia заявляет о 20 петафлопсах (исключая двукратный прирост, который компания заявляет из-за разреженности) вычислений FP4 для суперчипа GB200 с двумя графическими процессорами. [23]
См. также [ править ]
Ссылки [ править ]
- ^ «Корпорация Nvidia — презентация Nvidia для инвесторов, октябрь 2023 г.» . Нвидиа . Проверено 19 марта 2024 г.
- ^ «Платформа Nvidia Blackwell открывает новую эру вычислений» . Отдел новостей NVIDIA . Проверено 19 марта 2024 г.
- ^ Шевчик, Крис (18 августа 2023 г.). «Ажиотаж вокруг искусственного интеллекта означает, что Nvidia зарабатывает огромные деньги» . Аппаратное обеспечение Тома . Проверено 24 марта 2024 г.
- ^ Jump up to: Перейти обратно: а б Шилов, Антон (28 ноября 2023 г.). «Nvidia продала полмиллиона графических процессоров H100 AI в третьем квартале благодаря Meta и Facebook — сроки выполнения заказов увеличиваются до 52 недель: отчет» . Аппаратное обеспечение Тома . Проверено 24 марта 2024 г.
- ^ Кинг, Ян (19 марта 2024 г.). «Nvidia стремится расширить доминирование ИИ с помощью новых чипов Blackwell» . Yahoo! Финансы . Проверено 24 марта 2024 г.
- ^ Ли, Джейн Ланхи (19 марта 2024 г.). «Почему новый чип Blackwell от Nvidia является ключом к следующему этапу развития искусственного интеллекта» . Блумберг . Проверено 24 марта 2024 г.
- ^ «Презентация для инвесторов» (PDF) . Нвидиа . Октябрь 2023 года . Проверено 24 марта 2024 г.
- ^ Гарреффа, Энтони (10 октября 2023 г.). «Графический процессор следующего поколения GB200 Blackwell от NVIDIA включен в дорожную карту центров обработки данных на 2024 год» . ТвикТаун . Проверено 24 марта 2024 г.
- ^ «НВИДИА ГБ200 НВЛ72» . NVIDIA . Проверено 4 июля 2024 г.
- ^ Бирн, Джозеф (28 марта 2024 г.). «Графический процессор Monster Nvidia Blackwell обещает 30-кратное ускорение, но ожидают 3-кратного ускорения» . XPU.pub . Проверено 4 июля 2024 г.
- ^ Лесвинг, Киф (18 марта 2024 г.). «Генеральный директор Nvidia Дженсен Хуанг объявляет о новых чипах искусственного интеллекта: «Нам нужны более производительные графические процессоры» » . CNBC . Проверено 24 марта 2024 г.
- ^ Jump up to: Перейти обратно: а б Колфилд, Брайан (18 марта 2024 г.). « Мы создали процессор для эпохи генеративного искусственного интеллекта», — говорит генеральный директор Nvidia» . Нвидиа . Проверено 24 марта 2024 г.
- ^ «WhyCry» (8 июня 2024 г.). «Серия ноутбуков NVIDIA GeForce RTX 50 выйдет в 2025 году с вариантами GDDR7 16 ГБ, 12 ГБ и 8 ГБ» . ВидеоКардз . Проверено 4 июля 2024 г.
{{cite web}}
: CS1 maint: статус URL ( ссылка ) - ^ «Платформа NVIDIA Blackwell открывает новую эру вычислений» . Отдел новостей NVIDIA . Проверено 4 июля 2024 г.
- ^ Бирн, Джозеф (28 марта 2024 г.). «Графический процессор Monster Nvidia Blackwell обещает 30-кратное ускорение, но ожидают 3-кратного ускорения» . XPU.pub . Проверено 4 июля 2024 г.
- ^ Смит, Райан (18 марта 2024 г.). «Анонсированы архитектура NVIDIA Blackwell и ускорители B200/B100: большие объемы данных при меньшем объеме» . АнандТех . Проверено 24 марта 2024 г.
- ^ Jump up to: Перейти обратно: а б Прикетт Морган, Тимоти (18 марта 2024 г.). «С графическими процессорами Blackwell искусственный интеллект становится дешевле и проще, конкурировать с Nvidia становится сложнее» . Следующая платформа . Проверено 24 марта 2024 г.
- ^ Jump up to: Перейти обратно: а б «Платформа Nvidia Blackwell открывает новую эру вычислений» . Отдел новостей NVIDIA . 18 марта 2024 г. Проверено 24 марта 2024 г.
- ^ Гарреффа, Энтони (14 апреля 2024 г.). «Джим Келлер смеется над стоимостью исследований и разработок Nvidia Blackwell в 10 миллиардов долларов, ему следовало бы использовать Ethernet за 1 миллиард долларов» . ТвикТаун . Проверено 16 апреля 2024 г.
- ^ Хагедум, Гильберт (18 марта 2024 г.). «Технический обзор графических процессоров Nvidia B200 и GB200 AI: представлен на GTC 2024» . Гуру3D . Проверено 7 апреля 2024 г.
- ^ «Nvidia Blackwell «B100» будет иметь 2 кристалла и 192 ГБ памяти HBM3e, B200 — 288 ГБ» . ВидеоКардз . 17 марта 2024 г. Проверено 24 марта 2024 г.
- ^ Эдвардс, Бендж (18 марта 2024 г.). «Nvidia представляет Blackwell B200, «самый мощный в мире чип», предназначенный для искусственного интеллекта» . Арс Техника . Проверено 24 марта 2024 г.
- ^ «НВИДИА ГБ200 НВЛ72» . NVIDIA . Проверено 4 июля 2024 г.