Jump to content

Блэквелл (микроархитектура)

Блэквелл
Запуск 2024
Разработано Нвидиа
Производитель
Процесс изготовления ТСМЦ 4НП
Кодовое имя(а) 100 ГБ
ГБ20x
Технические характеристики
Поддержка памяти HBM3e
PCIe Поддержка PCIe 6.0
Поддерживаемые графические API
ДиректХ DirectX 12 Ultimate (уровень функций 12_2)
Директ3D Директ3Д 12
Шейдерная модель Шейдерная модель 6.8
OpenCL ОпенCL 3.0
OpenGL OpenGL 4.6
Вулкан Вулкан 1.3
Поддерживаемые вычислительные API
ДРУГОЙ Вычислительные возможности 10.x
DirectCompute Да
Медиа-движок
Поддерживаемые кодировщики НВЕНК
История
Предшественник Ада Лавлейс (потребитель)
Хоппер (центр обработки данных)
Преемник Рубин

Blackwell — это графического процессора (GPU), микроархитектура разработанная Nvidia в качестве преемника микроархитектур Hopper и Ada Lovelace .

Название архитектуры Blackwell, названной в честь статистика и математика Дэвида Блэквелла , просочилось в 2022 году, а ускорители B40 и B100 были подтверждены в октябре 2023 года с помощью официальной дорожной карты Nvidia, показанной во время презентации для инвесторов. [1] Об этом было официально объявлено на программном докладе Nvidia GTC 2024 18 марта 2024 года. [2]

История [ править ]

Дэвид Блэквелл (1919–2010), эпоним архитектуры.

В марте 2022 года Nvidia анонсировала архитектуру Hopper для центра обработки данных для ускорителей искусственного интеллекта. Спрос на продукцию Hopper был высоким на протяжении всего ажиотажа вокруг искусственного интеллекта в 2023 году. [3] Время выполнения заказа от заказа до доставки серверов на базе H100 составило от 36 до 52 недель из-за дефицита и высокого спроса. [4] Сообщается, что только в третьем квартале 2023 года Nvidia продала 500 000 ускорителей H100 на базе Hopper. [4] Доминирование Nvidia в области искусственного интеллекта с продуктами Hopper привело к тому, что компания увеличила свою рыночную капитализацию до более чем 2 триллионов долларов, уступив только Microsoft и Apple . [5]

Архитектура Блэквелла названа в честь американского математика Дэвида Блэквелла , который был известен своим вкладом в математические области теории игр , теории вероятностей , теории информации и статистики. Эти области повлияли или реализованы в конструкциях генеративных моделей искусственного интеллекта на основе трансформаторов или их алгоритмах обучения . Блэквелл был первым афроамериканским ученым, принятым в Национальную академию наук . [6]

В презентации Nvidia для инвесторов в октябре 2023 года дорожная карта центра обработки данных была обновлена ​​и теперь включает ссылки на ускорители B100 и B40, а также архитектуру Blackwell. [7] [8] Раньше преемник Hopper в дорожных картах значился просто как «Hopper-Next». В обновленной дорожной карте Nvidia подчеркивается переход от двухлетней периодичности выпуска продуктов для центров обработки данных к ежегодным выпускам, ориентированным на системы x86 и ARM .

На конференции по графическим технологиям (GTC) 18 марта 2024 года Nvidia официально анонсировала архитектуру Blackwell с упором на ускорители центров обработки данных B100 и B200 и сопутствующие продукты, такие как плата HGX B200 с восемью графическими процессорами и стойка NVL72 с 72 графическими процессорами. -масштабная система [9] . Судя по опубликованным показателям мощности и производительности, кажется, что B100 и B200 представляют собой один и тот же кристалл, но первый работает на 75% тактовой частоты B200. [10] Генеральный директор Nvidia Дженсен Хуанг заявил, что с Blackwell «мы создали процессор для эпохи генеративного искусственного интеллекта » и подчеркнул общую платформу Blackwell, сочетающую ускорители Blackwell с процессором Grace на базе ARM от Nvidia. [11] [12] Nvidia рекламировала поддержку Blackwell со стороны руководителей Google , Meta , Microsoft , OpenAI и Oracle . [12] В докладе не упоминались игры.

Архитектура [ править ]

Blackwell — это архитектура, предназначенная как для вычислительных приложений в центрах обработки данных, так и для игровых приложений и приложений для рабочих станций со специальными кристаллами для каждой цели. Предполагаемые утечки указывают на то, что кристаллы ноутбука будут иметь кодовое название GN22-Xx, а соответствующие карты GeForce RTX Mobile GPU будут иметь кодовое имя GB20x. [13] Как и в последнем обозначении, GB200 и GB100 — это торговые марки суперчипов Nvidia Grace Blackwell для центров обработки данных, модулей, объединяющих два графических процессора Blackwell и один процессор Grace на базе Arm. [14]

Узел процесса [ править ]

Blackwell изготовлен на базе специального узла 4NP от TSMC . 4NP — это усовершенствование узла 4N, используемого в архитектурах Хоппера и Ады Лавлейс. Специфический для Nvidia процесс 4NP, вероятно, добавляет металлические слои к стандартной технологии TSMC N4P. [15] Каждый из двух вычислительных кристаллов центра обработки данных B100/B200 содержит 104 миллиарда транзисторов, что на 30% больше, чем 80 миллиардов транзисторов в Hopper предыдущего поколения. [16] Поскольку Blackwell не может воспользоваться преимуществами, которые дает значительное усовершенствование узла процесса, ей необходимо добиться повышения энергоэффективности и производительности за счет базовых архитектурных изменений. [17]

Вычислительные кристаллы в ускорителях центров обработки данных находятся на грани производства полупроводников. [18] Предел сетки при производстве полупроводников — это физический предел размера, который литографические машины могут вытравить на кремниевом кристалле. Ранее Nvidia почти достигла предела прицельной сетки TSMC с 814 мм GH100. 2 умереть. Чтобы не ограничиваться размером кристалла, в ускорителе Nvidia B100 используются два кристалла GB100 в одном корпусе, соединенные каналом со скоростью 10 ТБ/с, который Nvidia называет интерфейсом NV-High Bandwidth (NV-HBI). NV-HBI основан на протоколе NVLink 5.0 . Генеральный директор Nvidia Дженсен Хуанг заявил в интервью CNBC , что Nvidia потратила около 10 миллиардов долларов на исследования и разработки межсоединения кристалла Blackwell NV-HBI. Опытный инженер-полупроводник Джим Келлер , работавший над архитектурами AMD K7, K12 и Zen , раскритиковал эту цифру и заявил, что того же результата можно достичь за 1 миллиард долларов, используя Ultra Ethernet, а не фирменную систему NVLink. [19] Два соединенных вычислительных кристалла могут действовать как большой монолитный кусок кремния с полной когерентностью кэша между обоими кристаллами. [20] Корпус с двумя кристаллами насчитывает 208 миллиардов транзисторов. [18] Эти два кристалла размещаются сверху на кремниевом переходнике, изготовленном с использованием технологии упаковки TSMC CoWoS-L 2.5D. [21]

Потоковый мультипроцессор [ править ]

Цвета CUDA [ править ]

CUDA Compute Capability 10.0 добавлен в Blackwell.

Тензорные ядра [ править ]

Архитектура Blackwell представляет тензорные ядра пятого поколения для вычислений ИИ и выполнения вычислений с плавающей запятой . В дата-центре Blackwell добавляет поддержку типов данных FP4 и FP6. [22] Предыдущая архитектура Hopper представила Transformer Engine — программное обеспечение, упрощающее квантование моделей более высокой точности (например, FP32) до более низкой точности, для чего Hopper имеет большую пропускную способность. В Transformer Engine второго поколения Blackwell добавлена ​​поддержка новых, менее точных типов FP4 и FP6. Использование 4-битных данных обеспечивает большую эффективность и пропускную способность для вывода моделей во время генеративного обучения ИИ. [17] Nvidia заявляет о 20 петафлопсах (исключая двукратный прирост, который компания заявляет из-за разреженности) вычислений FP4 для суперчипа GB200 с двумя графическими процессорами. [23]

См. также [ править ]

Ссылки [ править ]

  1. ^ «Корпорация Nvidia — презентация Nvidia для инвесторов, октябрь 2023 г.» . Нвидиа . Проверено 19 марта 2024 г.
  2. ^ «Платформа Nvidia Blackwell открывает новую эру вычислений» . Отдел новостей NVIDIA . Проверено 19 марта 2024 г.
  3. ^ Шевчик, Крис (18 августа 2023 г.). «Ажиотаж вокруг искусственного интеллекта означает, что Nvidia зарабатывает огромные деньги» . Аппаратное обеспечение Тома . Проверено 24 марта 2024 г.
  4. ^ Jump up to: Перейти обратно: а б Шилов, Антон (28 ноября 2023 г.). «Nvidia продала полмиллиона графических процессоров H100 AI в третьем квартале благодаря Meta и Facebook — сроки выполнения заказов увеличиваются до 52 недель: отчет» . Аппаратное обеспечение Тома . Проверено 24 марта 2024 г.
  5. ^ Кинг, Ян (19 марта 2024 г.). «Nvidia стремится расширить доминирование ИИ с помощью новых чипов Blackwell» . Yahoo! Финансы . Проверено 24 марта 2024 г.
  6. ^ Ли, Джейн Ланхи (19 марта 2024 г.). «Почему новый чип Blackwell от Nvidia является ключом к следующему этапу развития искусственного интеллекта» . Блумберг . Проверено 24 марта 2024 г.
  7. ^ «Презентация для инвесторов» (PDF) . Нвидиа . Октябрь 2023 года . Проверено 24 марта 2024 г.
  8. ^ Гарреффа, Энтони (10 октября 2023 г.). «Графический процессор следующего поколения GB200 Blackwell от NVIDIA включен в дорожную карту центров обработки данных на 2024 год» . ТвикТаун . Проверено 24 марта 2024 г.
  9. ^ «НВИДИА ГБ200 НВЛ72» . NVIDIA . Проверено 4 июля 2024 г.
  10. ^ Бирн, Джозеф (28 марта 2024 г.). «Графический процессор Monster Nvidia Blackwell обещает 30-кратное ускорение, но ожидают 3-кратного ускорения» . XPU.pub . Проверено 4 июля 2024 г.
  11. ^ Лесвинг, Киф (18 марта 2024 г.). «Генеральный директор Nvidia Дженсен Хуанг объявляет о новых чипах искусственного интеллекта: «Нам нужны более производительные графические процессоры» » . CNBC . Проверено 24 марта 2024 г.
  12. ^ Jump up to: Перейти обратно: а б Колфилд, Брайан (18 марта 2024 г.). « Мы создали процессор для эпохи генеративного искусственного интеллекта», — говорит генеральный директор Nvidia» . Нвидиа . Проверено 24 марта 2024 г.
  13. ^ «WhyCry» (8 июня 2024 г.). «Серия ноутбуков NVIDIA GeForce RTX 50 выйдет в 2025 году с вариантами GDDR7 16 ГБ, 12 ГБ и 8 ГБ» . ВидеоКардз . Проверено 4 июля 2024 г. {{cite web}}: CS1 maint: статус URL ( ссылка )
  14. ^ «Платформа NVIDIA Blackwell открывает новую эру вычислений» . Отдел новостей NVIDIA . Проверено 4 июля 2024 г.
  15. ^ Бирн, Джозеф (28 марта 2024 г.). «Графический процессор Monster Nvidia Blackwell обещает 30-кратное ускорение, но ожидают 3-кратного ускорения» . XPU.pub . Проверено 4 июля 2024 г.
  16. ^ Смит, Райан (18 марта 2024 г.). «Анонсированы архитектура NVIDIA Blackwell и ускорители B200/B100: большие объемы данных при меньшем объеме» . АнандТех . Проверено 24 марта 2024 г.
  17. ^ Jump up to: Перейти обратно: а б Прикетт Морган, Тимоти (18 марта 2024 г.). «С графическими процессорами Blackwell искусственный интеллект становится дешевле и проще, конкурировать с Nvidia становится сложнее» . Следующая платформа . Проверено 24 марта 2024 г.
  18. ^ Jump up to: Перейти обратно: а б «Платформа Nvidia Blackwell открывает новую эру вычислений» . Отдел новостей NVIDIA . 18 марта 2024 г. Проверено 24 марта 2024 г.
  19. ^ Гарреффа, Энтони (14 апреля 2024 г.). «Джим Келлер смеется над стоимостью исследований и разработок Nvidia Blackwell в 10 миллиардов долларов, ему следовало бы использовать Ethernet за 1 миллиард долларов» . ТвикТаун . Проверено 16 апреля 2024 г.
  20. ^ Хагедум, Гильберт (18 марта 2024 г.). «Технический обзор графических процессоров Nvidia B200 и GB200 AI: представлен на GTC 2024» . Гуру3D . Проверено 7 апреля 2024 г.
  21. ^ «Nvidia Blackwell «B100» будет иметь 2 кристалла и 192 ГБ памяти HBM3e, B200 — 288 ГБ» . ВидеоКардз . 17 марта 2024 г. Проверено 24 марта 2024 г.
  22. ^ Эдвардс, Бендж (18 марта 2024 г.). «Nvidia представляет Blackwell B200, «самый мощный в мире чип», предназначенный для искусственного интеллекта» . Арс Техника . Проверено 24 марта 2024 г.
  23. ^ «НВИДИА ГБ200 НВЛ72» . NVIDIA . Проверено 4 июля 2024 г.
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 89608f25781373d09b67ffd6d5942e0c__1720111680
URL1:https://arc.ask3.ru/arc/aa/89/0c/89608f25781373d09b67ffd6d5942e0c.html
Заголовок, (Title) документа по адресу, URL1:
Blackwell (microarchitecture) - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)