Jump to content

Вольта (микроархитектура)

Нвидиа Вольта
Дата выпуска 7 декабря 2017 г.
Кодовое имя Время
Процесс изготовления TSMC 12 нм ( FinFET )
Карты
Энтузиаст
  • Тесла В100
  • Тесла V100S PCIe
  • Titan V
  • Титан V, издание для генерального директора
  • Квадро GV100
История
Предшественник Паскаль
Вариант Тьюринг (потребитель, профессионал)
Преемник Ампер (бытовой, профессиональный)
Статус поддержки
Поддерживается
Картина Алессандро Вольта, эпонима архитектуры

Вольта — это кодовое имя, но не торговая марка. [1] для графического процессора микроархитектуры , разработанной Nvidia , пришедшей на смену Pascal . Впервые об этом было объявлено в дорожной карте в марте 2013 года. [2] хотя первый продукт был анонсирован только в мае 2017 года. [3] Архитектура названа в честь итальянского химика и физика XVIII–XIX веков Алессандро Вольты . Это был первый чип Nvidia, оснащенный тензорными ядрами — специально разработанными ядрами, которые имеют более высокую производительность глубокого обучения по сравнению с обычными ядрами CUDA. [4] Архитектура создана по TSMC 12 -нм техпроцессу FinFET . Микроархитектура Ampere является преемницей Volta.

Первой видеокартой, использовавшей ее, был центр обработки данных Tesla V100, например, как часть системы Nvidia DGX-1 . [3] Он также использовался в Quadro GV100 и Titan V. Не существовало массовых видеокарт GeForce на базе Volta.

После двух разбирательств ВПТЗ США [5] [6] 03 июля 2023 г. Nvidia лишилась заявки на товарный знак Volta в области искусственного интеллекта. Торговая марка Вольта [7] владельцем остается Volta Robots, компания, специализирующаяся на искусственном интеллекте и алгоритмах машинного зрения для роботов и беспилотных транспортных средств.

Подробности [ править ]

Архитектурные улучшения архитектуры Вольта включают следующее:

  • CUDA Вычислительные возможности 7.0
    • одновременное выполнение операций с целыми числами и с плавающей запятой
  • TSMC процесс 12-нм FinFET , [8] что позволяет использовать 21,1   миллиарда транзисторов . [9]
  • Память с высокой пропускной способностью 2 (HBM2), [8] [10]
  • NVLink 2.0 : шина с высокой пропускной способностью между ЦП и графическим процессором, а также между несколькими графическими процессорами. Обеспечивает гораздо более высокие скорости передачи, чем те, которые достижимы при использовании PCI Express ; по оценкам, обеспечит скорость 25 Гбит / с на полосу. [11] (Отключено для Титана V)
  • Тензорные ядра: Тензорное ядро ​​— это блок, который умножает две матрицы FP16 4×4 , а затем добавляет к результату третью матрицу FP16 или FP32 с помощью объединенных операций умножения-сложения и получает результат FP32, который при необходимости может быть понижен до уровня Результат FP16. [12] Тензорные ядра предназначены для ускорения обучения нейронных сетей. [12] Тензорные ядра Volta относятся к первому поколению, а у Ampere есть тензорные ядра третьего поколения. [13] [14]
  • PureVideo I, аппаратное декодирование видео Набор функций

Сравнение вычислительных возможностей: GP100, GV100 и GA100 [15]

Возможности графического процессора Нвидиа Тесла Р100 Нвидиа Тесла В100 Нвидиа А100
Кодовое имя графического процессора ГП100 ГВ100 GA100
Архитектура графического процессора Нвидиа Паскаль Нвидиа Вольта Нвидиа Ампер
Вычислительные возможности 6.0 7.0 8.0
Нити / основа 32 32 32
Макс. короблений/СМ 64 64 64
Макс. потоков/см 2048 2048 2048
Макс. количество блоков резьбы/SM 32 32 32
Макс. 32-битные регистры/SM 65536 65536 65536
Макс. регистров/блока 65536 65536 65536
Максимальное количество регистров/потока 255 255 255
Максимальный размер блока резьбы 1024 1024 1024
Ядра FP32/SM 64 64 64
Соотношение регистров SM и ядер FP32 1024 1024 1024
Размер общей памяти/SM 64 КБ Настраивается до 96 КБ Настраивается до 164 КБ

Сравнение матрицы поддержки точности [16] [17]

Поддерживаемые основные точности CUDA Поддерживаемая точность тензорного ядра
РП16 ФП32 ФП64 ЦЕЛОЕ1 ИНТ4 INT8 ТФ32 БФ16 РП16 ФП32 ФП64 ЦЕЛОЕ1 ИНТ4 INT8 ТФ32 БФ16
Нвидиа Тесла Р4 Нет Да Да Нет Нет Да Нет Нет Нет Нет Нет Нет Нет Нет Нет Нет
Нвидиа Р100 Да Да Да Нет Нет Нет Нет Нет Нет Нет Нет Нет Нет Нет Нет Нет
Нвидиа Вольта Да Да Да Нет Нет Да Нет Нет Да Нет Нет Нет Нет Нет Нет Нет
Нвидия Тьюринг Да Да Да Нет Нет Нет Нет Нет Да Нет Нет Да Да Да Нет Нет
Нвидиа А100 Да Да Да Нет Нет Да Нет Да Да Нет Да Да Да Да Да Да

Легенда:

  • FPnn: плавающая запятая с битами nn
  • INTn: целое число с n битами
  • INT1: двоичный
  • TF32: TensorFloat32
  • БФ16: bfloat16

Сравнение производительности декодирования

Параллельные потоки Декодирование H.264 (1080p30) Декодирование H.265 (HEVC) (1080p30) Декодирование VP9 (1080p30)
В100 16 22 22
А100 75 157 108

Продукты [ править ]

Volta была анонсирована как микроархитектура графического процессора в Xavier поколении Tegra SoC , ориентированная на беспилотные автомобили . [18] [19]

На ежегодной конференции по технологиям графических процессоров Nvidia 10 мая 2017 года Nvidia официально анонсировала микроархитектуру Volta вместе с Tesla V100. [3] Графический процессор Volta GV100 построен по 12-нм техпроцессу с использованием памяти HBM2 с пропускной способностью 900 ГБ/с. [20]

Nvidia официально анонсировала Nvidia TITAN V 7 декабря 2017 года. [21] [22]

Nvidia официально анонсировала Quadro GV100 27 марта 2018 года. [23]

Модель Запуск Кодовое имя (а) Потрясающе
( нм )
Транзисторы
(миллиардов)
Размер матрицы
(мм 2 )
Шинный интерфейс Основная конфигурация СМ
Считать [а]
Графика
Обработка
Кластеры [б]
Кэш L2
Размер ( МиБ )
Тактовые частоты Скорость заполнения Память Вычислительная мощность ( ГФЛОПС ) TDP
(Ватт)
НВЛинк Поддержка Стартовая цена
( ДОЛЛАР США )
ДРУГОЙ
основной [с]
Тензор
основной [д]
Базовое ядро
часы ( МГц )
Увеличение частоты
( МГц )
Память
( МТ/с )
Пиксель
( GPS )
Текстура
( ГТ /с)
Размер
( ГиБ )
Пропускная способность
( ГБ /с)
Автобус
Тип
Ширина автобуса
( кусочек )
Одинокий
точность
(наддув)
Двойной
точность
(наддув)
Половина
точность
(наддув)
Рекомендуемая розничная цена
Нвидиа Титан V [24] 7 декабря 2017 г. ГВ100-400-А1 TSMC 12 нм 21.1 815 PCIe 3.0 ×16 5120:320:96 640 80 6 4.5 1200 1455 1700 139.7 465.6 12 652.8 НБМ2 3072 12288 (14899) 6144 (7450) 24576 (29798) 250 Нет $2,999
Нвидиа Квадро GV100 [25] 27 марта 2018 г. ГВ100 5120:320:128 6 1132 1628 1696 208.4 521 32 868.4 4096 11592 (16671) 5796 (8335) 23183 (33341) Да $8,999
Nvidia Titan V CEO Edition [26] [27] 21 июня 2018 г. 1200 1455 1700 186.2 465.6 870.4 12288 (14899) 6144 (7450) 24576 (29798) Н/Д
  1. ^ Один потоковый мультипроцессор включает 64 ядра CUDA и 4 TMU.
  2. ^ Один кластер обработки графики включает четырнадцать потоковых мультипроцессоров.
  3. ^ Ядра CUDA : Единицы отображения текстур : Единицы вывода рендеринга
  4. ^ смешанной точности, Ядро Тензора — это FPU специально разработанный для матричной арифметики.

Приложение [ править ]

Сообщается также, что Volta включена в суперкомпьютеры Summit и Sierra , используемые для вычислений GPGPU. [28] [29] Графические процессоры Volta будут подключаться к процессорам POWER9 через NVLink 2.0 , который, как ожидается, будет поддерживать согласованность кэша и, следовательно, улучшит производительность GPGPU. [30] [11] [31]

См. также [ править ]

Ссылки [ править ]

  1. ^ «Статус торговой марки NVIDIA Volta» . Ведомство_Патентов_и_Торговых знаков США . 14 августа 2023 г. Проверено 14 августа 2023 г.
  2. ^ Гасиор, Джефф (19 марта 2013 г.). «Графический процессор NVIDIA Volta будет иметь встроенную DRAM» . Технический отчет . Проверено 14 марта 2017 г.
  3. ^ Jump up to: а б с Смит, Райан (10 мая 2017 г.). «Живой блог NVIDIA GPU Tech Conference 2017» . Проверено 3 ноября 2018 г.
  4. ^ «Архитектура искусственного интеллекта NVIDIA Volta | NVIDIA» . NVIDIA . Проверено 11 апреля 2018 г.
  5. ^ «Процедура аннулирования товарного знака Volta» . Ведомство_по патентам_и_товарным знакам_США .
  6. ^ «Апелляционная процедура Exparte по товарному знаку Volta» . Ведомство_патентов_и_торговых знаков США .
  7. ^ «Статус торговой марки Volta» . Ведомство_Патентов_и_Торговых знаков США .
  8. ^ Jump up to: а б Киллиан, Зак (14 марта 2017 г.). «Отчет: TSMC собирается производить Volta и Centriq по 12-нм техпроцессу» . Технический отчет . Проверено 14 марта 2017 г.
  9. ^ Дюрант, Люк; Жиру, Оливье; Харрис, Марк; Стэм, Ник (10 мая 2017 г.). «Внутри Volta: самый продвинутый в мире графический процессор для центров обработки данных» . Блог разработчиков NVIDIA .
  10. ^ Гасиор, Джефф (19 марта 2013 г.). «Графический процессор Nvidia Volta будет иметь встроенную DRAM» . Технический отчет .
  11. ^ Jump up to: а б Шах, Агам (22 августа 2016 г.). «NVLink 2.0 от Nvidia впервые появится на серверах Power9 в следующем году» . Мир ПК . Проверено 14 марта 2017 г.
  12. ^ Jump up to: а б Харрис, Марк (11 мая 2017 г.). «Раскрытые возможности CUDA 9: Volta, совместные группы и многое другое» . Проверено 12 августа 2017 г.
  13. ^ «Подробное описание архитектуры NVIDIA Ampere» . 14 мая 2020 г.
  14. ^ «Архитектура графического процессора NVIDIA A100 с тензорными ядрами» (PDF) . Проверено 15 декабря 2023 г.
  15. ^ «Архитектура графического процессора NVIDIA A100 с тензорными ядрами: беспрецедентное ускорение в любом масштабе» (PDF) . Нвидиа . Проверено 18 сентября 2020 г.
  16. ^ «Тензорные ядра NVIDIA: универсальность для высокопроизводительных вычислений и искусственного интеллекта» . NVIDIA .
  17. ^ "Абстрактный" . docs.nvidia.com .
  18. ^ Катресс, Ян; Таллис, Билли (4 января 2016 г.). «CES 2017: Живой блог Nvidia Keynote» . АнандТех . Проверено 9 января 2017 г.
  19. ^ «NVIDIA DRIVE Xavier, самая мощная в мире SoC, открывает потрясающие новые возможности искусственного интеллекта | Блог NVIDIA» . Официальный блог NVIDIA . 07.01.2018 . Проверено 3 ноября 2018 г.
  20. ^ Смит, Райан (10 мая 2017 г.). «Представление NVIDIA Volta» . АнандТех . Проверено 2 июня 2017 г.
  21. ^ «NVIDIA TITAN V превращает ПК в суперкомпьютер с искусственным интеллектом» .
  22. ^ «Представляем NVIDIA TITAN V: самую мощную в мире видеокарту для ПК» .
  23. ^ «NVIDIA заново изобретает рабочую станцию ​​с помощью трассировки лучей в реальном времени» .
  24. ^ «Представляем NVIDIA TITAN V: самую мощную в мире видеокарту для ПК» . NVIDIA . Проверено 8 декабря 2017 г.
  25. ^ «НВИДИА Квадро ГВ100» . Проверено 27 марта 2018 г.
  26. ^ Смит, Райан. «NVIDIA представляет и раздает новую ограниченную серию Titan V 32 ГБ «CEO Edition» » . Проверено 6 июля 2018 г.
  27. ^ «NVIDIA TITAN V CEO Edition» . TechPowerUp . Проверено 7 июля 2018 г.
  28. ^ Шенкленд, Стивен (14 сентября 2015 г.). «IBM и Nvidia заключили сделку по созданию суперкомпьютера на 325 миллионов долларов» . CNET . Проверено 29 декабря 2015 г.
  29. ^ Нойес, Кэтрин (16 марта 2015 г.). «IBM и Nvidia реализуют двигатели HPC для продвижения суперкомпьютеров следующего поколения» . Мир ПК . Проверено 29 декабря 2015 г.
  30. ^ Смит, Райан (17 ноября 2014 г.). «Nvidia Volta и земельные контракты IBM Power9 на новые суперкомпьютеры для правительства США» . Анандтех . Проверено 14 марта 2017 г.
  31. ^ Лилли, Пол (25 января 2017 г.). «12-нм архитектура графического процессора NVIDIA FinFET Volta, как сообщается, заменит Pascal в 2017 году» . Горячее оборудование .

Внешние ссылки [ править ]

Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 76296da2ebeeb8c627ed7d270f7988e9__1714073820
URL1:https://arc.ask3.ru/arc/aa/76/e9/76296da2ebeeb8c627ed7d270f7988e9.html
Заголовок, (Title) документа по адресу, URL1:
Volta (microarchitecture) - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)