Вольта (микроархитектура)
Дата выпуска | 7 декабря 2017 г. |
---|---|
Кодовое имя | Время |
Процесс изготовления | TSMC 12 нм ( FinFET ) |
Карты | |
Энтузиаст |
|
История | |
Предшественник | Паскаль |
Вариант | Тьюринг (потребитель, профессионал) |
Преемник | Ампер (бытовой, профессиональный) |
Статус поддержки | |
Поддерживается |

Вольта — это кодовое имя, но не торговая марка. [1] для графического процессора микроархитектуры , разработанной Nvidia , пришедшей на смену Pascal . Впервые об этом было объявлено в дорожной карте в марте 2013 года. [2] хотя первый продукт был анонсирован только в мае 2017 года. [3] Архитектура названа в честь итальянского химика и физика XVIII–XIX веков Алессандро Вольты . Это был первый чип Nvidia, оснащенный тензорными ядрами — специально разработанными ядрами, которые имеют более высокую производительность глубокого обучения по сравнению с обычными ядрами CUDA. [4] Архитектура создана по TSMC 12 -нм техпроцессу FinFET . Микроархитектура Ampere является преемницей Volta.
Первой видеокартой, использовавшей ее, был центр обработки данных Tesla V100, например, как часть системы Nvidia DGX-1 . [3] Он также использовался в Quadro GV100 и Titan V. Не существовало массовых видеокарт GeForce на базе Volta.
После двух разбирательств ВПТЗ США [5] [6] 03 июля 2023 г. Nvidia лишилась заявки на товарный знак Volta в области искусственного интеллекта. Торговая марка Вольта [7] владельцем остается Volta Robots, компания, специализирующаяся на искусственном интеллекте и алгоритмах машинного зрения для роботов и беспилотных транспортных средств.
Подробности [ править ]
Архитектурные улучшения архитектуры Вольта включают следующее:
- CUDA Вычислительные возможности 7.0
- одновременное выполнение операций с целыми числами и с плавающей запятой
- TSMC процесс 12-нм FinFET , [8] что позволяет использовать 21,1 миллиарда транзисторов . [9]
- Память с высокой пропускной способностью 2 (HBM2), [8] [10]
- NVLink 2.0 : шина с высокой пропускной способностью между ЦП и графическим процессором, а также между несколькими графическими процессорами. Обеспечивает гораздо более высокие скорости передачи, чем те, которые достижимы при использовании PCI Express ; по оценкам, обеспечит скорость 25 Гбит / с на полосу. [11] (Отключено для Титана V)
- Тензорные ядра: Тензорное ядро — это блок, который умножает две матрицы FP16 4×4 , а затем добавляет к результату третью матрицу FP16 или FP32 с помощью объединенных операций умножения-сложения и получает результат FP32, который при необходимости может быть понижен до уровня Результат FP16. [12] Тензорные ядра предназначены для ускорения обучения нейронных сетей. [12] Тензорные ядра Volta относятся к первому поколению, а у Ampere есть тензорные ядра третьего поколения. [13] [14]
- PureVideo I, аппаратное декодирование видео Набор функций
Сравнение вычислительных возможностей: GP100, GV100 и GA100 [15]
Возможности графического процессора | Нвидиа Тесла Р100 | Нвидиа Тесла В100 | Нвидиа А100 |
---|---|---|---|
Кодовое имя графического процессора | ГП100 | ГВ100 | GA100 |
Архитектура графического процессора | Нвидиа Паскаль | Нвидиа Вольта | Нвидиа Ампер |
Вычислительные возможности | 6.0 | 7.0 | 8.0 |
Нити / основа | 32 | 32 | 32 |
Макс. короблений/СМ | 64 | 64 | 64 |
Макс. потоков/см | 2048 | 2048 | 2048 |
Макс. количество блоков резьбы/SM | 32 | 32 | 32 |
Макс. 32-битные регистры/SM | 65536 | 65536 | 65536 |
Макс. регистров/блока | 65536 | 65536 | 65536 |
Максимальное количество регистров/потока | 255 | 255 | 255 |
Максимальный размер блока резьбы | 1024 | 1024 | 1024 |
Ядра FP32/SM | 64 | 64 | 64 |
Соотношение регистров SM и ядер FP32 | 1024 | 1024 | 1024 |
Размер общей памяти/SM | 64 КБ | Настраивается до 96 КБ | Настраивается до 164 КБ |
Сравнение матрицы поддержки точности [16] [17]
Поддерживаемые основные точности CUDA | Поддерживаемая точность тензорного ядра | |||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
РП16 | ФП32 | ФП64 | ЦЕЛОЕ1 | ИНТ4 | INT8 | ТФ32 | БФ16 | РП16 | ФП32 | ФП64 | ЦЕЛОЕ1 | ИНТ4 | INT8 | ТФ32 | БФ16 | |
Нвидиа Тесла Р4 | Нет | Да | Да | Нет | Нет | Да | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет |
Нвидиа Р100 | Да | Да | Да | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет |
Нвидиа Вольта | Да | Да | Да | Нет | Нет | Да | Нет | Нет | Да | Нет | Нет | Нет | Нет | Нет | Нет | Нет |
Нвидия Тьюринг | Да | Да | Да | Нет | Нет | Нет | Нет | Нет | Да | Нет | Нет | Да | Да | Да | Нет | Нет |
Нвидиа А100 | Да | Да | Да | Нет | Нет | Да | Нет | Да | Да | Нет | Да | Да | Да | Да | Да | Да |
Легенда:
- FPnn: плавающая запятая с битами nn
- INTn: целое число с n битами
- INT1: двоичный
- TF32: TensorFloat32
- БФ16: bfloat16
Сравнение производительности декодирования
Параллельные потоки | Декодирование H.264 (1080p30) | Декодирование H.265 (HEVC) (1080p30) | Декодирование VP9 (1080p30) |
---|---|---|---|
В100 | 16 | 22 | 22 |
А100 | 75 | 157 | 108 |
Продукты [ править ]
Volta была анонсирована как микроархитектура графического процессора в Xavier поколении Tegra SoC , ориентированная на беспилотные автомобили . [18] [19]
На ежегодной конференции по технологиям графических процессоров Nvidia 10 мая 2017 года Nvidia официально анонсировала микроархитектуру Volta вместе с Tesla V100. [3] Графический процессор Volta GV100 построен по 12-нм техпроцессу с использованием памяти HBM2 с пропускной способностью 900 ГБ/с. [20]
Nvidia официально анонсировала Nvidia TITAN V 7 декабря 2017 года. [21] [22]
Nvidia официально анонсировала Quadro GV100 27 марта 2018 года. [23]
Модель | Запуск | Кодовое имя (а) | Потрясающе ( нм ) | Транзисторы (миллиардов) | Размер матрицы (мм 2 ) | Шинный интерфейс | Основная конфигурация | СМ Считать [а] | Графика Обработка Кластеры [б] | Кэш L2 Размер ( МиБ ) | Тактовые частоты | Скорость заполнения | Память | Вычислительная мощность ( ГФЛОПС ) | TDP (Ватт) | НВЛинк Поддержка | Стартовая цена ( ДОЛЛАР США ) | |||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
ДРУГОЙ основной [с] | Тензор основной [д] | Базовое ядро часы ( МГц ) | Увеличение частоты ( МГц ) | Память ( МТ/с ) | Пиксель ( GPS ) | Текстура ( ГТ /с) | Размер ( ГиБ ) | Пропускная способность ( ГБ /с) | Автобус Тип | Ширина автобуса ( кусочек ) | Одинокий точность (наддув) | Двойной точность (наддув) | Половина точность (наддув) | |||||||||||||
Рекомендуемая розничная цена | ||||||||||||||||||||||||||
Нвидиа Титан V [24] | 7 декабря 2017 г. | ГВ100-400-А1 | TSMC 12 нм | 21.1 | 815 | PCIe 3.0 ×16 | 5120:320:96 | 640 | 80 | 6 | 4.5 | 1200 | 1455 | 1700 | 139.7 | 465.6 | 12 | 652.8 | НБМ2 | 3072 | 12288 (14899) | 6144 (7450) | 24576 (29798) | 250 | Нет | $2,999 |
Нвидиа Квадро GV100 [25] | 27 марта 2018 г. | ГВ100 | 5120:320:128 | 6 | 1132 | 1628 | 1696 | 208.4 | 521 | 32 | 868.4 | 4096 | 11592 (16671) | 5796 (8335) | 23183 (33341) | Да | $8,999 | |||||||||
Nvidia Titan V CEO Edition [26] [27] | 21 июня 2018 г. | 1200 | 1455 | 1700 | 186.2 | 465.6 | 870.4 | 12288 (14899) | 6144 (7450) | 24576 (29798) | Н/Д |
- ^ Один потоковый мультипроцессор включает 64 ядра CUDA и 4 TMU.
- ^ Один кластер обработки графики включает четырнадцать потоковых мультипроцессоров.
- ^ Ядра CUDA : Единицы отображения текстур : Единицы вывода рендеринга
- ^ смешанной точности, Ядро Тензора — это FPU специально разработанный для матричной арифметики.
Приложение [ править ]
Сообщается также, что Volta включена в суперкомпьютеры Summit и Sierra , используемые для вычислений GPGPU. [28] [29] Графические процессоры Volta будут подключаться к процессорам POWER9 через NVLink 2.0 , который, как ожидается, будет поддерживать согласованность кэша и, следовательно, улучшит производительность GPGPU. [30] [11] [31]
См. также [ править ]
- Список эпонимов микроархитектур графических процессоров Nvidia
- Список графических процессоров Nvidia
Ссылки [ править ]
- ^ «Статус торговой марки NVIDIA Volta» . Ведомство_Патентов_и_Торговых знаков США . 14 августа 2023 г. Проверено 14 августа 2023 г.
- ^ Гасиор, Джефф (19 марта 2013 г.). «Графический процессор NVIDIA Volta будет иметь встроенную DRAM» . Технический отчет . Проверено 14 марта 2017 г.
- ^ Jump up to: а б с Смит, Райан (10 мая 2017 г.). «Живой блог NVIDIA GPU Tech Conference 2017» . Проверено 3 ноября 2018 г.
- ^ «Архитектура искусственного интеллекта NVIDIA Volta | NVIDIA» . NVIDIA . Проверено 11 апреля 2018 г.
- ^ «Процедура аннулирования товарного знака Volta» . Ведомство_по патентам_и_товарным знакам_США .
- ^ «Апелляционная процедура Exparte по товарному знаку Volta» . Ведомство_патентов_и_торговых знаков США .
- ^ «Статус торговой марки Volta» . Ведомство_Патентов_и_Торговых знаков США .
- ^ Jump up to: а б Киллиан, Зак (14 марта 2017 г.). «Отчет: TSMC собирается производить Volta и Centriq по 12-нм техпроцессу» . Технический отчет . Проверено 14 марта 2017 г.
- ^ Дюрант, Люк; Жиру, Оливье; Харрис, Марк; Стэм, Ник (10 мая 2017 г.). «Внутри Volta: самый продвинутый в мире графический процессор для центров обработки данных» . Блог разработчиков NVIDIA .
- ^ Гасиор, Джефф (19 марта 2013 г.). «Графический процессор Nvidia Volta будет иметь встроенную DRAM» . Технический отчет .
- ^ Jump up to: а б Шах, Агам (22 августа 2016 г.). «NVLink 2.0 от Nvidia впервые появится на серверах Power9 в следующем году» . Мир ПК . Проверено 14 марта 2017 г.
- ^ Jump up to: а б Харрис, Марк (11 мая 2017 г.). «Раскрытые возможности CUDA 9: Volta, совместные группы и многое другое» . Проверено 12 августа 2017 г.
- ^ «Подробное описание архитектуры NVIDIA Ampere» . 14 мая 2020 г.
- ^ «Архитектура графического процессора NVIDIA A100 с тензорными ядрами» (PDF) . Проверено 15 декабря 2023 г.
- ^ «Архитектура графического процессора NVIDIA A100 с тензорными ядрами: беспрецедентное ускорение в любом масштабе» (PDF) . Нвидиа . Проверено 18 сентября 2020 г.
- ^ «Тензорные ядра NVIDIA: универсальность для высокопроизводительных вычислений и искусственного интеллекта» . NVIDIA .
- ^ "Абстрактный" . docs.nvidia.com .
- ^ Катресс, Ян; Таллис, Билли (4 января 2016 г.). «CES 2017: Живой блог Nvidia Keynote» . АнандТех . Проверено 9 января 2017 г.
- ^ «NVIDIA DRIVE Xavier, самая мощная в мире SoC, открывает потрясающие новые возможности искусственного интеллекта | Блог NVIDIA» . Официальный блог NVIDIA . 07.01.2018 . Проверено 3 ноября 2018 г.
- ^ Смит, Райан (10 мая 2017 г.). «Представление NVIDIA Volta» . АнандТех . Проверено 2 июня 2017 г.
- ^ «NVIDIA TITAN V превращает ПК в суперкомпьютер с искусственным интеллектом» .
- ^ «Представляем NVIDIA TITAN V: самую мощную в мире видеокарту для ПК» .
- ^ «NVIDIA заново изобретает рабочую станцию с помощью трассировки лучей в реальном времени» .
- ^ «Представляем NVIDIA TITAN V: самую мощную в мире видеокарту для ПК» . NVIDIA . Проверено 8 декабря 2017 г.
- ^ «НВИДИА Квадро ГВ100» . Проверено 27 марта 2018 г.
- ^ Смит, Райан. «NVIDIA представляет и раздает новую ограниченную серию Titan V 32 ГБ «CEO Edition» » . Проверено 6 июля 2018 г.
- ^ «NVIDIA TITAN V CEO Edition» . TechPowerUp . Проверено 7 июля 2018 г.
- ^ Шенкленд, Стивен (14 сентября 2015 г.). «IBM и Nvidia заключили сделку по созданию суперкомпьютера на 325 миллионов долларов» . CNET . Проверено 29 декабря 2015 г.
- ^ Нойес, Кэтрин (16 марта 2015 г.). «IBM и Nvidia реализуют двигатели HPC для продвижения суперкомпьютеров следующего поколения» . Мир ПК . Проверено 29 декабря 2015 г.
- ^ Смит, Райан (17 ноября 2014 г.). «Nvidia Volta и земельные контракты IBM Power9 на новые суперкомпьютеры для правительства США» . Анандтех . Проверено 14 марта 2017 г.
- ^ Лилли, Пол (25 января 2017 г.). «12-нм архитектура графического процессора NVIDIA FinFET Volta, как сообщается, заменит Pascal в 2017 году» . Горячее оборудование .