Вольта (микроархитектура)

Нвидиа Вольта
Дата выпуска	7 декабря 2017 г.
Кодовое имя	Время
Процесс изготовления	TSMC 12 нм ( FinFET )
Карты
Энтузиаст	Тесла В100 ; Тесла V100S PCIe ; Titan V ; Титан V, издание для генерального директора ; Квадро GV100 ;
История
Предшественник	Паскаль
Вариант	Тьюринг (потребитель, профессионал)
Преемник	Ампер (бытовой, профессиональный)
Статус поддержки
	Поддерживается

Вольта — это кодовое имя, но не торговая марка. ^[1] для графического процессора микроархитектуры , разработанной Nvidia , пришедшей на смену Pascal . Впервые об этом было объявлено в дорожной карте в марте 2013 года. ^[2] хотя первый продукт был анонсирован только в мае 2017 года. ^[3] Архитектура названа в честь итальянского химика и физика XVIII–XIX веков Алессандро Вольты . Это был первый чип Nvidia, оснащенный тензорными ядрами — специально разработанными ядрами, которые имеют более высокую производительность глубокого обучения по сравнению с обычными ядрами CUDA. ^[4] Архитектура создана по TSMC 12 -нм техпроцессу FinFET . Микроархитектура Ampere является преемницей Volta.

Первой видеокартой, использовавшей ее, был центр обработки данных Tesla V100, например, как часть системы Nvidia DGX-1 . ^[3] Он также использовался в Quadro GV100 и Titan V. Не существовало массовых видеокарт GeForce на базе Volta.

После двух разбирательств ВПТЗ США ^[5]^[6] 03 июля 2023 г. Nvidia лишилась заявки на товарный знак Volta в области искусственного интеллекта. Торговая марка Вольта ^[7] владельцем остается Volta Robots, компания, специализирующаяся на искусственном интеллекте и алгоритмах машинного зрения для роботов и беспилотных транспортных средств.

Подробности [ править ]

Архитектурные улучшения архитектуры Вольта включают следующее:

CUDA Вычислительные возможности 7.0
- одновременное выполнение операций с целыми числами и с плавающей запятой
TSMC процесс 12-нм FinFET , ^[8] что позволяет использовать 21,1 миллиарда транзисторов . ^[9]
Память с высокой пропускной способностью 2 (HBM2), ^[8]^[10]
NVLink 2.0 : шина с высокой пропускной способностью между ЦП и графическим процессором, а также между несколькими графическими процессорами. Обеспечивает гораздо более высокие скорости передачи, чем те, которые достижимы при использовании PCI Express ; по оценкам, обеспечит скорость 25 Гбит / с на полосу. ^[11] (Отключено для Титана V)
Тензорные ядра: Тензорное ядро — это блок, который умножает две матрицы FP16 4×4 , а затем добавляет к результату третью матрицу FP16 или FP32 с помощью объединенных операций умножения-сложения и получает результат FP32, который при необходимости может быть понижен до уровня Результат FP16. ^[12] Тензорные ядра предназначены для ускорения обучения нейронных сетей. ^[12] Тензорные ядра Volta относятся к первому поколению, а у Ampere есть тензорные ядра третьего поколения. ^[13]^[14]
PureVideo I, аппаратное декодирование видео Набор функций

Сравнение вычислительных возможностей: GP100, GV100 и GA100 ^[15]

Возможности графического процессора	Нвидиа Тесла Р100	Нвидиа Тесла В100	Нвидиа А100
Кодовое имя графического процессора	ГП100	ГВ100	GA100
Архитектура графического процессора	Нвидиа Паскаль	Нвидиа Вольта	Нвидиа Ампер
Вычислительные возможности	6.0	7.0	8.0
Нити / основа	32	32	32
Макс. короблений/СМ	64	64	64
Макс. потоков/см	2048	2048	2048
Макс. количество блоков резьбы/SM	32	32	32
Макс. 32-битные регистры/SM	65536	65536	65536
Макс. регистров/блока	65536	65536	65536
Максимальное количество регистров/потока	255	255	255
Максимальный размер блока резьбы	1024	1024	1024
Ядра FP32/SM	64	64	64
Соотношение регистров SM и ядер FP32	1024	1024	1024
Размер общей памяти/SM	64 КБ	Настраивается до 96 КБ	Настраивается до 164 КБ

Сравнение матрицы поддержки точности ^[16]^[17]

	Поддерживаемые основные точности CUDA								Поддерживаемая точность тензорного ядра
	РП16	ФП32	ФП64	ЦЕЛОЕ1	ИНТ4	INT8	ТФ32	БФ16	РП16	ФП32	ФП64	ЦЕЛОЕ1	ИНТ4	INT8	ТФ32	БФ16
Нвидиа Тесла Р4	Нет	Да	Да	Нет	Нет	Да	Нет	Нет	Нет	Нет	Нет	Нет	Нет	Нет	Нет	Нет
Нвидиа Р100	Да	Да	Да	Нет	Нет	Нет	Нет	Нет	Нет	Нет	Нет	Нет	Нет	Нет	Нет	Нет
Нвидиа Вольта	Да	Да	Да	Нет	Нет	Да	Нет	Нет	Да	Нет	Нет	Нет	Нет	Нет	Нет	Нет
Нвидия Тьюринг	Да	Да	Да	Нет	Нет	Нет	Нет	Нет	Да	Нет	Нет	Да	Да	Да	Нет	Нет
Нвидиа А100	Да	Да	Да	Нет	Нет	Да	Нет	Да	Да	Нет	Да	Да	Да	Да	Да	Да

Легенда:

FPnn: плавающая запятая с битами nn
INTn: целое число с n битами
INT1: двоичный
TF32: TensorFloat32
БФ16: bfloat16

Сравнение производительности декодирования

Параллельные потоки	Декодирование H.264 (1080p30)	Декодирование H.265 (HEVC) (1080p30)	Декодирование VP9 (1080p30)
В100	16	22	22
А100	75	157	108

Продукты [ править ]

Volta была анонсирована как микроархитектура графического процессора в Xavier поколении Tegra SoC , ориентированная на беспилотные автомобили . ^[18]^[19]

На ежегодной конференции по технологиям графических процессоров Nvidia 10 мая 2017 года Nvidia официально анонсировала микроархитектуру Volta вместе с Tesla V100. ^[3] Графический процессор Volta GV100 построен по 12-нм техпроцессу с использованием памяти HBM2 с пропускной способностью 900 ГБ/с. ^[20]

Nvidia официально анонсировала Nvidia TITAN V 7 декабря 2017 года. ^[21]^[22]

Nvidia официально анонсировала Quadro GV100 27 марта 2018 года. ^[23]

Модель	Запуск	Кодовое имя (а)	Потрясающе ( нм )	Транзисторы (миллиардов)	Размер матрицы (мм ²)	Шинный интерфейс	Основная конфигурация		СМ Считать ^[а]	Графика Обработка Кластеры ^[б]	Кэш L2 Размер ( МиБ )	Тактовые частоты			Скорость заполнения		Память				Вычислительная мощность ( ГФЛОПС )			TDP (Ватт)	НВЛинк Поддержка	Стартовая цена ( ДОЛЛАР США )
							ДРУГОЙ основной ^[с]	Тензор основной ^[д]				Базовое ядро часы ( МГц )	Увеличение частоты ( МГц )	Память ( МТ/с )	Пиксель ( GPS )	Текстура ( ГТ /с)	Размер ( ГиБ )	Пропускная способность ( ГБ /с)	Автобус Тип	Ширина автобуса ( кусочек )	Одинокий точность (наддув)	Двойной точность (наддув)	Половина точность (наддув)			Стартовая цена ( ДОЛЛАР США )
							ДРУГОЙ основной ^[с]	Тензор основной ^[д]				Базовое ядро часы ( МГц )	Увеличение частоты ( МГц )	Память ( МТ/с )	Пиксель ( GPS )	Текстура ( ГТ /с)	Размер ( ГиБ )	Пропускная способность ( ГБ /с)	Автобус Тип	Ширина автобуса ( кусочек )	Одинокий точность (наддув)	Двойной точность (наддув)	Половина точность (наддув)			Рекомендуемая розничная цена
Нвидиа Титан V ^[24]	7 декабря 2017 г.	ГВ100-400-А1	TSMC 12 нм	21.1	815	PCIe 3.0 ×16	5120:320:96	640	80	6	4.5	1200	1455	1700	139.7	465.6	12	652.8	НБМ2	3072	12288 (14899)	6144 (7450)	24576 (29798)	250	Нет	$2,999
Нвидиа Квадро GV100 ^[25]	27 марта 2018 г.	ГВ100					5120:320:128				6	1132	1628	1696	208.4	521	32	868.4		4096	11592 (16671)	5796 (8335)	23183 (33341)		Да	$8,999
Nvidia Titan V CEO Edition ^[26]^[27]	21 июня 2018 г.	ГВ100					5120:320:128				6	1200	1455	1700	186.2	465.6	32	870.4		4096	12288 (14899)	6144 (7450)	24576 (29798)		Да	Н/Д

^ Один потоковый мультипроцессор включает 64 ядра CUDA и 4 TMU.
^ Один кластер обработки графики включает четырнадцать потоковых мультипроцессоров.
^ Ядра CUDA : Единицы отображения текстур : Единицы вывода рендеринга
^ смешанной точности, Ядро Тензора — это FPU специально разработанный для матричной арифметики.

Приложение [ править ]

Сообщается также, что Volta включена в суперкомпьютеры Summit и Sierra , используемые для вычислений GPGPU. ^[28]^[29] Графические процессоры Volta будут подключаться к процессорам POWER9 через NVLink 2.0 , который, как ожидается, будет поддерживать согласованность кэша и, следовательно, улучшит производительность GPGPU. ^[30]^[11]^[31]

См. также [ править ]

Ссылки [ править ]

^ «Статус торговой марки NVIDIA Volta» . Ведомство_Патентов_и_Торговых знаков США . 14 августа 2023 г. Проверено 14 августа 2023 г.
^ Гасиор, Джефф (19 марта 2013 г.). «Графический процессор NVIDIA Volta будет иметь встроенную DRAM» . Технический отчет . Проверено 14 марта 2017 г.
^ Jump up to: ^а ^б ^с Смит, Райан (10 мая 2017 г.). «Живой блог NVIDIA GPU Tech Conference 2017» . Проверено 3 ноября 2018 г.
^ «Архитектура искусственного интеллекта NVIDIA Volta | NVIDIA» . NVIDIA . Проверено 11 апреля 2018 г.
^ «Процедура аннулирования товарного знака Volta» . Ведомство_по патентам_и_товарным знакам_США .
^ «Апелляционная процедура Exparte по товарному знаку Volta» . Ведомство_патентов_и_торговых знаков США .
^ «Статус торговой марки Volta» . Ведомство_Патентов_и_Торговых знаков США .
^ Jump up to: ^а ^б Киллиан, Зак (14 марта 2017 г.). «Отчет: TSMC собирается производить Volta и Centriq по 12-нм техпроцессу» . Технический отчет . Проверено 14 марта 2017 г.
^ Дюрант, Люк; Жиру, Оливье; Харрис, Марк; Стэм, Ник (10 мая 2017 г.). «Внутри Volta: самый продвинутый в мире графический процессор для центров обработки данных» . Блог разработчиков NVIDIA .
^ Гасиор, Джефф (19 марта 2013 г.). «Графический процессор Nvidia Volta будет иметь встроенную DRAM» . Технический отчет .
^ Jump up to: ^а ^б Шах, Агам (22 августа 2016 г.). «NVLink 2.0 от Nvidia впервые появится на серверах Power9 в следующем году» . Мир ПК . Проверено 14 марта 2017 г.
^ Jump up to: ^а ^б Харрис, Марк (11 мая 2017 г.). «Раскрытые возможности CUDA 9: Volta, совместные группы и многое другое» . Проверено 12 августа 2017 г.
^ «Подробное описание архитектуры NVIDIA Ampere» . 14 мая 2020 г.
^ «Архитектура графического процессора NVIDIA A100 с тензорными ядрами» (PDF) . Проверено 15 декабря 2023 г.
^ «Архитектура графического процессора NVIDIA A100 с тензорными ядрами: беспрецедентное ускорение в любом масштабе» (PDF) . Нвидиа . Проверено 18 сентября 2020 г.
^ «Тензорные ядра NVIDIA: универсальность для высокопроизводительных вычислений и искусственного интеллекта» . NVIDIA .
^ "Абстрактный" . docs.nvidia.com .
^ Катресс, Ян; Таллис, Билли (4 января 2016 г.). «CES 2017: Живой блог Nvidia Keynote» . АнандТех . Проверено 9 января 2017 г.
^ «NVIDIA DRIVE Xavier, самая мощная в мире SoC, открывает потрясающие новые возможности искусственного интеллекта | Блог NVIDIA» . Официальный блог NVIDIA . 07.01.2018 . Проверено 3 ноября 2018 г.
^ Смит, Райан (10 мая 2017 г.). «Представление NVIDIA Volta» . АнандТех . Проверено 2 июня 2017 г.
^ «NVIDIA TITAN V превращает ПК в суперкомпьютер с искусственным интеллектом» .
^ «Представляем NVIDIA TITAN V: самую мощную в мире видеокарту для ПК» .
^ «NVIDIA заново изобретает рабочую станцию с помощью трассировки лучей в реальном времени» .
^ «Представляем NVIDIA TITAN V: самую мощную в мире видеокарту для ПК» . NVIDIA . Проверено 8 декабря 2017 г.
^ «НВИДИА Квадро ГВ100» . Проверено 27 марта 2018 г.
^ Смит, Райан. «NVIDIA представляет и раздает новую ограниченную серию Titan V 32 ГБ «CEO Edition» » . Проверено 6 июля 2018 г.
^ «NVIDIA TITAN V CEO Edition» . TechPowerUp . Проверено 7 июля 2018 г.
^ Шенкленд, Стивен (14 сентября 2015 г.). «IBM и Nvidia заключили сделку по созданию суперкомпьютера на 325 миллионов долларов» . CNET . Проверено 29 декабря 2015 г.
^ Нойес, Кэтрин (16 марта 2015 г.). «IBM и Nvidia реализуют двигатели HPC для продвижения суперкомпьютеров следующего поколения» . Мир ПК . Проверено 29 декабря 2015 г.
^ Смит, Райан (17 ноября 2014 г.). «Nvidia Volta и земельные контракты IBM Power9 на новые суперкомпьютеры для правительства США» . Анандтех . Проверено 14 марта 2017 г.
^ Лилли, Пол (25 января 2017 г.). «12-нм архитектура графического процессора NVIDIA FinFET Volta, как сообщается, заменит Pascal в 2017 году» . Горячее оборудование .

Внешние ссылки [ править ]

[c-24] Один потоковый мультипроцессор включает 64 ядра CUDA и 4 TMU.

[d-25] Один кластер обработки графики включает четырнадцать потоковых мультипроцессоров.

[a-26] Ядра CUDA : Единицы отображения текстур : Единицы вывода рендеринга

[b-27] смешанной точности, Ядро Тензора — это FPU специально разработанный для матричной арифметики.

[1] «Статус торговой марки NVIDIA Volta» . Ведомство_Патентов_и_Торговых знаков США . 14 августа 2023 г. Проверено 14 августа 2023 г.

[2] Гасиор, Джефф (19 марта 2013 г.). «Графический процессор NVIDIA Volta будет иметь встроенную DRAM» . Технический отчет . Проверено 14 марта 2017 г.

[:2-3] Jump up to: ^а ^б ^с Смит, Райан (10 мая 2017 г.). «Живой блог NVIDIA GPU Tech Conference 2017» . Проверено 3 ноября 2018 г.

[4] «Архитектура искусственного интеллекта NVIDIA Volta | NVIDIA» . NVIDIA . Проверено 11 апреля 2018 г.

[5] «Процедура аннулирования товарного знака Volta» . Ведомство_по патентам_и_товарным знакам_США .

[6] «Апелляционная процедура Exparte по товарному знаку Volta» . Ведомство_патентов_и_торговых знаков США .

[7] «Статус торговой марки Volta» . Ведомство_Патентов_и_Торговых знаков США .

[TR_12-8] Jump up to: ^а ^б Киллиан, Зак (14 марта 2017 г.). «Отчет: TSMC собирается производить Volta и Centriq по 12-нм техпроцессу» . Технический отчет . Проверено 14 марта 2017 г.

[9] Дюрант, Люк; Жиру, Оливье; Харрис, Марк; Стэм, Ник (10 мая 2017 г.). «Внутри Volta: самый продвинутый в мире графический процессор для центров обработки данных» . Блог разработчиков NVIDIA .

[10] Гасиор, Джефф (19 марта 2013 г.). «Графический процессор Nvidia Volta будет иметь встроенную DRAM» . Технический отчет .

[pcworld-11] Jump up to: ^а ^б Шах, Агам (22 августа 2016 г.). «NVLink 2.0 от Nvidia впервые появится на серверах Power9 в следующем году» . Мир ПК . Проверено 14 марта 2017 г.

[CUDA9-12] Jump up to: ^а ^б Харрис, Марк (11 мая 2017 г.). «Раскрытые возможности CUDA 9: Volta, совместные группы и многое другое» . Проверено 12 августа 2017 г.

[13] «Подробное описание архитектуры NVIDIA Ampere» . 14 мая 2020 г.

[14] «Архитектура графического процессора NVIDIA A100 с тензорными ядрами» (PDF) . Проверено 15 декабря 2023 г.

[15] «Архитектура графического процессора NVIDIA A100 с тензорными ядрами: беспрецедентное ускорение в любом масштабе» (PDF) . Нвидиа . Проверено 18 сентября 2020 г.

[16] «Тензорные ядра NVIDIA: универсальность для высокопроизводительных вычислений и искусственного интеллекта» . NVIDIA .

[17] "Абстрактный" . docs.nvidia.com .

[anand_keynote-18] Катресс, Ян; Таллис, Билли (4 января 2016 г.). «CES 2017: Живой блог Nvidia Keynote» . АнандТех . Проверено 9 января 2017 г.

[19] «NVIDIA DRIVE Xavier, самая мощная в мире SoC, открывает потрясающие новые возможности искусственного интеллекта | Блог NVIDIA» . Официальный блог NVIDIA . 07.01.2018 . Проверено 3 ноября 2018 г.

[20] Смит, Райан (10 мая 2017 г.). «Представление NVIDIA Volta» . АнандТех . Проверено 2 июня 2017 г.

[21] «NVIDIA TITAN V превращает ПК в суперкомпьютер с искусственным интеллектом» .

[22] «Представляем NVIDIA TITAN V: самую мощную в мире видеокарту для ПК» .

[23] «NVIDIA заново изобретает рабочую станцию с помощью трассировки лучей в реальном времени» .

[:0-28] «Представляем NVIDIA TITAN V: самую мощную в мире видеокарту для ПК» . NVIDIA . Проверено 8 декабря 2017 г.

[29] «НВИДИА Квадро ГВ100» . Проверено 27 марта 2018 г.

[30] Смит, Райан. «NVIDIA представляет и раздает новую ограниченную серию Titan V 32 ГБ «CEO Edition» » . Проверено 6 июля 2018 г.

[31] «NVIDIA TITAN V CEO Edition» . TechPowerUp . Проверено 7 июля 2018 г.

[32] Шенкленд, Стивен (14 сентября 2015 г.). «IBM и Nvidia заключили сделку по созданию суперкомпьютера на 325 миллионов долларов» . CNET . Проверено 29 декабря 2015 г.

[33] Нойес, Кэтрин (16 марта 2015 г.). «IBM и Nvidia реализуют двигатели HPC для продвижения суперкомпьютеров следующего поколения» . Мир ПК . Проверено 29 декабря 2015 г.

[34] Смит, Райан (17 ноября 2014 г.). «Nvidia Volta и земельные контракты IBM Power9 на новые суперкомпьютеры для правительства США» . Анандтех . Проверено 14 марта 2017 г.

[:1-35] Лилли, Пол (25 января 2017 г.). «12-нм архитектура графического процессора NVIDIA FinFET Volta, как сообщается, заменит Pascal в 2017 году» . Горячее оборудование .

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

[15]

[16]

[17]

[18]

[19]

[20]

[21]

[22]

[23]

[а]

[б]

[с]

[д]

[24]

[25]

[26]

[27]

[28]

[29]

[30]

[31]