Jump to content

НВЛинк

НВЛинк
Производитель Нвидиа
Тип мульти- GPU и CPU Технология
Предшественник Масштабируемый интерфейс связи

NVLink — это проводной последовательный многоканальный канал связи ближнего радиуса действия, разработанный Nvidia . В отличие от PCI Express , устройство может состоять из нескольких NVLinks, и для связи устройства используют ячеистую сеть вместо центрального концентратора . Протокол был впервые анонсирован в марте 2014 года и использует запатентованное высокоскоростное сигнальное соединение (NVHS). [1]

Принцип [ править ]

NVLink — это протокол проводной связи для полупроводниковой связи ближнего радиуса действия, разработанный Nvidia , который можно использовать для передачи данных и управляющего кода в процессорных системах между центральными и графическими процессорами и исключительно между графическими процессорами. NVLink определяет соединение «точка-точка» со скоростью передачи данных 20, 25 и 50 Гбит/с (v1.0/v2.0/v3.0+ соответственно) на дифференциальную пару. Для NVLink 1.0 и 2.0 восемь дифференциальных пар образуют «подканал», а два «подканала», по одному для каждого направления, образуют «канал». Начиная с NVlink 3.0 только четыре дифференциальные пары образуют «подканал». Для NVLink 2.0 и выше общая скорость передачи данных по субканалу составляет 25 ГБ/с, а общая скорость передачи данных по каналу — 50 ГБ/с. Каждый графический процессор V100 поддерживает до шести каналов. Таким образом, каждый графический процессор способен поддерживать общую двунаправленную пропускную способность до 300 ГБ/с. [2] [3] Продукты NVLink, представленные на сегодняшний день, ориентированы на область высокопроизводительных приложений. Анонсированный 14 мая 2020 года, NVLink 3.0 увеличивает скорость передачи данных на дифференциальную пару с 25 Гбит/с до 50 Гбит/с, одновременно сокращая вдвое количество пар на NVLink с 8 до 4. Благодаря 12 каналам для графического процессора A100 на базе Ampere это дает общая пропускная способность до 600 ГБ/с. [4] Hopper имеет 18 каналов NVLink 4.0, обеспечивающих общую пропускную способность 900 ГБ/с. [5] Таким образом, NVLink 2.0, 3.0 и 4.0 имеют скорость 50 ГБ/с на двунаправленный канал и имеют 6, 12 и 18 каналов соответственно.

Производительность [ править ]

В следующей таблице показано сравнение основных показателей на основе стандартных спецификаций:

Межсоединение Передача
ставка
Код линии Эффективная скорость полезной нагрузки
за полосу
в каждом направлении
Макс. итого
длина полосы движения
(PCIe: включая 5 дюймов для печатных плат)
Реализовано в дизайне
PCIe 1.x 2,5 ГТ/с 8б/10б ~0,25 ГБ/с 20 дюймов = ~51 см
PCIe 2.x 5 ГТ/с 8б/10б ~0,5 ГБ/с 20 дюймов = ~51 см
PCIe 3.x 8 ГТ/с 128б/130б ~1 ГБ/с 20 дюймов = ~51 см [6] Паскаль ,
Время ,
Тьюринг
PCIe 4.0 16 ГТ/с 128б/130б ~2 ГБ/с 8–12 дюймов = ~ 20–30 см [6] Вернитесь к Ксавьеру
(8х, 4х, 1х),
Ампер ,
Мощность 9
PCIe 5.0 32 ГТ/с [7] 128б/130б ~4 ГБ/с Хоппер
PCIe 6.0 64 ГТ/с 1б/1б ~8 ГБ/с Блэквелл
НВЛинк 1.0 20 Гбит/с ~2,5 ГБ/с Паскаль ,
Мощность 8+
НВЛинк 2.0 25 Гбит/с ~3,125 ГБ/с Время ,
NVSwitch для Вольты
Мощность 9
НВЛинк 3.0 50 Гбит/с ~6,25 ГБ/с Ампер ,
NVSwitch для Ампера
НВЛинк 4.0
(также как C2C, чип-чип)
100 Гбит/с [8] ~12,5 ГБ/с Хоппер ,
Nvidia Grace Центр обработки данных/серверный процессор
NVSwitch для бункера
НВЛинк 5.0
(также как C2C, чип-чип)
200 Гбит/с ~25 ГБ/с Блэквелл ,
Nvidia Grace Центр обработки данных/серверный процессор
NVSwitch для Блэквелла

В следующей таблице показано сравнение соответствующих параметров шины для реальных полупроводников, которые предлагают NVLink в качестве одной из своих опций:

Полупроводник Борт/автобус
вариант поставки
Межсоединение Передача инфекции
технология
ставка (за полосу)
Дорожек на
дополнительная ссылка
(выход + вход)
Скорость передачи данных по субканалу
(по направлению данных)
Дополнительная ссылка
или единица
считать
Общая скорость передачи данных
(выход + вход)
Общий
переулки
(выход + вход)
Общий
скорость передачи данных
(выход + вход)
Нвидиа ГП100 П100 СХМ, [9]
P100 PCI-E [10]
PCIe 3.0 0 8 ГТ/с 16 + 16 128 Гбит/с = 16 ГБ/с 1 0 16 + 0 16 ГБ/с [11] 32 0 32 ГБ/с
Нвидиа ГВ100 В100 СХМ2, [12]
V100 PCI-E [13]
PCIe 3.0 0 8 ГТ/с 16 + 16 128 Гбит/с = 16 ГБ/с 1 0 16 + 0 16 ГБ/с 32 0 32 ГБ/с
Нвидиа ТУ104 GeForce RTX 2080 ,
Квадро RTX 5000
PCIe 3.0 0 8 ГТ/с 16 + 16 128 Гбит/с = 16 ГБ/с 1 0 16 + 0 16 ГБ/с 32 0 32 ГБ/с
Нвидиа ТУ102 видеокарта GeForce RTX 2080 Ti,
Квадро RTX 6000/8000
PCIe 3.0 0 8 ГТ/с 16 + 16 128 Гбит/с = 16 ГБ/с 1 0 16 + 0 16 ГБ/с 32 0 32 ГБ/с
Нвидиа Ксавьер [14] (общий) PCIe 4.0 Ⓓ
2 единицы: x8 (двойной)
1 единица: x4 (двойной)
3 единицы: x1 [15] [16]
16 ГТ/с
0 8 + 0 8
0 4 + 0 4
1 + 0 1 0

128 Гбит/с = 16 ГБ/с
64 Гбит/с = 0,8 ГБ/с
16 Гбит/с = 0,2 ГБ/с

2
1
3

0 32 + 0 32 ГБ/с
0 0 8 + 0 0 8 ГБ/с
0 0 6 + 0 0 6 ГБ/с
46 92 ГБ/с
IBM Power9 [17] (общий) PCIe 4.0 16 ГТ/с 16 + 16 256 Гбит/с = 32 ГБ/с 3 0 96 + 0 96 ГБ/с 96 192 ГБ/с
Нвидиа ГА100 [18] [19]

Нвидиа GA102 [20]

Ампер А100
(SXM4 и PCIe) [21]
PCIe 4.0 0 16 ГТ/с 16 + 16 256 Гбит/с = 32 ГБ/с 1 0 32 + 0 32 ГБ/с 32 0 64 ГБ/с
Нвидиа ГП100 П100 СХМ,
(недоступно для P100 PCI-E) [22]
НВЛинк 1.0 20 ГТ/с 0 8 + 0 8 160 Гбит/с = 20 ГБ/с 4 0 80 + 0 80 ГБ/с 64 160 ГБ/с
Нвидиа Ксавьер (общий) НВЛинк 1.0 [14] 20 ГТ/с [14] 0 8 + 0 8 160 Гбит/с = 20 ГБ/с [23]
IBM Power8+ (общий) НВЛинк 1.0 20 ГТ/с 0 8 + 0 8 160 Гбит/с = 20 ГБ/с 4 0 80 + 0 80 ГБ/с 64 160 ГБ/с
Нвидиа ГВ100 В100 СХМ2 [24]
(недоступно для V100 PCI-E)
НВЛинк 2.0 25 ГТ/с 0 8 + 0 8 200 Гбит/с = 25 ГБ/с 6 [25] 150 + 150 ГБ/с 96 300 ГБ/с
IBM Power9 [26] (общий) НВЛинк 2.0
(порты BlueLink)
25 ГТ/с 0 8 + 0 8 200 Гбит/с = 25 ГБ/с 6 150 + 150 ГБ/с 96 300 ГБ/с
НВСвитч
для Вольты [27]
(общий)
(полностью подключенный переключатель 18x18)
НВЛинк 2.0 25 ГТ/с 0 8 + 0 8 200 Гбит/с = 25 ГБ/с 2 * 8 + 2
= 18
450 + 450 ГБ/с 288 900 ГБ/с
Нвидиа ТУ104 GeForce RTX 2080 ,
Квадро RTX 5000 [28]
НВЛинк 2.0 25 ГТ/с 0 8 + 0 8 200 Гбит/с = 25 ГБ/с 1 0 25 + 0 25 ГБ/с 16 0 50 ГБ/с
Нвидиа ТУ102 видеокарта GeForce RTX 2080 Ti,
Квадро RTX 6000/8000 [28]
НВЛинк 2.0 25 ГТ/с 0 8 + 0 8 200 Гбит/с = 25 ГБ/с 2 0 50 + 0 50 ГБ/с 32 100 ГБ/с
Нвидиа ГА100 [18] [19] Ампер А100
(SXM4 и PCIe [21] )
НВЛинк 3.0 50 ГТ/с 0 4 + 0 4 200 Гбит/с = 25 ГБ/с 12 [29] 300 + 300 ГБ/с 96 600 ГБ/с
Нвидиа GA102 [20] видеокарта РТХ 3090
Квадро RTX A6000
НВЛинк 3.0 28,125 ГТ/с 0 4 + 0 4 112,5 Гбит/с = 14,0625 ГБ/с 4 56,25 + 56,25 ГБ/с 16 112,5 ГБ/с
НВСвитч
для Ампера [30]
(общий)
(полностью подключенный переключатель 18x18)
НВЛинк 3.0 50 ГТ/с 0 8 + 0 8 400 Гбит/с = 50 ГБ/с 2 * 8 + 2
= 18
900 + 900 ГБ/с 288 1800 ГБ/с
НВСвитч
для Хоппера [30]
(полностью подключенный 64-портовый коммутатор) НВЛинк 4.0 106,25 ГТ/с 0 9 + 0 9 450 Гбит/с 18 3600 + 3600 ГБ/с 128 7200 ГБ/с
Процессор NVIDIA Grace [31] Суперчип NVIDIA GH200 PCIe-5 (4x, 16x) @ 512 ГБ/с
Процессор NVIDIA Grace [32] Суперчип NVIDIA GH200 NVLink-C2C @ 900 ГБ/с
Графический процессор NVIDIA Hopper [33] Суперчип NVIDIA GH200 NVLink-C2C @ 900 ГБ/с
Графический процессор NVIDIA Hopper [34] Суперчип NVIDIA GH200 NVLink 4 (18x) @ 900 ГБ/с

Примечание . Столбцы скорости передачи данных были округлены путем аппроксимации скорости передачи данных, см. раздел о реальной производительности.

: значение выборки; Должно быть возможно объединение подканалов NVLink.
: значение выборки; другие доли использования линии PCIe должны быть возможны
: одна (№! 16) линия PCIe передает данные по дифференциальной паре.
: могут применяться различные ограничения на возможные комбинации из-за мультиплексирования выводов микросхемы и конструкции платы.
двойной : интерфейсный блок можно настроить как корневой концентратор или конечную точку.
общий : голый полупроводник без каких-либо ограничений, специфичных для конструкции платы.

Реальную производительность можно определить, применяя различные налоги на инкапсуляцию, а также скорость использования. Они поступают из разных источников:

Эти физические ограничения обычно снижают скорость передачи данных до 90–95 % от скорости передачи. Тесты NVLink показывают достижимую скорость передачи данных около 35,3 Гбит/с (от хоста к устройству) для соединения NVLink со скоростью 40 Гбит/с (2 подканала вверх) к графическому процессору P100 в системе, управляемой набором процессоров IBM Power8. . [35]

Использование со сменными платами [ править ]

Для различных версий сменных плат (существует пока небольшое количество высокопроизводительных игровых и профессиональных графических плат с графическими процессорами с этой функцией), которые имеют дополнительные разъемы для объединения их в группу NVLink, аналогичное количество слегка различающихся, относительно компактных Соединительные вилки на основе печатных плат существуют. Обычно только платы одного типа могут сопрягаться друг с другом из-за их физической и логической конструкции. В некоторых конфигурациях для достижения полной скорости передачи данных необходимо использовать два одинаковых разъема. На данный момент типичная вилка имеет U-образную форму с разъемом с мелкой сеткой на каждом из концов формы, обращенных от зрителя. Ширина вилки определяет, насколько далеко должны быть установлены сменные карты от основной платы хост-компьютерной системы. Расстояние для размещения карты обычно определяется соответствующим вилкой (известная доступная ширина вилки составляет 3 до 5 слотов, а также зависит от типа платы). [36] [37] Межсоединение с 2004 года часто называют масштабируемым интерфейсом связи (SLI) из-за его структурного дизайна и внешнего вида, даже если современный дизайн на основе NVLink имеет совершенно иную техническую природу с другими функциями на базовых уровнях по сравнению с предыдущим дизайном. Заявленные устройства из реального мира: [38]

  • Quadro GP100 (пара карт будет использовать до двух мостов; [39] установка реализует 2 или 4 соединения NVLink со скоростью до 160 ГБ/с. [40] - это может напоминать NVLink 1.0 с 20 ГТ/с)
  • Quadro GV100 (паре карт потребуется до 2 мостов и реализовать скорость до 200 ГБ/с) [36] - это может напоминать NVLink 2.0 с 25 ГТ/с и 4 каналами)
  • GeForce RTX 2080 на базе TU104 (с одинарным мостом «GeForce RTX NVLink-Bridge» [41] )
  • GeForce RTX 2080 Ti на базе TU102 (с одинарным мостом «GeForce RTX NVLink-Bridge» [37] )
  • Квадро RTX 5000 [42] на базе ТУ104 [43] (с одинарным мостом «NVLink» до 50 ГБ/с [44] - это может напоминать NVLink 2.0 с 25 ГТ/с и 1 каналом)
  • Квадро RTX 6000 [42] на базе ТУ102 [43] (с одинарным мостом «NVLink HB» до 100 ГБ/с [44] - это может напоминать NVLink 2.0 с 25 ГТ/с и 2 каналами)
  • Квадро RTX 8000 [42] на базе ТУ102 [45] (с одинарным мостом «NVLink HB» до 100 ГБ/с [44] - это может напоминать NVLink 2.0 с 25 ГТ/с и 2 каналами)

Сервисное программное обеспечение и программирование [ править ]

Для линеек продуктов Tesla, Quadro и Grid NVML-API (Nvidia Management Library API) предлагает набор функций для программного управления некоторыми аспектами межсоединений NVLink в системах Windows и Linux, таких как оценка и версии компонентов, а также статус/ошибка. запросы и мониторинг производительности. [46] Кроме того, благодаря предоставлению библиотеки NCCL (Nvidia Collective Communications Library) разработчики в публичном пространстве получат возможность реализовать, например, мощные реализации искусственного интеллекта и аналогичные темы, требующие больших вычислений, на базе NVLink. [47] Страница «Настройки 3D» » «Настройка SLI, Surround, PhysX» на панели управления Nvidia и пример приложения CUDA «simpleP2P» используют такие API для реализации своих сервисов в отношении функций NVLink. На платформе Linux приложение командной строки с подкомандой «nvidia-smi nvlink» предоставляет аналогичный набор расширенной информации и управления. [38]

История [ править ]

5 апреля 2016 года Nvidia объявила, что NVLink будет реализован в графическом процессоре GP100 на базе микроархитектуры Pascal , который используется, например, в продуктах Nvidia Tesla P100. [48] С появлением высокопроизводительной компьютерной базы DGX-1 стало возможным иметь до восьми модулей P100 в одной стойке, подключенных к двум главным процессорам. Несущая плата (...) позволяет использовать специальную плату для маршрутизации соединений NVLink — для каждого P100 требуется 800 контактов, 400 для питания PCIe + и еще 400 для NVLinks, что в сумме составляет почти 1600 трассировок платы только для NVLink (. ..). [49] Каждый ЦП имеет прямое соединение с 4 модулями P100 через PCIe, и каждый P100 имеет по одному NVLink с тремя другими P100 в той же группе ЦП, а также еще один NVLink с одним P100 в другой группе ЦП. Каждый NVLink (интерфейс канала) обеспечивает двунаправленную скорость 20 ГБ/с вверх и 20 ГБ/с вниз, с 4 каналами на каждый графический процессор GP100, что обеспечивает совокупную пропускную способность 80 ГБ/с вверх и еще 80 ГБ/с вниз. [50] NVLink поддерживает маршрутизацию, так что в конструкции DGX-1 для каждого P100 в общей сложности 4 из других 7 P100 доступны напрямую, а остальные 3 доступны только с помощью одного перехода. Согласно описаниям в публикациях в блоге Nvidia, с 2014 года NVLink позволяет объединять отдельные каналы для повышения производительности «точка-точка», так что, например, конструкция с двумя P100 и всеми соединениями, установленными между двумя устройствами, обеспечит полную пропускную способность NVLink в 80 ГБ. /с между ними. [51]

На GTC2017 компания Nvidia представила поколение графических процессоров Volta и указала на интеграцию обновленной версии 2.0 NVLink, которая обеспечит общую скорость передачи данных ввода-вывода 300 ГБ/с для одного чипа этой конструкции, а также объявила о возможности предварительной -заказы с обещанием поставки в третьем квартале 2017 г. высокопроизводительных компьютеров DGX-1 и DGX-Station, которые будут оснащены модулями графического процессора типа V100 и имеют NVLink 2.0, реализованный либо в сети (две группы по четыре модуля V100 с межсетевым -групповое подключение) или полностью взаимосвязанное соединение одной группы из четырех модулей V100.

В 2017-2018 годах IBM и Nvidia поставили суперкомпьютеры Summit и Sierra для Министерства энергетики США. [52] которые сочетают в себе семейство процессоров IBM POWER9 и архитектуру Nvidia Volta , используя NVLink 2.0 для соединений CPU-GPU и GPU-GPU и InfiniBand EDR для системных соединений. [53]

В 2020 году Nvidia объявила, что больше не будет добавлять новые профили драйверов SLI для серии RTX 2000 и старше с 1 января 2021 года. [54]

См. также [ править ]

Ссылки [ править ]

  1. ^ Nvidia NVLINK 2.0 появится на серверах IBM в следующем году, автор Джон Уоррел на fudzilla.com, 24 августа 2016 г.
  2. ^ «NVIDIA DGX-1 с системной архитектурой Tesla V100» (PDF) .
  3. ^ «Что такое NVLink?» . Нвидиа. 14 ноября 2014 г.
  4. ^ Райан Смит (14 мая 2020 г.). «NVIDIA Ampere Unleashed: NVIDIA анонсирует новую архитектуру графического процессора, графический процессор A100 и ускоритель» . АнандТех.
  5. ^ Джейкобс, Блэр (23 марта 2022 г.). «Nvidia представляет архитектуру графического процессора Hopper следующего поколения» . Клуб386 . Проверено 4 мая 2022 г.
  6. Перейти обратно: Перейти обратно: а б «PCIe — PCI Express (1.1/2.0/3.0/4.0/5.0)» . www.elektronik-kompendium.de .
  7. ^ Январь 2019 г., Пол Алкорн 17 (17 января 2019 г.). «PCIe 5.0 готов к использованию в прайм-тайм» . Аппаратное обеспечение Тома . {{cite web}}: CS1 maint: числовые имена: список авторов ( ссылка )
  8. ^ «Сетевой коммутатор NVLink — чип переключателя NVIDIA для SuperPOD с высокой пропускной способностью» (PDF) . ХотЧипс 34 . 23 августа 2022 г.
  9. ^ онлайн, хайз. «NVIDIA Tesla P100 [SXM2], 16 ГБ HBM2 (NVTP100-SXM) | онлайн-сравнение цен heise / Германия» . geizhals.de .
  10. ^ онлайн, Хайзе (14 августа 2023 г.). «PNY Tesla P100 [PCIe], 16 ГБ HBM2 (TCSP100M-16GB-PB/NVTP100-16) от 4990,00 евро (2020 г.) | онлайн-сравнение цен Heise / Германия» . geizhals.de .
  11. ^ NVLink выводит ускорение графического процессора на новый уровень Тимоти Прикетт Морган на nextplatform.com, 4 мая 2016 г.
  12. ^ «Характеристики NVIDIA Tesla V100 SXM2, 16 ГБ» . TechPowerUp . 14 августа 2023 г.
  13. ^ онлайн, Хайзе (14 августа 2023 г.). «PNY Quadro GV100, 32 ГБ HBM2, 4x DP (VCQGV100-PB) от 10199,00 евро (2020 г.) | Онлайн-сравнение цен Heise / Германия» . geizhals.de .
  14. Перейти обратно: Перейти обратно: а б с Tegra Xavier — Nvidia на wikichip.org
  15. ^ РУКОВОДСТВО ПО АДАПТАЦИИ И ВНЕДРЕНИЮ ПЛАТФОРМЫ JETSON AGX XAVIER «Функции контроллера Tegra194 PCIe» на странице 14; хранится на сайтеarrow.com.
  16. ^ Как включить слот PCIe x2 в Xavier? на devtalk.nvidia.com
  17. ^ Презентация вебинара POWER9 от IBM для Power Systems VUG , Джефф Стючели, 26 января 2017 г.
  18. Перейти обратно: Перейти обратно: а б Морган, Тимоти Прикетт (14 мая 2020 г.). «Nvidia объединяет вычисления искусственного интеллекта с графическим процессором Ampere» . Следующая платформа .
  19. Перейти обратно: Перейти обратно: а б «Технический паспорт» (PDF) . www.nvidia.com . Проверено 15 сентября 2020 г.
  20. Перейти обратно: Перейти обратно: а б «Информационный документ по архитектуре графического процессора NVIDIA Ampere GA102» (PDF) . nvidia.com . Проверено 2 мая 2023 г.
  21. Перейти обратно: Перейти обратно: а б «Тензорный графический процессор» (PDF) . nvidia.com . Проверено 2 мая 2023 г.
  22. Все на шине PCIe для суперкомпьютера Nvidia Tesla P100, Крис Уильямс, на theregister.co.uk, 20 июня 2016 г.
  23. ^ Хикок, Гэри (13 ноября 2018 г.). «NVIDIA Xavier достигает важной вехи в области безопасного самостоятельного вождения | Блог NVIDIA» . Официальный блог NVIDIA .
  24. ^ онлайн, Хайзе (22 июня 2017 г.). «Nvidia Tesla V100: анонсирована карта PCIe с графическим чипом Volta и 16 ГБ памяти» . Хайз онлайн .
  25. ^ Блок-схема GV100 в статье «GTC17: NVIDIA представляет следующую архитектуру графического процессора Volta — Tesla V100 с 5120 шейдерными блоками и 16 ГБ HBM2», Андреас Шиллинг на hardwareluxx.de, 10 мая 2017 г.
  26. ^ Чип графического процессора NVIDIA Volta GV100 для суперкомпьютера Summit, в два раза быстрее, чем Pascal P100 - предполагается, что он достигнет 9,5 терафлопс при вычислениях FP64, Хасан Муджтаба на wccftech.com, 20 декабря 2016 г.
  27. ^ «Технический обзор» (PDF) . images.nvidia.com . Проверено 15 сентября 2020 г.
  28. Перейти обратно: Перейти обратно: а б Анджелини, Крис (14 сентября 2018 г.). «Исследование архитектуры Тьюринга от Nvidia: внутри GeForce RTX 2080» . Аппаратное обеспечение Тома . п. 7 . Проверено 28 февраля 2019 г. TU102 и TU104 — первые графические процессоры Nvidia для настольных ПК, использующие межсоединение NVLink, а не интерфейс с несколькими входами/выходами (MIO) для поддержки SLI. Первый делает доступными два канала x8, а второй ограничивается одним. Каждый канал обеспечивает двунаправленную пропускную способность до 50 ГБ/с. Итак, GeForce RTX 2080 Ti способна обеспечить скорость до 100 ГБ/с между картами, а RTX 2080 — половину этого показателя.
  29. ^ Шиллинг, Андреас (22 июня 2020 г.). «A100 PCIe: графический процессор NVIDIA GA100 также доступен в виде варианта PCI Express» . Аппаратное обеспечениеluxx . Проверено 2 мая 2023 г.
  30. Перейти обратно: Перейти обратно: а б «НВЛИНК И НВСВИТЧ» . www.nvidia.com . Проверено 7 февраля 2021 г.
  31. ^ «Большая память Nvidia GH200 рядом с вашим столом: ближе, чем вы думаете» . 23 февраля 2024 г.
  32. ^ «Большая память Nvidia GH200 рядом с вашим столом: ближе, чем вы думаете» . 23 февраля 2024 г.
  33. ^ «Большая память Nvidia GH200 рядом с вашим столом: ближе, чем вы думаете» . 23 февраля 2024 г.
  34. ^ «Большая память Nvidia GH200 рядом с вашим столом: ближе, чем вы думаете» . 23 февраля 2024 г.
  35. ^ Сравнение NVLink и PCI-E с графическими процессорами NVIDIA Tesla P100 на серверах OpenPOWER , Элиот Эшельман на microway.com, 26 января 2017 г.
  36. Перейти обратно: Перейти обратно: а б «Высокоскоростное соединение графических процессоров NVIDIA Quadro NVLink» . NVIDIA .
  37. Перейти обратно: Перейти обратно: а б «Изобретение графики заново: видеокарта NVIDIA GeForce RTX 2080 Ti» . NVIDIA .
  38. Перейти обратно: Перейти обратно: а б «NVLink на NVIDIA GeForce RTX 2080 и 2080 Ti в Windows 10» . Пьюджет Системс . 5 октября 2018 г.
  39. ^ [1] [ мертвая ссылка ]
  40. ^ Шиллинг, Андреас (5 февраля 2017 г.). «NVIDIA представляет Quadro GP100 с графическим процессором GP100 и 16 ГБ HBM2» . Аппаратное обеспечениеluxx .
  41. ^ «Видеокарта NVIDIA GeForce RTX 2080 Founders Edition» . NVIDIA .
  42. Перейти обратно: Перейти обратно: а б с «Видеокарты NVIDIA Quadro для рабочих станций профессионального дизайна» . NVIDIA .
  43. Перейти обратно: Перейти обратно: а б «NVIDIA Quadro RTX 6000 и RTX 5000 готовы к предварительному заказу» . 1 октября 2018 г.
  44. Перейти обратно: Перейти обратно: а б с «НВЛинк | pny.com» . www.pny.com .
  45. ^ «Характеристики NVIDIA Quadro RTX 8000» . TechPowerUp . 14 августа 2023 г.
  46. ^ «Методы NvLink» . docs.nvidia.com .
  47. ^ «Библиотека коллективных коммуникаций NVIDIA (NCCL)» . Разработчик NVIDIA . 10 мая 2017 г.
  48. ^ «Внутри Паскаля: новейшая вычислительная платформа NVIDIA» . 05.04.2016.
  49. ^ Anandtech.com
  50. ^ NVIDIA представляет сервер HPC DGX-1: 8 Tesla, 3U, второй квартал 2016 г. , anandtech.com, апрель 2016 г.
  51. ^ Как NVLink обеспечит более быстрые и простые вычисления на нескольких графических процессорах, Марк Харрис, 14 ноября 2014 г.
  52. ^ «Информационный документ: Суперкомпьютеры Summit и Sierra» (PDF) . 01.11.2014.
  53. ^ «Nvidia Volta и IBM POWER9 заключают земельные контракты на новые суперкомпьютеры для правительства США» . АнандТех . 17 ноября 2014 г.
  54. ^ «RIP: Nvidia забивает последний гвоздь в гроб SLI: после 2020 года новых профилей не будет» . Мир ПК . 18 сентября 2020 г.
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 47d501de09717bd55d08b8c1fc126ad1__1717734000
URL1:https://arc.ask3.ru/arc/aa/47/d1/47d501de09717bd55d08b8c1fc126ad1.html
Заголовок, (Title) документа по адресу, URL1:
NVLink - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)