НВЛинк
![]() | |
Производитель | Нвидиа |
---|---|
Тип | мульти- GPU и CPU Технология |
Предшественник | Масштабируемый интерфейс связи |
NVLink — это проводной последовательный многоканальный канал связи ближнего радиуса действия, разработанный Nvidia . В отличие от PCI Express , устройство может состоять из нескольких NVLinks, и для связи устройства используют ячеистую сеть вместо центрального концентратора . Протокол был впервые анонсирован в марте 2014 года и использует запатентованное высокоскоростное сигнальное соединение (NVHS). [1]
Принцип [ править ]
NVLink — это протокол проводной связи для полупроводниковой связи ближнего радиуса действия, разработанный Nvidia , который можно использовать для передачи данных и управляющего кода в процессорных системах между центральными и графическими процессорами и исключительно между графическими процессорами. NVLink определяет соединение «точка-точка» со скоростью передачи данных 20, 25 и 50 Гбит/с (v1.0/v2.0/v3.0+ соответственно) на дифференциальную пару. Для NVLink 1.0 и 2.0 восемь дифференциальных пар образуют «подканал», а два «подканала», по одному для каждого направления, образуют «канал». Начиная с NVlink 3.0 только четыре дифференциальные пары образуют «подканал». Для NVLink 2.0 и выше общая скорость передачи данных по субканалу составляет 25 ГБ/с, а общая скорость передачи данных по каналу — 50 ГБ/с. Каждый графический процессор V100 поддерживает до шести каналов. Таким образом, каждый графический процессор способен поддерживать общую двунаправленную пропускную способность до 300 ГБ/с. [2] [3] Продукты NVLink, представленные на сегодняшний день, ориентированы на область высокопроизводительных приложений. Анонсированный 14 мая 2020 года, NVLink 3.0 увеличивает скорость передачи данных на дифференциальную пару с 25 Гбит/с до 50 Гбит/с, одновременно сокращая вдвое количество пар на NVLink с 8 до 4. Благодаря 12 каналам для графического процессора A100 на базе Ampere это дает общая пропускная способность до 600 ГБ/с. [4] Hopper имеет 18 каналов NVLink 4.0, обеспечивающих общую пропускную способность 900 ГБ/с. [5] Таким образом, NVLink 2.0, 3.0 и 4.0 имеют скорость 50 ГБ/с на двунаправленный канал и имеют 6, 12 и 18 каналов соответственно.
Производительность [ править ]
В следующей таблице показано сравнение основных показателей на основе стандартных спецификаций:
Межсоединение | Передача ставка | Код линии | Эффективная скорость полезной нагрузки за полосу в каждом направлении | Макс. итого длина полосы движения (PCIe: включая 5 дюймов для печатных плат) | Реализовано в дизайне |
---|---|---|---|---|---|
PCIe 1.x | 2,5 ГТ/с | 8б/10б | ~0,25 ГБ/с | 20 дюймов = ~51 см | |
PCIe 2.x | 5 ГТ/с | 8б/10б | ~0,5 ГБ/с | 20 дюймов = ~51 см | |
PCIe 3.x | 8 ГТ/с | 128б/130б | ~1 ГБ/с | 20 дюймов = ~51 см [6] | Паскаль , Время , Тьюринг |
PCIe 4.0 | 16 ГТ/с | 128б/130б | ~2 ГБ/с | 8–12 дюймов = ~ 20–30 см [6] | Вернитесь к Ксавьеру (8х, 4х, 1х), Ампер , Мощность 9 |
PCIe 5.0 | 32 ГТ/с [7] | 128б/130б | ~4 ГБ/с | Хоппер | |
PCIe 6.0 | 64 ГТ/с | 1б/1б | ~8 ГБ/с | Блэквелл | |
НВЛинк 1.0 | 20 Гбит/с | ~2,5 ГБ/с | Паскаль , Мощность 8+ | ||
НВЛинк 2.0 | 25 Гбит/с | ~3,125 ГБ/с | Время , NVSwitch для Вольты Мощность 9 | ||
НВЛинк 3.0 | 50 Гбит/с | ~6,25 ГБ/с | Ампер , NVSwitch для Ампера | ||
НВЛинк 4.0 (также как C2C, чип-чип) | 100 Гбит/с [8] | ~12,5 ГБ/с | Хоппер , Nvidia Grace Центр обработки данных/серверный процессор NVSwitch для бункера | ||
НВЛинк 5.0 (также как C2C, чип-чип) | 200 Гбит/с | ~25 ГБ/с | Блэквелл , Nvidia Grace Центр обработки данных/серверный процессор NVSwitch для Блэквелла |
В следующей таблице показано сравнение соответствующих параметров шины для реальных полупроводников, которые предлагают NVLink в качестве одной из своих опций:
Полупроводник | Борт/автобус вариант поставки | Межсоединение | Передача инфекции технология ставка (за полосу) | Дорожек на дополнительная ссылка (выход + вход) | Скорость передачи данных по субканалу (по направлению данных) | Дополнительная ссылка или единица считать | Общая скорость передачи данных (выход + вход) | Общий переулки (выход + вход) | Общий скорость передачи данных (выход + вход) |
---|---|---|---|---|---|---|---|---|---|
Нвидиа ГП100 | П100 СХМ, [9] P100 PCI-E [10] | PCIe 3.0 | ГТ/с | 816 + 16 Ⓑ | 128 Гбит/с = 16 ГБ/с | 1 | [11] | 16 + 16 ГБ/с32 Ⓒ | 32 ГБ/с |
Нвидиа ГВ100 | В100 СХМ2, [12] V100 PCI-E [13] | PCIe 3.0 | ГТ/с | 816 + 16 Ⓑ | 128 Гбит/с = 16 ГБ/с | 1 | 16 + 16 ГБ/с | 32 Ⓒ | 32 ГБ/с |
Нвидиа ТУ104 | GeForce RTX 2080 , Квадро RTX 5000 | PCIe 3.0 | ГТ/с | 816 + 16 Ⓑ | 128 Гбит/с = 16 ГБ/с | 1 | 16 + 16 ГБ/с | 32 Ⓒ | 32 ГБ/с |
Нвидиа ТУ102 | видеокарта GeForce RTX 2080 Ti, Квадро RTX 6000/8000 | PCIe 3.0 | ГТ/с | 816 + 16 Ⓑ | 128 Гбит/с = 16 ГБ/с | 1 | 16 + 16 ГБ/с | 32 Ⓒ | 32 ГБ/с |
Нвидиа Ксавьер [14] | (общий) | PCIe 4.0 Ⓓ 2 единицы: x8 (двойной) 1 единица: x4 (двойной) 3 единицы: x1 [15] [16] | 16 ГТ/с | 8 + 8 Ⓑ 4 + 4 Ⓑ 1 + 1 | 128 Гбит/с = 16 ГБ/с 64 Гбит/с = ГБ/с 16 Гбит/с = ГБ/с | Ⓓ 2 1 3 | Ⓓ 32 + 32 ГБ/с 8 + 8 ГБ/с 6 + 6 ГБ/с | 46 Ⓑ | 92 ГБ/с |
IBM Power9 [17] | (общий) | PCIe 4.0 | 16 ГТ/с | 16 + 16 Ⓑ | 256 Гбит/с = 32 ГБ/с | 3 | 96 + 96 ГБ/с | 96 | 192 ГБ/с |
Нвидиа ГА100 [18] [19] Нвидиа GA102 [20] | Ампер А100 (SXM4 и PCIe) [21] | PCIe 4.0 | 16 ГТ/с | 16 + 16 Ⓑ | 256 Гбит/с = 32 ГБ/с | 1 | 32 + 32 ГБ/с | 32 Ⓒ | 64 ГБ/с |
Нвидиа ГП100 | П100 СХМ, (недоступно для P100 PCI-E) [22] | НВЛинк 1.0 | 20 ГТ/с | 8 + 8 Ⓐ | 160 Гбит/с = 20 ГБ/с | 4 | 80 + 80 ГБ/с | 64 | 160 ГБ/с |
Нвидиа Ксавьер | (общий) | НВЛинк 1.0 [14] | 20 ГТ/с [14] | 8 + 8 Ⓐ | 160 Гбит/с = 20 ГБ/с [23] | ||||
IBM Power8+ | (общий) | НВЛинк 1.0 | 20 ГТ/с | 8 + 8 Ⓐ | 160 Гбит/с = 20 ГБ/с | 4 | 80 + 80 ГБ/с | 64 | 160 ГБ/с |
Нвидиа ГВ100 | В100 СХМ2 [24] (недоступно для V100 PCI-E) | НВЛинк 2.0 | 25 ГТ/с | 8 + 8 Ⓐ | 200 Гбит/с = 25 ГБ/с | 6 [25] | 150 + 150 ГБ/с | 96 | 300 ГБ/с |
IBM Power9 [26] | (общий) | НВЛинк 2.0 (порты BlueLink) | 25 ГТ/с | 8 + 8 Ⓐ | 200 Гбит/с = 25 ГБ/с | 6 | 150 + 150 ГБ/с | 96 | 300 ГБ/с |
НВСвитч для Вольты [27] | (общий) (полностью подключенный переключатель 18x18) | НВЛинк 2.0 | 25 ГТ/с | 8 + 8 Ⓐ | 200 Гбит/с = 25 ГБ/с | 2 * 8 + 2 = 18 | 450 + 450 ГБ/с | 288 | 900 ГБ/с |
Нвидиа ТУ104 | GeForce RTX 2080 , Квадро RTX 5000 [28] | НВЛинк 2.0 | 25 ГТ/с | 8 + 8 Ⓐ | 200 Гбит/с = 25 ГБ/с | 1 | 25 + 25 ГБ/с | 16 | 50 ГБ/с |
Нвидиа ТУ102 | видеокарта GeForce RTX 2080 Ti, Квадро RTX 6000/8000 [28] | НВЛинк 2.0 | 25 ГТ/с | 8 + 8 Ⓐ | 200 Гбит/с = 25 ГБ/с | 2 | 50 + 50 ГБ/с | 32 | 100 ГБ/с |
Нвидиа ГА100 [18] [19] | Ампер А100 (SXM4 и PCIe [21] ) | НВЛинк 3.0 | 50 ГТ/с | 4 + 4 Ⓐ | 200 Гбит/с = 25 ГБ/с | 12 [29] | 300 + 300 ГБ/с | 96 | 600 ГБ/с |
Нвидиа GA102 [20] | видеокарта РТХ 3090 Квадро RTX A6000 | НВЛинк 3.0 | 28,125 ГТ/с | 4 + 4 Ⓐ | 112,5 Гбит/с = 14,0625 ГБ/с | 4 | 56,25 + 56,25 ГБ/с | 16 | 112,5 ГБ/с |
НВСвитч для Ампера [30] | (общий) (полностью подключенный переключатель 18x18) | НВЛинк 3.0 | 50 ГТ/с | 8 + 8 Ⓐ | 400 Гбит/с = 50 ГБ/с | 2 * 8 + 2 = 18 | 900 + 900 ГБ/с | 288 | 1800 ГБ/с |
НВСвитч для Хоппера [30] | (полностью подключенный 64-портовый коммутатор) | НВЛинк 4.0 | 106,25 ГТ/с | 9 + 9 Ⓐ | 450 Гбит/с | 18 | 3600 + 3600 ГБ/с | 128 | 7200 ГБ/с |
Процессор NVIDIA Grace [31] | Суперчип NVIDIA GH200 | PCIe-5 (4x, 16x) @ 512 ГБ/с | |||||||
Процессор NVIDIA Grace [32] | Суперчип NVIDIA GH200 | NVLink-C2C @ 900 ГБ/с | |||||||
Графический процессор NVIDIA Hopper [33] | Суперчип NVIDIA GH200 | NVLink-C2C @ 900 ГБ/с | |||||||
Графический процессор NVIDIA Hopper [34] | Суперчип NVIDIA GH200 | NVLink 4 (18x) @ 900 ГБ/с |
Примечание . Столбцы скорости передачи данных были округлены путем аппроксимации скорости передачи данных, см. раздел о реальной производительности.
- Ⓐ : значение выборки; Должно быть возможно объединение подканалов NVLink.
- Ⓑ : значение выборки; другие доли использования линии PCIe должны быть возможны
- Ⓒ : одна (№! 16) линия PCIe передает данные по дифференциальной паре.
- Ⓓ : могут применяться различные ограничения на возможные комбинации из-за мультиплексирования выводов микросхемы и конструкции платы.
- двойной : интерфейсный блок можно настроить как корневой концентратор или конечную точку.
- общий : голый полупроводник без каких-либо ограничений, специфичных для конструкции платы.
Реальную производительность можно определить, применяя различные налоги на инкапсуляцию, а также скорость использования. Они поступают из разных источников:
- 128b/130b Линейный код (см., например, передачу данных PCI Express для версий 3.0 и выше)
- Ссылка на управляющие символы
- Заголовок транзакции
- Возможности буферизации (зависит от устройства)
- Использование DMA на стороне компьютера (зависит от другого программного обеспечения, обычно незначительно в тестах)
Эти физические ограничения обычно снижают скорость передачи данных до 90–95 % от скорости передачи. Тесты NVLink показывают достижимую скорость передачи данных около 35,3 Гбит/с (от хоста к устройству) для соединения NVLink со скоростью 40 Гбит/с (2 подканала вверх) к графическому процессору P100 в системе, управляемой набором процессоров IBM Power8. . [35]
Использование со сменными платами [ править ]
Для различных версий сменных плат (существует пока небольшое количество высокопроизводительных игровых и профессиональных графических плат с графическими процессорами с этой функцией), которые имеют дополнительные разъемы для объединения их в группу NVLink, аналогичное количество слегка различающихся, относительно компактных Соединительные вилки на основе печатных плат существуют. Обычно только платы одного типа могут сопрягаться друг с другом из-за их физической и логической конструкции. В некоторых конфигурациях для достижения полной скорости передачи данных необходимо использовать два одинаковых разъема. На данный момент типичная вилка имеет U-образную форму с разъемом с мелкой сеткой на каждом из концов формы, обращенных от зрителя. Ширина вилки определяет, насколько далеко должны быть установлены сменные карты от основной платы хост-компьютерной системы. Расстояние для размещения карты обычно определяется соответствующим вилкой (известная доступная ширина вилки составляет 3 до 5 слотов, а также зависит от типа платы). [36] [37] Межсоединение с 2004 года часто называют масштабируемым интерфейсом связи (SLI) из-за его структурного дизайна и внешнего вида, даже если современный дизайн на основе NVLink имеет совершенно иную техническую природу с другими функциями на базовых уровнях по сравнению с предыдущим дизайном. Заявленные устройства из реального мира: [38]
- Quadro GP100 (пара карт будет использовать до двух мостов; [39] установка реализует 2 или 4 соединения NVLink со скоростью до 160 ГБ/с. [40] - это может напоминать NVLink 1.0 с 20 ГТ/с)
- Quadro GV100 (паре карт потребуется до 2 мостов и реализовать скорость до 200 ГБ/с) [36] - это может напоминать NVLink 2.0 с 25 ГТ/с и 4 каналами)
- GeForce RTX 2080 на базе TU104 (с одинарным мостом «GeForce RTX NVLink-Bridge» [41] )
- GeForce RTX 2080 Ti на базе TU102 (с одинарным мостом «GeForce RTX NVLink-Bridge» [37] )
- Квадро RTX 5000 [42] на базе ТУ104 [43] (с одинарным мостом «NVLink» до 50 ГБ/с [44] - это может напоминать NVLink 2.0 с 25 ГТ/с и 1 каналом)
- Квадро RTX 6000 [42] на базе ТУ102 [43] (с одинарным мостом «NVLink HB» до 100 ГБ/с [44] - это может напоминать NVLink 2.0 с 25 ГТ/с и 2 каналами)
- Квадро RTX 8000 [42] на базе ТУ102 [45] (с одинарным мостом «NVLink HB» до 100 ГБ/с [44] - это может напоминать NVLink 2.0 с 25 ГТ/с и 2 каналами)
Сервисное программное обеспечение и программирование [ править ]
Для линеек продуктов Tesla, Quadro и Grid NVML-API (Nvidia Management Library API) предлагает набор функций для программного управления некоторыми аспектами межсоединений NVLink в системах Windows и Linux, таких как оценка и версии компонентов, а также статус/ошибка. запросы и мониторинг производительности. [46] Кроме того, благодаря предоставлению библиотеки NCCL (Nvidia Collective Communications Library) разработчики в публичном пространстве получат возможность реализовать, например, мощные реализации искусственного интеллекта и аналогичные темы, требующие больших вычислений, на базе NVLink. [47] Страница «Настройки 3D» » «Настройка SLI, Surround, PhysX» на панели управления Nvidia и пример приложения CUDA «simpleP2P» используют такие API для реализации своих сервисов в отношении функций NVLink. На платформе Linux приложение командной строки с подкомандой «nvidia-smi nvlink» предоставляет аналогичный набор расширенной информации и управления. [38]
История [ править ]
5 апреля 2016 года Nvidia объявила, что NVLink будет реализован в графическом процессоре GP100 на базе микроархитектуры Pascal , который используется, например, в продуктах Nvidia Tesla P100. [48] С появлением высокопроизводительной компьютерной базы DGX-1 стало возможным иметь до восьми модулей P100 в одной стойке, подключенных к двум главным процессорам. Несущая плата (...) позволяет использовать специальную плату для маршрутизации соединений NVLink — для каждого P100 требуется 800 контактов, 400 для питания PCIe + и еще 400 для NVLinks, что в сумме составляет почти 1600 трассировок платы только для NVLink (. ..). [49] Каждый ЦП имеет прямое соединение с 4 модулями P100 через PCIe, и каждый P100 имеет по одному NVLink с тремя другими P100 в той же группе ЦП, а также еще один NVLink с одним P100 в другой группе ЦП. Каждый NVLink (интерфейс канала) обеспечивает двунаправленную скорость 20 ГБ/с вверх и 20 ГБ/с вниз, с 4 каналами на каждый графический процессор GP100, что обеспечивает совокупную пропускную способность 80 ГБ/с вверх и еще 80 ГБ/с вниз. [50] NVLink поддерживает маршрутизацию, так что в конструкции DGX-1 для каждого P100 в общей сложности 4 из других 7 P100 доступны напрямую, а остальные 3 доступны только с помощью одного перехода. Согласно описаниям в публикациях в блоге Nvidia, с 2014 года NVLink позволяет объединять отдельные каналы для повышения производительности «точка-точка», так что, например, конструкция с двумя P100 и всеми соединениями, установленными между двумя устройствами, обеспечит полную пропускную способность NVLink в 80 ГБ. /с между ними. [51]
На GTC2017 компания Nvidia представила поколение графических процессоров Volta и указала на интеграцию обновленной версии 2.0 NVLink, которая обеспечит общую скорость передачи данных ввода-вывода 300 ГБ/с для одного чипа этой конструкции, а также объявила о возможности предварительной -заказы с обещанием поставки в третьем квартале 2017 г. высокопроизводительных компьютеров DGX-1 и DGX-Station, которые будут оснащены модулями графического процессора типа V100 и имеют NVLink 2.0, реализованный либо в сети (две группы по четыре модуля V100 с межсетевым -групповое подключение) или полностью взаимосвязанное соединение одной группы из четырех модулей V100.
В 2017-2018 годах IBM и Nvidia поставили суперкомпьютеры Summit и Sierra для Министерства энергетики США. [52] которые сочетают в себе семейство процессоров IBM POWER9 и архитектуру Nvidia Volta , используя NVLink 2.0 для соединений CPU-GPU и GPU-GPU и InfiniBand EDR для системных соединений. [53]
В 2020 году Nvidia объявила, что больше не будет добавлять новые профили драйверов SLI для серии RTX 2000 и старше с 1 января 2021 года. [54]
См. также [ править ]
- Межблочное соединение Intel QuickPath
- ГиперТранспорт
- Интерфейс передачи сообщений
- ИНК (операционная система)
- Вычислительный узел Linux
- Intel Xe-ссылка
Ссылки [ править ]
- ^ Nvidia NVLINK 2.0 появится на серверах IBM в следующем году, автор Джон Уоррел на fudzilla.com, 24 августа 2016 г.
- ^ «NVIDIA DGX-1 с системной архитектурой Tesla V100» (PDF) .
- ^ «Что такое NVLink?» . Нвидиа. 14 ноября 2014 г.
- ^ Райан Смит (14 мая 2020 г.). «NVIDIA Ampere Unleashed: NVIDIA анонсирует новую архитектуру графического процессора, графический процессор A100 и ускоритель» . АнандТех.
- ^ Джейкобс, Блэр (23 марта 2022 г.). «Nvidia представляет архитектуру графического процессора Hopper следующего поколения» . Клуб386 . Проверено 4 мая 2022 г.
- ↑ Перейти обратно: Перейти обратно: а б «PCIe — PCI Express (1.1/2.0/3.0/4.0/5.0)» . www.elektronik-kompendium.de .
- ^ Январь 2019 г., Пол Алкорн 17 (17 января 2019 г.). «PCIe 5.0 готов к использованию в прайм-тайм» . Аппаратное обеспечение Тома .
{{cite web}}
: CS1 maint: числовые имена: список авторов ( ссылка ) - ^ «Сетевой коммутатор NVLink — чип переключателя NVIDIA для SuperPOD с высокой пропускной способностью» (PDF) . ХотЧипс 34 . 23 августа 2022 г.
- ^ онлайн, хайз. «NVIDIA Tesla P100 [SXM2], 16 ГБ HBM2 (NVTP100-SXM) | онлайн-сравнение цен heise / Германия» . geizhals.de .
- ^ онлайн, Хайзе (14 августа 2023 г.). «PNY Tesla P100 [PCIe], 16 ГБ HBM2 (TCSP100M-16GB-PB/NVTP100-16) от 4990,00 евро (2020 г.) | онлайн-сравнение цен Heise / Германия» . geizhals.de .
- ^ NVLink выводит ускорение графического процессора на новый уровень Тимоти Прикетт Морган на nextplatform.com, 4 мая 2016 г.
- ^ «Характеристики NVIDIA Tesla V100 SXM2, 16 ГБ» . TechPowerUp . 14 августа 2023 г.
- ^ онлайн, Хайзе (14 августа 2023 г.). «PNY Quadro GV100, 32 ГБ HBM2, 4x DP (VCQGV100-PB) от 10199,00 евро (2020 г.) | Онлайн-сравнение цен Heise / Германия» . geizhals.de .
- ↑ Перейти обратно: Перейти обратно: а б с Tegra Xavier — Nvidia на wikichip.org
- ^ РУКОВОДСТВО ПО АДАПТАЦИИ И ВНЕДРЕНИЮ ПЛАТФОРМЫ JETSON AGX XAVIER «Функции контроллера Tegra194 PCIe» на странице 14; хранится на сайтеarrow.com.
- ^ Как включить слот PCIe x2 в Xavier? на devtalk.nvidia.com
- ^ Презентация вебинара POWER9 от IBM для Power Systems VUG , Джефф Стючели, 26 января 2017 г.
- ↑ Перейти обратно: Перейти обратно: а б Морган, Тимоти Прикетт (14 мая 2020 г.). «Nvidia объединяет вычисления искусственного интеллекта с графическим процессором Ampere» . Следующая платформа .
- ↑ Перейти обратно: Перейти обратно: а б «Технический паспорт» (PDF) . www.nvidia.com . Проверено 15 сентября 2020 г.
- ↑ Перейти обратно: Перейти обратно: а б «Информационный документ по архитектуре графического процессора NVIDIA Ampere GA102» (PDF) . nvidia.com . Проверено 2 мая 2023 г.
- ↑ Перейти обратно: Перейти обратно: а б «Тензорный графический процессор» (PDF) . nvidia.com . Проверено 2 мая 2023 г.
- ↑ Все на шине PCIe для суперкомпьютера Nvidia Tesla P100, Крис Уильямс, на theregister.co.uk, 20 июня 2016 г.
- ^ Хикок, Гэри (13 ноября 2018 г.). «NVIDIA Xavier достигает важной вехи в области безопасного самостоятельного вождения | Блог NVIDIA» . Официальный блог NVIDIA .
- ^ онлайн, Хайзе (22 июня 2017 г.). «Nvidia Tesla V100: анонсирована карта PCIe с графическим чипом Volta и 16 ГБ памяти» . Хайз онлайн .
- ^ Блок-схема GV100 в статье «GTC17: NVIDIA представляет следующую архитектуру графического процессора Volta — Tesla V100 с 5120 шейдерными блоками и 16 ГБ HBM2», Андреас Шиллинг на hardwareluxx.de, 10 мая 2017 г.
- ^ Чип графического процессора NVIDIA Volta GV100 для суперкомпьютера Summit, в два раза быстрее, чем Pascal P100 - предполагается, что он достигнет 9,5 терафлопс при вычислениях FP64, Хасан Муджтаба на wccftech.com, 20 декабря 2016 г.
- ^ «Технический обзор» (PDF) . images.nvidia.com . Проверено 15 сентября 2020 г.
- ↑ Перейти обратно: Перейти обратно: а б Анджелини, Крис (14 сентября 2018 г.). «Исследование архитектуры Тьюринга от Nvidia: внутри GeForce RTX 2080» . Аппаратное обеспечение Тома . п. 7 . Проверено 28 февраля 2019 г.
TU102 и TU104 — первые графические процессоры Nvidia для настольных ПК, использующие межсоединение NVLink, а не интерфейс с несколькими входами/выходами (MIO) для поддержки SLI. Первый делает доступными два канала x8, а второй ограничивается одним. Каждый канал обеспечивает двунаправленную пропускную способность до 50 ГБ/с. Итак, GeForce RTX 2080 Ti способна обеспечить скорость до 100 ГБ/с между картами, а RTX 2080 — половину этого показателя.
- ^ Шиллинг, Андреас (22 июня 2020 г.). «A100 PCIe: графический процессор NVIDIA GA100 также доступен в виде варианта PCI Express» . Аппаратное обеспечениеluxx . Проверено 2 мая 2023 г.
- ↑ Перейти обратно: Перейти обратно: а б «НВЛИНК И НВСВИТЧ» . www.nvidia.com . Проверено 7 февраля 2021 г.
- ^ «Большая память Nvidia GH200 рядом с вашим столом: ближе, чем вы думаете» . 23 февраля 2024 г.
- ^ «Большая память Nvidia GH200 рядом с вашим столом: ближе, чем вы думаете» . 23 февраля 2024 г.
- ^ «Большая память Nvidia GH200 рядом с вашим столом: ближе, чем вы думаете» . 23 февраля 2024 г.
- ^ «Большая память Nvidia GH200 рядом с вашим столом: ближе, чем вы думаете» . 23 февраля 2024 г.
- ^ Сравнение NVLink и PCI-E с графическими процессорами NVIDIA Tesla P100 на серверах OpenPOWER , Элиот Эшельман на microway.com, 26 января 2017 г.
- ↑ Перейти обратно: Перейти обратно: а б «Высокоскоростное соединение графических процессоров NVIDIA Quadro NVLink» . NVIDIA .
- ↑ Перейти обратно: Перейти обратно: а б «Изобретение графики заново: видеокарта NVIDIA GeForce RTX 2080 Ti» . NVIDIA .
- ↑ Перейти обратно: Перейти обратно: а б «NVLink на NVIDIA GeForce RTX 2080 и 2080 Ti в Windows 10» . Пьюджет Системс . 5 октября 2018 г.
- ^ [1] [ мертвая ссылка ]
- ^ Шиллинг, Андреас (5 февраля 2017 г.). «NVIDIA представляет Quadro GP100 с графическим процессором GP100 и 16 ГБ HBM2» . Аппаратное обеспечениеluxx .
- ^ «Видеокарта NVIDIA GeForce RTX 2080 Founders Edition» . NVIDIA .
- ↑ Перейти обратно: Перейти обратно: а б с «Видеокарты NVIDIA Quadro для рабочих станций профессионального дизайна» . NVIDIA .
- ↑ Перейти обратно: Перейти обратно: а б «NVIDIA Quadro RTX 6000 и RTX 5000 готовы к предварительному заказу» . 1 октября 2018 г.
- ↑ Перейти обратно: Перейти обратно: а б с «НВЛинк | pny.com» . www.pny.com .
- ^ «Характеристики NVIDIA Quadro RTX 8000» . TechPowerUp . 14 августа 2023 г.
- ^ «Методы NvLink» . docs.nvidia.com .
- ^ «Библиотека коллективных коммуникаций NVIDIA (NCCL)» . Разработчик NVIDIA . 10 мая 2017 г.
- ^ «Внутри Паскаля: новейшая вычислительная платформа NVIDIA» . 05.04.2016.
- ^ Anandtech.com
- ^ NVIDIA представляет сервер HPC DGX-1: 8 Tesla, 3U, второй квартал 2016 г. , anandtech.com, апрель 2016 г.
- ^ Как NVLink обеспечит более быстрые и простые вычисления на нескольких графических процессорах, Марк Харрис, 14 ноября 2014 г.
- ^ «Информационный документ: Суперкомпьютеры Summit и Sierra» (PDF) . 01.11.2014.
- ^ «Nvidia Volta и IBM POWER9 заключают земельные контракты на новые суперкомпьютеры для правительства США» . АнандТех . 17 ноября 2014 г.
- ^ «RIP: Nvidia забивает последний гвоздь в гроб SLI: после 2020 года новых профилей не будет» . Мир ПК . 18 сентября 2020 г.