Ада Лавлейс (микроархитектура)
Запущен | 12 октября 2022 г |
---|---|
Разработано | Нвидиа |
Производитель | |
Процесс изготовления | ТСМЦ 4Н |
Кодовое имя(а) | AD10x |
Серия продуктов | |
Рабочий стол | |
Профессиональная/рабочая станция |
|
Сервер/центр обработки данных | |
Технические характеристики | |
Тактовая частота | от 735 МГц до 2640 МГц |
Кэш L1 | 128 КБ (на SM) |
Кэш L2 | от 32 МБ до 96 МБ |
Поддержка памяти | |
Тактовая частота памяти | 21-23 Гбит/ с |
PCIe Поддержка | PCIe 4.0 |
Поддерживаемые графические API | |
ДиректХ | DirectX 12 Ultimate (уровень функций 12_2) |
Директ3D | Директ3Д 12 |
Шейдерная модель | Шейдерная модель 6.8 |
OpenCL | ОпенCL 3.0 |
OpenGL | OpenGL 4.6 |
ДРУГОЙ | Вычислительные возможности 8.9 |
Вулкан | Вулкан 1.3 |
Поддерживаемые вычислительные API | |
ДРУГОЙ | Инструментарий CUDA 11.6 |
DirectCompute | Да |
Медиа-движок | |
Кодирование кодеков | |
Декодирование кодеков | |
Битовая глубина цвета |
|
Поддерживаемые кодировщики | НВЕНК |
Выходы дисплея | |
История | |
Предшественник | Ампер |
Вариант | Хоппер (центр обработки данных) |
Преемник | Блэквелл |
Статус поддержки | |
Поддерживается |
Ада Лавлейс , также называемая просто Лавлейс , [1] — это микроархитектура графического процессора (GPU), разработанная Nvidia как преемница архитектуры Ampere , официально анонсированная 20 сентября 2022 года. Она названа в честь английского математика Ады Лавлейс , [2] один из первых программистов . Nvidia анонсировала эту архитектуру вместе с серии GeForce RTX 40. потребительскими графическими процессорами [3] и видеокарта для рабочей станции RTX 6000 Ada Generation. [4] Архитектура Lovelace изготовлена на основе TSMC компании специального процесса 4N , который обеспечивает повышенную эффективность по сравнению с предыдущими процессами Samsung 8-нм и TSMC N7 , используемыми Nvidia для архитектуры Ampere предыдущего поколения. [5]
Фон
[ редактировать ]Архитектура Ada Lovelace является продолжением архитектуры Ampere, выпущенной в 2020 году. Архитектура Ada Lovelace была анонсирована генеральным директором Nvidia Дженсеном Хуангом во время основного доклада GTC 2022 20 сентября 2022 года. Эта архитектура используется в графических процессорах Nvidia для игр, рабочих станций и центров обработки данных. [6]
Архитектурные детали
[ редактировать ]Архитектурные улучшения архитектуры Ады Лавлейс включают следующее: [7]
- CUDA 8.9 Вычислительные возможности [8]
- Процесс TSMC 4N (специально разработанный для Nvidia) — не путать с обычным узлом N4 TSMC.
- Тензорные ядра 4-го поколения с FP8, FP16, bfloat16, TensorFloat-32 (TF32) и ускорением разреженности
- Ядра трассировки лучей 3-го поколения, а также параллельная трассировка лучей, затенение и вычисления
- Переупорядочение выполнения шейдеров (SER) [9]
- Видеокодер/декодер Nvidia (NVENC/NVDEC) с AV1 с фиксированной функцией 8K, 10 бит, 60 кадров в секунду аппаратным кодированием [10] [11]
- Нет NVLink. поддержки [12] [13]
Потоковые мультипроцессоры (SM)
[ редактировать ]Ядра CUDA
[ редактировать ]В каждый SM включено 128 ядер CUDA.
RT-ядра
[ редактировать ]Ada Lovelace оснащена ядрами RT третьего поколения. RTX 4090 имеет 128 ядер RT по сравнению с 84 в RTX 3090 Ti предыдущего поколения. Эти 128 ядер RT могут обеспечить производительность до 191 терафлопс при производительности 1,49 терафлопс на ядро RT. [14] В архитектуру Lovelace добавлен новый этап в конвейере трассировки лучей, называемый переупорядочением выполнения шейдеров (SER), который, по утверждению Nvidia, обеспечивает двукратное повышение производительности при рабочих нагрузках трассировки лучей. [6]
Тензорные ядра
[ редактировать ]Новые тензорные ядра четвертого поколения Lovelace поддерживают технологию искусственного интеллекта, используемую в методах генерации кадров DLSS 3. Как и в случае с Ampere, каждый SM содержит 4 ядра Tensor, но Lovelace в целом содержит большее количество ядер Tensor, учитывая увеличенное количество SM.
Тактовые частоты
[ редактировать ]Благодаря архитектуре Ada Lovelace наблюдается значительное увеличение тактовой частоты: базовая тактовая частота RTX 4090 выше, чем тактовая частота Boost у RTX 3090 Ti.
РТХ 2080 Ти | RTX 3090 Ти | РТХ 4090 | |
---|---|---|---|
Архитектура | Тьюринг | Ампер | Ада Лавлейс |
Базовая тактовая частота (МГц) | 1350 | 1560 | 2235 |
Увеличьте тактовую частоту (МГц) | 1635 | 1860 | 2520 |
Подсистема кэша и памяти
[ редактировать ]РТХ 2080 Ти | RTX 3090 Ти | РТХ 4090 | |
---|---|---|---|
Архитектура | Тьюринг | Ампер | Ада Лавлейс |
Кэш данных L1 | 6,375 МБ (96 КБ на SM) | 10,5 МБ (128 КБ на SM) | 16 МБ (128 КБ на SM) |
Кэш L2 | 5,5 МБ | 6 МБ | 72 МБ |
Последний включенный кристалл AD102 Lovelace МБ кэш-памяти второго уровня имеет 96 , что в 16 раз больше, чем 6 МБ у кристалла GA102 на базе Ampere. [15] Графический процессор, имеющий быстрый доступ к большому объему кэша L2, позволяет выполнять сложные операции, такие как трассировка лучей, по сравнению с графическим процессором, который ищет данные из видеопамяти GDDR, что происходит медленнее. Меньшая зависимость от доступа к памяти для хранения важных и часто используемых данных означает, что более узкая ширина шины памяти может использоваться в тандеме с большим кэшем L2.
Каждый контроллер памяти использует 32-битное соединение (до 12) при общей ширине шины памяти 384 бита. Архитектура Lovelace может использовать память GDDR6 или GDDR6X . Память GDDR6X используется в настольных сериях GeForce RTX 40, а более энергоэффективная память GDDR6 используется в соответствующих мобильных версиях и в графических процессорах рабочих станций RTX A6000.
Энергоэффективность и технологический узел
[ редактировать ]Архитектура Ады Лавлейс способна использовать более низкие напряжения по сравнению со своей предшественницей. [6] Nvidia заявляет о двукратном увеличении производительности RTX 4090 при тех же 450 Вт, что и флагманская RTX 3090 Ti предыдущего поколения. [16]
Повышенную энергоэффективность можно частично объяснить меньшим производственным узлом, используемым в архитектуре Lovelace. Архитектура Ada Lovelace изготовлена на основе процесса TSMC передового 4N , специально разработанного технологического узла для Nvidia. В архитектуре Ampere предыдущего поколения использовался от Samsung 8-нм технологический узел 8N с 2018 года, которому на момент запуска Ampere исполнилось два года. [17] [18] Кристалл AD102 с 76,3 миллиардами транзисторов имеет плотность транзисторов 125,5 миллионов на мм. 2 , увеличение плотности на 178% по сравнению с 45,1 миллионами на мм у GA102. 2 .
Медиа-движок
[ редактировать ]В архитектуре Lovelace используется новый видеокодер Nvidia NVENC 8-го поколения и видеодекодер NVDEC 7-го поколения, представленные компанией Ampere. [19]
аппаратное кодирование NVENC AV1 с поддержкой разрешения до 8K при 60 кадрах в секунду в 10-битном цвете Добавлено , что обеспечивает более высокую точность видео при более низких скоростях передачи данных по сравнению с кодеками H.264 и H.265 . [20] Nvidia утверждает, что ее кодер NVENC AV1, реализованный в архитектуре Lovelace, на 40% эффективнее, чем кодер H.264 в архитектуре Ampere. [21]
Архитектура Lovelace подверглась критике за то, что она не поддерживает соединение DisplayPort 2.0 , которое поддерживает более высокую пропускную способность отображаемых данных, и вместо этого использует более старый DisplayPort 1.4a, пиковая пропускная способность которого ограничена 32 Гбит/с. [22] В результате графические процессоры Lovelace будут ограничены поддерживаемой частотой обновления DisplayPort 1.4a, несмотря на то, что производительность графического процессора может достигать более высокой частоты кадров. Графические процессоры Intel Arc , также выпущенные в октябре 2022 года, включали DisplayPort 2.0. AMD Конкурирующая архитектура RDNA 3 была выпущена всего через два месяца после того, как Lovelace включила DisplayPort 2.1 . [23]
Умерла Ада Лавлейс
[ редактировать ]Die[24] | AD102 [25] | AD103 [26] | AD104 [27] | AD106 [28] | AD107 [29] |
---|---|---|---|---|---|
Размер матрицы | 609 мм 2 | 379 мм 2 | 294 мм 2 | 188 мм 2 | 159 мм 2 |
Транзисторы | 76,3Б | 45,9Б | 35,8Б | 22,9Б | 18,9Б |
Плотность транзисторов | 125,3 МТр/мм 2 | 121,1 МТр/мм 2 | 121,8 МТр/мм 2 | 121,8 МТр/мм 2 | 118,9 МТр/мм 2 |
Кластеры обработки графики | 12 | 7 | 5 | 3 | 2 |
Потоковые мультипроцессоры | 144 | 80 | 60 | 36 | 24 |
Ядра CUDA | 18432 | 10240 | 7680 | 4608 | 3072 |
Единицы наложения текстур | 576 | 320 | 240 | 144 | 96 |
Единицы вывода рендеринга | 192 | 112 | 80 | 48 | 48 |
Тензорные ядра | 576 | 320 | 240 | 144 | 96 |
RT-ядра | 144 | 80 | 60 | 36 | 24 |
L1 Кэш | 18 МБ | 10 МБ | 7,5 МБ | 4,5 МБ | 3 МБ MB |
128 КБ на SM | |||||
Кэш L2 | 96 МБ | 64 МБ | 48 МБ | 32 МБ |
Продукты на основе Ады Лавлейс
[ редактировать ]Потребитель
[ редактировать ]Рабочий стол
[ редактировать ]- серия GeForce 40
- GeForce RTX 4060 (AD107)
- GeForce RTX 4060Ti (AD106)
- GeForce RTX 4070 (AD104)
- GeForce RTX 4070 СУПЕР (AD104)
- GeForce RTX 4070Ti (AD104)
- GeForce RTX 4070 Ti СУПЕР (AD103)
- GeForce RTX 4080 (AD103)
- GeForce RTX 4080 СУПЕР (AD103)
- GeForce RTX 4090 D (AD102)
- GeForce RTX 4090 (AD102)
мобильный
[ редактировать ]- серия GeForce 40
- Ноутбук GeForce RTX 4050 (AD107)
- Ноутбук GeForce RTX 4060 (AD107)
- Ноутбук GeForce RTX 4070 (AD106)
- Ноутбук GeForce RTX 4080 (AD104)
- Ноутбук GeForce RTX 4090 (AD103)
Профессиональный
[ редактировать ]Настольная рабочая станция
[ редактировать ]- Графические процессоры Nvidia для рабочих станций (ранее Quadro )
- Nvidia RTX 2000 поколения Ada (AD107)
- Nvidia RTX 4000 поколения Ada (AD104)
- Nvidia RTX 4000 SFF поколения Ada (AD104)
- Nvidia RTX 4500 поколения Ada (AD104)
- Nvidia RTX 5000 поколения Ada (AD102)
- Nvidia RTX 5880 поколения Ada (AD102)
- Nvidia RTX 6000 поколения Ada (AD102)
Мобильная рабочая станция
[ редактировать ]- Графические процессоры Nvidia для рабочих станций (ранее Quadro )
- Ноутбук Nvidia RTX 2000 Max-Q поколения Ada (AD107)
- Ноутбук Nvidia RTX 2000 поколения Ada (AD107)
- Ноутбук Nvidia RTX 3000 поколения Ada (AD106)
- Ноутбук Nvidia RTX 3500 поколения Ada (AD104)
- Ноутбук Nvidia RTX 4000 поколения Ada (AD104)
- Ноутбук Nvidia RTX 5000 поколения Ada (AD103)
Центр обработки данных
[ редактировать ]- Графические процессоры Nvidia Data Center (ранее Tesla )
- Нвидиа Л4 (AD104)
- Нвидиа Л40 (AD102)
- Нвидиа L40G (AD102)
- Нвидиа L40CNX (AD102)
Тип | AD107 | AD106 | AD104 | AD103 | AD102 |
---|---|---|---|---|---|
Серия GeForce 40 (настольный компьютер) | GeForce RTX 4060 | GeForce RTX 4060 Ти | GeForce RTX 4070 GeForce RTX 4070 СУПЕР GeForce RTX 4070 Ти | GeForce RTX 4070 Супер GeForce RTX 4080 GeForce RTX 4080 Супер | GeForce RTX 4090 D GeForce RTX 4090 |
Серия GeForce 40 (мобильная) | видеокарта РТХ 4050 GeForce RTX 4060 | GeForce RTX 4070 | GeForce RTX 4080 | GeForce RTX 4090 | — |
Графические процессоры Nvidia для рабочих станций (настольные компьютеры) | RTX 2000 поколение Ады | — | RTX 4000 поколения Ады RTX 4000 SFF поколения Ada RTX 4500 поколения Ады | — | RTX 5000 поколение Ады RTX 5880 поколение Ады RTX 6000 поколение Ады |
Графические процессоры Nvidia для рабочих станций (мобильные) | RTX 2000 Max-Q поколения Ada RTX 2000 поколение Ады | RTX 3000 поколение Ады | RTX 3500 поколение Ады RTX 4000 поколения Ады | RTX 5000 поколение Ады | — |
Графические процессоры Nvidia для центров обработки данных | — | — | — | Нвидиа Л40 Нвидиа L40G Нвидиа L40CNX |
См. также
[ редактировать ]Ссылки
[ редактировать ]- ^ Фройнд, Карл (20 сентября 2022 г.). «Nvidia выпускает графический процессор Lovelace, облачные сервисы, поставляет графические процессоры H100 и новый диск Thor» . Форбс . Проверено 18 ноября 2022 г.
- ^ Муджтаба, Хасан (15 сентября 2022 г.). «Подтверждена архитектура игрового графического процессора Nvidia следующего поколения Ada Lovelace для серии GeForce RTX 40» . Wccftech . Проверено 18 ноября 2022 г.
- ^ «Nvidia совершает квантовый скачок в производительности и открывает новую эру нейронного рендеринга с серией GeForce RTX 40» . Отдел новостей Nvidia (пресс-релиз). 20 сентября 2022 г. . Проверено 20 сентября 2022 г.
- ^ «Новый графический процессор Ada Lovelace RTX от Nvidia доступен дизайнерам и создателям» . Отдел новостей NVIDIA . 20 сентября 2022 г. . Проверено 18 ноября 2022 г.
- ^ Мачковец, Сэм (20 сентября 2022 г.). «Поколение графических процессоров Nvidia Ada Lovelace: 1599 долларов за RTX 4090, 899 долларов и выше за 4080» . Арс Техника . Проверено 18 ноября 2022 г.
- ^ Jump up to: а б с Кьяппетта, Марко (22 сентября 2022 г.). «Обзор архитектуры NVIDIA GeForce RTX 40: представлен особый соус Ada» . Горячее оборудование . Проверено 8 апреля 2023 г.
- ^ «Архитектура NVIDIA Ады Лавлейс» . NVIDIA . 20 сентября 2022 г. . Проверено 20 сентября 2022 г.
- ^ «Руководство по программированию CUDA C++» . docs.nvidia.com . Проверено 15 апреля 2023 г.
- ^ «Улучшите производительность шейдеров и частоту кадров в игре с помощью изменения порядка выполнения шейдеров» . Технический блог NVIDIA . 13 октября 2022 г. Проверено 6 апреля 2023 г.
- ^ Дейгадо, Герадо (20 сентября 2022 г.). «Творчество со скоростью света: видеокарты серии GeForce RTX 40 обеспечивают двукратное увеличение производительности при 3D-рендеринге, искусственном интеллекте и экспорте видео для геймеров и авторов» . NVIDIA . Проверено 20 сентября 2022 г.
- ^ «SDK видеокодека NVIDIA» . Разработчик NVIDIA . 20 сентября 2022 г. . Проверено 18 ноября 2022 г.
- ^ Чуонг Нгуен (21 сентября 2022 г.). «Nvidia отключила NVLink на RTX 4090» . Центр Windows . Проверено 1 января 2023 г.
- ^ бтарунр (21 сентября 2022 г.). «Дженсен подтверждает: поддержка NVLink в Аде Лавлейс прекращена» . TechPowerUp . Проверено 18 ноября 2022 г.
- ^ «Архитектура графического процессора Nvidia Ada Lovelace: создана для обеспечения выдающихся игр и творчества, профессиональной графики, искусственного интеллекта и производительности вычислений» (PDF) . Нвидиа . п. 30 . Проверено 5 апреля 2023 г.
- ^ «Архитектура графического процессора Nvidia Ada Lovelace: создана для обеспечения выдающихся игр и творчества, профессиональной графики, искусственного интеллекта и производительности вычислений» (PDF) . Нвидиа . п. 12 . Проверено 6 апреля 2023 г.
- ^ «Архитектура графического процессора Nvidia Ada Lovelace: создана для обеспечения выдающихся игр и творчества, профессиональной графики, искусственного интеллекта и производительности вычислений» (PDF) . Нвидиа . п. 12 . Проверено 5 апреля 2023 г.
- ^ Джеймс, Дэйв (1 сентября 2020 г.). «Nvidia подтверждает 8-нм техпроцесс Samsung для RTX 3090, RTX 3080 и RTX 3070» . ПК-геймер . Проверено 5 апреля 2023 г.
- ^ Босняк, Доминик (1 сентября 2020 г.). «Старая 8-нм технология Samsung лежит в основе чудовищных карт NVIDIA Ampere» . СамМобайл . Проверено 5 апреля 2023 г.
- ^ «Архитектура графического процессора Nvidia Ada Lovelace: создана для обеспечения выдающихся игр и творчества, профессиональной графики, искусственного интеллекта и производительности вычислений» (PDF) . Нвидиа . п. 25 . Проверено 5 апреля 2023 г.
- ^ Мутана, Пратхап; Мишра, Сампурнананда; Патаит, Абхиджит (18 января 2023 г.). «Улучшение качества и производительности видео с помощью AV1 и архитектуры NVIDIA Ada Lovelace» . Разработчик Нвидиа . Проверено 5 апреля 2023 г.
- ^ «Nvidia Ada Science: как Ada развивает науку о графике с помощью DLSS 3» (PDF) . Нвидиа . п. 13 . Проверено 5 апреля 2023 г.
- ^ Гарреффа, Энтони (25 сентября 2022 г.). «Серия NVIDIA GeForce RTX 40 следующего поколения не имеет возможности подключения DP2.0, глупо» . ТвикТаун . Проверено 5 апреля 2023 г.
- ^ Джадд, Уилл (3 ноября 2022 г.). «AMD анонсирует видеокарты 7900 XTX и 7900 XT с FSR 3» . Еврогеймер . Проверено 5 апреля 2023 г.
- ^ «NVIDIA подтверждает характеристики графического процессора Ada 102/103/104, AD104 имеет больше транзисторов, чем GA102» . ВидеоКардз . 23 сентября 2022 г. . Проверено 23 сентября 2022 г.
- ^ «Характеристики графического процессора NVIDIA AD102» . TechPowerUp . Проверено 17 декабря 2022 г.
- ^ «Характеристики графического процессора NVIDIA AD103» . TechPowerUp . Проверено 16 июля 2024 г.
- ^ «Характеристики графического процессора NVIDIA AD104» . TechPowerUp . Проверено 18 октября 2022 г.
- ^ «Характеристики графического процессора NVIDIA AD106» . TechPowerUp . Проверено 17 декабря 2022 г.
- ^ «Характеристики графического процессора NVIDIA AD107» . TechPowerUp . Проверено 17 декабря 2022 г.