Jump to content

Ада Лавлейс (микроархитектура)

Ада Лавлейс
Запущен 12 октября 2022 г .; 21 месяц назад ( 12.10.2022 )
Разработано Нвидиа
Производитель
Процесс изготовления ТСМЦ
Кодовое имя(а) AD10x
Серия продуктов
Рабочий стол
Профессиональная/рабочая станция
  • Генерация RTX Ada
Сервер/центр обработки данных
Технические характеристики
Тактовая частота от 735 МГц до 2640 МГц
Кэш L1 128   КБ (на SM)
Кэш L2 от 32   МБ до 96   МБ
Поддержка памяти
Тактовая частота памяти 21-23   Гбит/ с
PCIe Поддержка PCIe 4.0
Поддерживаемые графические API
ДиректХ DirectX 12 Ultimate (уровень функций 12_2)
Директ3D Директ3Д 12
Шейдерная модель Шейдерная модель 6.8
OpenCL ОпенCL 3.0
OpenGL OpenGL 4.6
ДРУГОЙ Вычислительные возможности 8.9
Вулкан Вулкан 1.3
Поддерживаемые вычислительные API
ДРУГОЙ Инструментарий CUDA 11.6
DirectCompute Да
Медиа-движок
Кодирование кодеков
Декодирование кодеков
Битовая глубина цвета
  • 8-битный
  • 10-битный
Поддерживаемые кодировщики НВЕНК
Выходы дисплея
История
Предшественник Ампер
Вариант Хоппер (центр обработки данных)
Преемник Блэквелл
Статус поддержки
Поддерживается

Ада Лавлейс , также называемая просто Лавлейс , [1] — это микроархитектура графического процессора (GPU), разработанная Nvidia как преемница архитектуры Ampere , официально анонсированная 20 сентября 2022 года. Она названа в честь английского математика Ады Лавлейс , [2] один из первых программистов . Nvidia анонсировала эту архитектуру вместе с серии GeForce RTX 40. потребительскими графическими процессорами [3] и видеокарта для рабочей станции RTX 6000 Ada Generation. [4] Архитектура Lovelace изготовлена ​​на основе TSMC компании специального процесса 4N , который обеспечивает повышенную эффективность по сравнению с предыдущими процессами Samsung 8-нм и TSMC N7 , используемыми Nvidia для архитектуры Ampere предыдущего поколения. [5]

Архитектура Ada Lovelace является продолжением архитектуры Ampere, выпущенной в 2020 году. Архитектура Ada Lovelace была анонсирована генеральным директором Nvidia Дженсеном Хуангом во время основного доклада GTC 2022 20 сентября 2022 года. Эта архитектура используется в графических процессорах Nvidia для игр, рабочих станций и центров обработки данных. [6]

Архитектурные детали

[ редактировать ]

Архитектурные улучшения архитектуры Ады Лавлейс включают следующее: [7]

  • CUDA 8.9 Вычислительные возможности [8]
  • Процесс TSMC 4N   (специально разработанный для Nvidia) — не путать с обычным узлом N4 TSMC.
  • Тензорные ядра 4-го поколения с FP8, FP16, bfloat16, TensorFloat-32 (TF32) и ускорением разреженности
  • Ядра трассировки лучей 3-го поколения, а также параллельная трассировка лучей, затенение и вычисления
  • Переупорядочение выполнения шейдеров (SER) [9]
  • Видеокодер/декодер Nvidia (NVENC/NVDEC) с AV1 с фиксированной функцией 8K, 10 бит, 60 кадров в секунду аппаратным кодированием [10] [11]
  • Нет NVLink. поддержки [12] [13]

Потоковые мультипроцессоры (SM)

[ редактировать ]

В каждый SM включено 128 ядер CUDA.

Ada Lovelace оснащена ядрами RT третьего поколения. RTX 4090 имеет 128 ядер RT по сравнению с 84 в RTX 3090 Ti предыдущего поколения. Эти 128 ядер RT могут обеспечить производительность до 191 терафлопс при производительности 1,49 терафлопс на ядро ​​RT. [14] В архитектуру Lovelace добавлен новый этап в конвейере трассировки лучей, называемый переупорядочением выполнения шейдеров (SER), который, по утверждению Nvidia, обеспечивает двукратное повышение производительности при рабочих нагрузках трассировки лучей. [6]

Тензорные ядра

[ редактировать ]

Новые тензорные ядра четвертого поколения Lovelace поддерживают технологию искусственного интеллекта, используемую в методах генерации кадров DLSS 3. Как и в случае с Ampere, каждый SM содержит 4 ядра Tensor, но Lovelace в целом содержит большее количество ядер Tensor, учитывая увеличенное количество SM.

Тактовые частоты

[ редактировать ]

Благодаря архитектуре Ada Lovelace наблюдается значительное увеличение тактовой частоты: базовая тактовая частота RTX 4090 выше, чем тактовая частота Boost у RTX 3090 Ti.

РТХ 2080 Ти RTX 3090 Ти РТХ 4090
Архитектура Тьюринг Ампер Ада Лавлейс
Базовая тактовая частота
(МГц)
1350 1560 2235
Увеличьте тактовую частоту
(МГц)
1635 1860 2520

Подсистема кэша и памяти

[ редактировать ]
РТХ 2080 Ти RTX 3090 Ти РТХ 4090
Архитектура Тьюринг Ампер Ада Лавлейс
Кэш данных L1 6,375   МБ
(96   КБ на SM)
10,5   МБ
(128   КБ на SM)
16   МБ
(128   КБ на SM)
Кэш L2 5,5   МБ 6   МБ 72   МБ

Последний включенный кристалл AD102 Lovelace МБ кэш-памяти второго уровня имеет 96   , что в 16 раз больше, чем 6   МБ у кристалла GA102 на базе Ampere. [15] Графический процессор, имеющий быстрый доступ к большому объему кэша L2, позволяет выполнять сложные операции, такие как трассировка лучей, по сравнению с графическим процессором, который ищет данные из видеопамяти GDDR, что происходит медленнее. Меньшая зависимость от доступа к памяти для хранения важных и часто используемых данных означает, что более узкая ширина шины памяти может использоваться в тандеме с большим кэшем L2.

Каждый контроллер памяти использует 32-битное соединение (до 12) при общей ширине шины памяти 384 бита. Архитектура Lovelace может использовать память GDDR6 или GDDR6X . Память GDDR6X используется в настольных сериях GeForce RTX 40, а более энергоэффективная память GDDR6 используется в соответствующих мобильных версиях и в графических процессорах рабочих станций RTX A6000.

Энергоэффективность и технологический узел

[ редактировать ]

Архитектура Ады Лавлейс способна использовать более низкие напряжения по сравнению со своей предшественницей. [6] Nvidia заявляет о двукратном увеличении производительности RTX 4090 при тех же 450 Вт, что и флагманская RTX 3090 Ti предыдущего поколения. [16]

Повышенную энергоэффективность можно частично объяснить меньшим производственным узлом, используемым в архитектуре Lovelace. Архитектура Ada Lovelace изготовлена ​​на основе процесса TSMC передового 4N , специально разработанного технологического узла для Nvidia. В архитектуре Ampere предыдущего поколения использовался от Samsung 8-нм технологический узел 8N с 2018 года, которому на момент запуска Ampere исполнилось два года. [17] [18] Кристалл AD102 с 76,3 миллиардами транзисторов имеет плотность транзисторов 125,5 миллионов на мм. 2 , увеличение плотности на 178% по сравнению с 45,1 миллионами на мм у GA102. 2 .

Медиа-движок

[ редактировать ]

В архитектуре Lovelace используется новый видеокодер Nvidia NVENC 8-го поколения и видеодекодер NVDEC 7-го поколения, представленные компанией Ampere. [19]

аппаратное кодирование NVENC AV1 с поддержкой разрешения до 8K при 60 кадрах в секунду в 10-битном цвете Добавлено , что обеспечивает более высокую точность видео при более низких скоростях передачи данных по сравнению с кодеками H.264 и H.265 . [20] Nvidia утверждает, что ее кодер NVENC AV1, реализованный в архитектуре Lovelace, на 40% эффективнее, чем кодер H.264 в архитектуре Ampere. [21]

Архитектура Lovelace подверглась критике за то, что она не поддерживает соединение DisplayPort 2.0 , которое поддерживает более высокую пропускную способность отображаемых данных, и вместо этого использует более старый DisplayPort 1.4a, пиковая пропускная способность которого ограничена 32 Гбит/с. [22] В результате графические процессоры Lovelace будут ограничены поддерживаемой частотой обновления DisplayPort 1.4a, несмотря на то, что производительность графического процессора может достигать более высокой частоты кадров. Графические процессоры Intel Arc , также выпущенные в октябре 2022 года, включали DisplayPort 2.0. AMD Конкурирующая архитектура RDNA 3 была выпущена всего через два месяца после того, как Lovelace включила DisplayPort 2.1 . [23]

Умерла Ада Лавлейс

[ редактировать ]
Die[24] AD102 [25] AD103 [26] AD104 [27] AD106 [28] AD107 [29]
Размер матрицы 609 мм 2 379 мм 2 294 мм 2 188 мм 2 159 мм 2
Транзисторы 76,3Б 45,9Б 35,8Б 22,9Б 18,9Б
Плотность транзисторов 125,3 МТр/мм 2 121,1 МТр/мм 2 121,8 МТр/мм 2 121,8 МТр/мм 2 118,9 МТр/мм 2
Кластеры обработки графики 12 7 5 3 2
Потоковые мультипроцессоры 144 80 60 36 24
Ядра CUDA 18432 10240 7680 4608 3072
Единицы наложения текстур 576 320 240 144 96
Единицы вывода рендеринга 192 112 80 48 48
Тензорные ядра 576 320 240 144 96
RT-ядра 144 80 60 36 24
L1 Кэш 18   МБ 10   МБ 7,5   МБ 4,5   МБ 3 МБ  MB
128   КБ на SM
Кэш L2 96   МБ 64   МБ 48   МБ 32   МБ

Продукты на основе Ады Лавлейс

[ редактировать ]

Потребитель

[ редактировать ]

Рабочий стол

[ редактировать ]
  • серия GeForce 40
    • GeForce RTX 4060 (AD107)
    • GeForce RTX 4060Ti (AD106)
    • GeForce RTX 4070 (AD104)
    • GeForce RTX 4070 СУПЕР (AD104)
    • GeForce RTX 4070Ti (AD104)
    • GeForce RTX 4070 Ti СУПЕР (AD103)
    • GeForce RTX 4080 (AD103)
    • GeForce RTX 4080 СУПЕР (AD103)
    • GeForce RTX 4090 D (AD102)
    • GeForce RTX 4090 (AD102)

мобильный

[ редактировать ]
  • серия GeForce 40
    • Ноутбук GeForce RTX 4050 (AD107)
    • Ноутбук GeForce RTX 4060 (AD107)
    • Ноутбук GeForce RTX 4070 (AD106)
    • Ноутбук GeForce RTX 4080 (AD104)
    • Ноутбук GeForce RTX 4090 (AD103)

Профессиональный

[ редактировать ]

Настольная рабочая станция

[ редактировать ]

Мобильная рабочая станция

[ редактировать ]
  • Графические процессоры Nvidia для рабочих станций (ранее Quadro )
    • Ноутбук Nvidia RTX 2000 Max-Q поколения Ada (AD107)
    • Ноутбук Nvidia RTX 2000 поколения Ada (AD107)
    • Ноутбук Nvidia RTX 3000 поколения Ada (AD106)
    • Ноутбук Nvidia RTX 3500 поколения Ada (AD104)
    • Ноутбук Nvidia RTX 4000 поколения Ada (AD104)
    • Ноутбук Nvidia RTX 5000 поколения Ada (AD103)

Центр обработки данных

[ редактировать ]
Продукты, использующие Аду Лавлейс (за чип)
Тип AD107 AD106 AD104 AD103 AD102
Серия GeForce 40 (настольный компьютер) GeForce RTX 4060 GeForce RTX 4060 Ти GeForce RTX 4070

GeForce RTX 4070 СУПЕР

GeForce RTX 4070 Ти

GeForce RTX 4070 Супер

GeForce RTX 4080

GeForce RTX 4080 Супер

GeForce RTX 4090 D

GeForce RTX 4090

Серия GeForce 40 (мобильная) видеокарта РТХ 4050

GeForce RTX 4060

GeForce RTX 4070 GeForce RTX 4080 GeForce RTX 4090
Графические процессоры Nvidia для рабочих станций (настольные компьютеры) RTX 2000 поколение Ады RTX 4000 поколения Ады

RTX 4000 SFF поколения Ada

RTX 4500 поколения Ады

RTX 5000 поколение Ады

RTX 5880 поколение Ады

RTX 6000 поколение Ады

Графические процессоры Nvidia для рабочих станций (мобильные) RTX 2000 Max-Q поколения Ada

RTX 2000 поколение Ады

RTX 3000 поколение Ады RTX 3500 поколение Ады

RTX 4000 поколения Ады

RTX 5000 поколение Ады
Графические процессоры Nvidia для центров обработки данных Нвидиа Л40

Нвидиа L40G

Нвидиа L40CNX

См. также

[ редактировать ]
  1. ^ Фройнд, Карл (20 сентября 2022 г.). «Nvidia выпускает графический процессор Lovelace, облачные сервисы, поставляет графические процессоры H100 и новый диск Thor» . Форбс . Проверено 18 ноября 2022 г.
  2. ^ Муджтаба, Хасан (15 сентября 2022 г.). «Подтверждена архитектура игрового графического процессора Nvidia следующего поколения Ada Lovelace для серии GeForce RTX 40» . Wccftech . Проверено 18 ноября 2022 г.
  3. ^ «Nvidia совершает квантовый скачок в производительности и открывает новую эру нейронного рендеринга с серией GeForce RTX 40» . Отдел новостей Nvidia (пресс-релиз). 20 сентября 2022 г. . Проверено 20 сентября 2022 г.
  4. ^ «Новый графический процессор Ada Lovelace RTX от Nvidia доступен дизайнерам и создателям» . Отдел новостей NVIDIA . 20 сентября 2022 г. . Проверено 18 ноября 2022 г.
  5. ^ Мачковец, Сэм (20 сентября 2022 г.). «Поколение графических процессоров Nvidia Ada Lovelace: 1599 долларов за RTX 4090, 899 долларов и выше за 4080» . Арс Техника . Проверено 18 ноября 2022 г.
  6. ^ Jump up to: а б с Кьяппетта, Марко (22 сентября 2022 г.). «Обзор архитектуры NVIDIA GeForce RTX 40: представлен особый соус Ada» . Горячее оборудование . Проверено 8 апреля 2023 г.
  7. ^ «Архитектура NVIDIA Ады Лавлейс» . NVIDIA . 20 сентября 2022 г. . Проверено 20 сентября 2022 г.
  8. ^ «Руководство по программированию CUDA C++» . docs.nvidia.com . Проверено 15 апреля 2023 г.
  9. ^ «Улучшите производительность шейдеров и частоту кадров в игре с помощью изменения порядка выполнения шейдеров» . Технический блог NVIDIA . 13 октября 2022 г. Проверено 6 апреля 2023 г.
  10. ^ Дейгадо, Герадо (20 сентября 2022 г.). «Творчество со скоростью света: видеокарты серии GeForce RTX 40 обеспечивают двукратное увеличение производительности при 3D-рендеринге, искусственном интеллекте и экспорте видео для геймеров и авторов» . NVIDIA . Проверено 20 сентября 2022 г.
  11. ^ «SDK видеокодека NVIDIA» . Разработчик NVIDIA . 20 сентября 2022 г. . Проверено 18 ноября 2022 г.
  12. ^ Чуонг Нгуен (21 сентября 2022 г.). «Nvidia отключила NVLink на RTX 4090» . Центр Windows . Проверено 1 января 2023 г.
  13. ^ бтарунр (21 сентября 2022 г.). «Дженсен подтверждает: поддержка NVLink в Аде Лавлейс прекращена» . TechPowerUp . Проверено 18 ноября 2022 г.
  14. ^ «Архитектура графического процессора Nvidia Ada Lovelace: создана для обеспечения выдающихся игр и творчества, профессиональной графики, искусственного интеллекта и производительности вычислений» (PDF) . Нвидиа . п. 30 . Проверено 5 апреля 2023 г.
  15. ^ «Архитектура графического процессора Nvidia Ada Lovelace: создана для обеспечения выдающихся игр и творчества, профессиональной графики, искусственного интеллекта и производительности вычислений» (PDF) . Нвидиа . п. 12 . Проверено 6 апреля 2023 г.
  16. ^ «Архитектура графического процессора Nvidia Ada Lovelace: создана для обеспечения выдающихся игр и творчества, профессиональной графики, искусственного интеллекта и производительности вычислений» (PDF) . Нвидиа . п. 12 . Проверено 5 апреля 2023 г.
  17. ^ Джеймс, Дэйв (1 сентября 2020 г.). «Nvidia подтверждает 8-нм техпроцесс Samsung для RTX 3090, RTX 3080 и RTX 3070» . ПК-геймер . Проверено 5 апреля 2023 г.
  18. ^ Босняк, Доминик (1 сентября 2020 г.). «Старая 8-нм технология Samsung лежит в основе чудовищных карт NVIDIA Ampere» . СамМобайл . Проверено 5 апреля 2023 г.
  19. ^ «Архитектура графического процессора Nvidia Ada Lovelace: создана для обеспечения выдающихся игр и творчества, профессиональной графики, искусственного интеллекта и производительности вычислений» (PDF) . Нвидиа . п. 25 . Проверено 5 апреля 2023 г.
  20. ^ Мутана, Пратхап; Мишра, Сампурнананда; Патаит, Абхиджит (18 января 2023 г.). «Улучшение качества и производительности видео с помощью AV1 и архитектуры NVIDIA Ada Lovelace» . Разработчик Нвидиа . Проверено 5 апреля 2023 г.
  21. ^ «Nvidia Ada Science: как Ada развивает науку о графике с помощью DLSS 3» (PDF) . Нвидиа . п. 13 . Проверено 5 апреля 2023 г.
  22. ^ Гарреффа, Энтони (25 сентября 2022 г.). «Серия NVIDIA GeForce RTX 40 следующего поколения не имеет возможности подключения DP2.0, глупо» . ТвикТаун . Проверено 5 апреля 2023 г.
  23. ^ Джадд, Уилл (3 ноября 2022 г.). «AMD анонсирует видеокарты 7900 XTX и 7900 XT с FSR 3» . Еврогеймер . Проверено 5 апреля 2023 г.
  24. ^ «NVIDIA подтверждает характеристики графического процессора Ada 102/103/104, AD104 имеет больше транзисторов, чем GA102» . ВидеоКардз . 23 сентября 2022 г. . Проверено 23 сентября 2022 г.
  25. ^ «Характеристики графического процессора NVIDIA AD102» . TechPowerUp . Проверено 17 декабря 2022 г.
  26. ^ «Характеристики графического процессора NVIDIA AD103» . TechPowerUp . Проверено 16 июля 2024 г.
  27. ^ «Характеристики графического процессора NVIDIA AD104» . TechPowerUp . Проверено 18 октября 2022 г.
  28. ^ «Характеристики графического процессора NVIDIA AD106» . TechPowerUp . Проверено 17 декабря 2022 г.
  29. ^ «Характеристики графического процессора NVIDIA AD107» . TechPowerUp . Проверено 17 декабря 2022 г.
[ редактировать ]
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: e31969616ab1a9d7b3152ac5d6a4b34d__1721179320
URL1:https://arc.ask3.ru/arc/aa/e3/4d/e31969616ab1a9d7b3152ac5d6a4b34d.html
Заголовок, (Title) документа по адресу, URL1:
Ada Lovelace (microarchitecture) - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)