Jump to content

Максвелл (микроархитектура)

Нвидиа Максвелл
NVIDIA GeForce GTX 980ti из линейки видеокарт GeForce 900 была последней крупной итерацией с микроархитектурой Maxwell (GM200-310).
Дата выпуска февраль 2014 г.
Процесс изготовления TSMC 28 нм , 20 нм , 16 нм
История
Предшественник Кеплер
Преемник Паскаль
Статус поддержки
Поддерживается
Фотография Джеймса Клерка Максвелла, эпонима архитектуры

Maxwell — это кодовое название графического процессора микроархитектуры , разработанной Nvidia в качестве преемника микроархитектуры Kepler . Архитектура Maxwell была представлена ​​в более поздних моделях серии GeForce 700 , а также используется в сериях GeForce 800M , GeForce 900 и Quadro Mxxx, а также в некоторых Jetson продуктах .

Первыми продуктами на базе Maxwell были GeForce GTX 745 (OEM), GeForce GTX 750 и GeForce GTX 750 Ti. Оба были выпущены 18 февраля 2014 года, оба с кодовым номером чипа GM107. Ранее в графических процессорах серии GeForce 700 использовались чипы Kepler с кодовыми номерами GK1xx. Графические процессоры Maxwell первого поколения (кодовые номера GM10x) также используются в сериях GeForce 800M и Quadro Kxxx. Второе поколение продуктов на базе Maxwell было представлено 18 сентября 2014 г. с GeForce GTX 970 и GeForce GTX 980, за ним последовали GeForce GTX 960 22 января 2015 г., GeForce GTX Titan X 17 марта 2015 г. и GeForce GTX Titan X 17 марта 2015 г. GeForce GTX 980 Ti, 1 июня 2015 г. Последней картой Maxwell 2.0 с наименьшими характеристиками была GTX950, выпущенная на20 августа 2015 г.Эти графические процессоры имеют кодовые номера чипов GM20x.

Maxwell представила улучшенную конструкцию потокового мультипроцессора (SM), которая повысила энергоэффективность. [1] PureVideo HD шестого и седьмого поколений и вычислительные возможности CUDA 5.2.

Архитектура названа в честь Джеймса Клерка Максвелла , основателя теории электромагнитного излучения.

Архитектура Maxwell используется в системе на кристалле (SOC), процессоре мобильных приложений Tegra X1 .

(GM10x Maxwell первого поколения )

Чип Maxwell 107 на видеокарте GTX 750 Ti со снятым радиатором

Графические процессоры Maxwell первого поколения (GM107/GM108) были выпущены как GeForce GTX 745, GTX 750/750 Ti, GTX 850M/860M (GM107) и GeForce 830M/840M (GM108). Эти новые чипы представили несколько дополнительных функций, ориентированных на потребителя, поскольку вместо этого Nvidia сосредоточилась больше на повышении энергоэффективности графического процессора. Кэш L2 был увеличен с 256 КиБ на Kepler до 2 МБ на Maxwell, что уменьшило потребность в большей пропускной способности памяти. Соответственно, шина памяти была уменьшена со 192 бит на Kepler (GK106) до 128 бит, что уменьшило площадь кристалла, стоимость и энергопотребление. [2]

Конструкция потокового мультипроцессора «SMX» от Kepler также была переоборудована и разделена на разделы, переименованная в «SMM» для Maxwell. Структура планировщика деформации была унаследована от Kepler, при этом текстурные блоки и ядра CUDA FP64 по-прежнему были общими, но расположение большинства исполнительных блоков было разделено таким образом, что каждый планировщик деформации в SMM управлял одним набором из 32 ядер CUDA FP32, одним набором. из 8 блоков загрузки/хранения и одного набора из 8 блоков специальных функций. В этом отличие от Kepler, где каждый SMX имел 4 планировщика, которые планировали работу с общим пулом исполнительных устройств. [3] Последнее потребовало использования перекладины шириной SMX, которая потребляла лишнюю мощность, чтобы обеспечить совместное использование всех исполнительных блоков. [3] И наоборот, более модульная конструкция Maxwell позволяет более детально и эффективно распределять ресурсы, экономя электроэнергию, когда рабочая нагрузка не оптимальна для общих ресурсов. Nvidia утверждает, что SMM со 128 ядрами CUDA имеет 90% производительности по сравнению с SMX со 192 ядрами CUDA, при этом эффективность увеличивается в 2 раза. [2] Кроме того, каждый кластер обработки графики, или GPC, содержит до 4 блоков SMX в Kepler и до 5 блоков SMM в Maxwell первого поколения. [2]

GM107 также поддерживает CUDA Compute Capability 5.0 по сравнению с версией 3.5 на графических процессорах GK110/GK208 и 3.0 на графических процессорах GK10x. Динамический параллелизм и HyperQ, две функции графических процессоров GK110/GK208, также поддерживаются во всей линейке продуктов Maxwell. Maxwell также предоставляет встроенные атомарные операции с общей памятью для 32-битных целых чисел и встроенную 32-битную и 64-битную операцию сравнения и замены (CAS) с общей памятью, которые можно использовать для реализации других атомарных функций.

Видеокодер Nvidia, NVENC, был модернизирован и теперь работает в 1,5–2 раза быстрее, чем графические процессоры на базе Kepler, а это означает, что он может кодировать видео со скоростью воспроизведения, в шесть-восемь раз превышающей скорость воспроизведения. [2] Feature Set E в восемь-десять раз Nvidia также заявляет об увеличении производительности декодирования видео PureVideo за счет кэша видеодекодера в сочетании с увеличением эффективности памяти. Однако H.265 не поддерживается для полного аппаратного декодирования в графических процессорах Maxwell первого поколения, поскольку используется сочетание аппаратного декодирования и программного декодирования (декодирование ЦП). [2] При декодировании видео на графических процессорах Maxwell используется новое состояние пониженного энергопотребления «GC5» для экономии энергии. [2]

Считалось, что графические процессоры Maxwell используют тайловый рендеринг . [4] но на самом деле они используют плиточное кэширование. [5]

Начиная с Maxwell первого поколения, протокол вывода графики UEFI полностью поддерживается графическими процессорами NVIDIA.

Чипсы [ править ]

  • GM107
  • GM108

( GM20x Maxwell второго поколения )

Снимок графического процессора GM200, обнаруженного внутри карт GeForce GTX 980 Ti

В графических процессорах Maxwell второго поколения представлено несколько новых технологий: Dynamic Super Разрешение, [6] Сжатие дельта-цветов третьего поколения, [7] Многопиксельная программная выборка, [8] Nvidia VXGI (воксельное освещение в реальном времени, глобальное освещение ), [9] ВР Директ, [9] [10] [11] Мультипроекционное ускорение, [7] Многокадровое выборочное сглаживание (MFAA) [12] (однако поддержка сглаживания выборки покрытия (CSAA) была удалена), [13] и API Direct3D12 на уровне функций 12_1. Также была добавлена ​​поддержка HDMI 2.0. [14] [15]

Соотношение ROP и контроллера памяти изменено с 8:1 на 16:1. [16] Однако некоторые ROP в GTX 970 обычно простаивают, поскольку не хватает включенных SMM, чтобы дать им работу, что снижает максимальную скорость заполнения. [17]

Движок Polymorph Engine, отвечающий за тесселяцию, был обновлен до версии 3.0 в графических процессорах Maxwell второго поколения, что привело к повышению производительности тесселяции на единицу/такт.

Maxwell второго поколения также имеет до 4 модулей SMM на GPC по сравнению с 5 модулями SMM на GPC. [16]

GM204 поддерживает CUDA Compute Capability 5.2 (по сравнению с 5.0 на графических процессорах GM107/GM108, 3,5 на графических процессорах GK110/GK208 и 3.0 на графических процессорах GK10x). [7] [16] [18]

Графические процессоры GM20x имеют обновленный NVENC, который поддерживает кодирование HEVC и добавляет поддержку разрешений кодирования H.264 при 1440p/60FPS и 4K/60FPS (по сравнению с NVENC на графических процессорах Maxwell GM10x первого поколения, которые поддерживали только кодирование H.264 1080p/60FPS). [11]

После жалоб потребителей, [19] Nvidia сообщила, что может отключать отдельные блоки, каждый из которых содержит 256 КБ кэша L2 и 8 блоков ROP, без отключения целых контроллеров памяти. [20] Это происходит за счет разделения шины памяти на высокоскоростной и низкоскоростной сегменты, к которым невозможно получить одновременный доступ для чтения, поскольку блок L2/ROP, управляющий обоими контроллерами GDDR5, совместно использует канал возврата чтения и шину данных записи. между контроллерами GDDR5. Это делает невозможным одновременное чтение с обоих контроллеров GDDR5 или одновременную запись на оба контроллера GDDR5. [20] Это используется в GeForce GTX 970, которую поэтому можно описать как имеющую 3,5 ГБ в высокоскоростном сегменте на 224-битной шине и 512 МБ в низкоскоростном сегменте на 32-битной шине. [20] Пиковая скорость такого графического процессора все еще может быть достигнута, но показатель пиковой скорости достижим только в том случае, если один сегмент выполняет операцию чтения, а другой сегмент выполняет операцию записи. [20]

Чипсы [ править ]

  • ГМ200
  • ГМ204
  • ГМ206

Производительность [ править ]

Теоретическая вычислительная мощность графического процессора Maxwell с одинарной точностью в FLOPS рассчитывается как 2 (операций на инструкцию FMA на ядро ​​CUDA за цикл) × количество ядер CUDA × тактовая частота ядра (в Гц).

Теоретическая вычислительная мощность графического процессора Maxwell с двойной точностью составляет 1/32 от производительности с одинарной точностью (которая была отмечена как очень низкая по сравнению с Kepler предыдущего поколения ). [21]

Преемник [ править ]

Преемник Максвелла имеет кодовое имя Pascal . [22] Архитектура Pascal отличается унифицированной памятью с более высокой пропускной способностью и NVLink . [22]

См. также [ править ]

Ссылки [ править ]

  1. ^ «5 вещей, которые вам следует знать о новой архитектуре графического процессора Maxwell» . 21 февраля 2014 г.
  2. Перейти обратно: Перейти обратно: а б с д и ж Смит, Райан; Т.С., Ганеш (18 февраля 2014 г.). «Обзор NVIDIA GeForce GTX 750 Ti и GTX 750: Maxwell делает свой ход» . АнандТех . Архивировано из оригинала 18 февраля 2014 года . Проверено 18 февраля 2014 г.
  3. Перейти обратно: Перейти обратно: а б Райан Смит, Ганеш Т. С. «Максвелл: создан для энергоэффективности — обзор NVIDIA GeForce GTX 750 Ti и GTX 750: Максвелл делает свой ход» .
  4. ^ Кантер, Дэвид (1 августа 2016 г.). «Растеризация на основе тайлов в графических процессорах Nvidia» . Реальные мировые технологии . Проверено 1 апреля 2016 г.
  5. ^ «О тайловом рендеринге NVIDIA» . Техническое усиление . 1 марта 2017 года . Проверено 9 мая 2020 г.
  6. ^ «Динамическое суперразрешение улучшает ваши игры благодаря графике качества 4K на HD-мониторах» . www.nvidia.com .
  7. Перейти обратно: Перейти обратно: а б с «Архивная копия» (PDF) . Архивировано из оригинала (PDF) 21 июля 2017 г. Проверено 19 сентября 2014 г. {{cite web}}: CS1 maint: архивная копия в заголовке ( ссылка )
  8. ^ «NVIDIA BatteryBoost: избавьтесь от кирпича» . NVIDIA .
  9. Перейти обратно: Перейти обратно: а б «Статьи о GeForce, руководства, игровые новости, избранные истории» . www.nvidia.com .
  10. ^ «Как Maxwell VR Direct приближает игры в виртуальной реальности к реальности» . Официальный блог NVIDIA .
  11. Перейти обратно: Перейти обратно: а б Райан Смит. «Дисплей имеет значение: HDMI 2.0, HEVC и VR Direct — обзор NVIDIA GeForce GTX 980: Maxwell Mark 2» .
  12. ^ «Многокадровое выборочное сглаживание обеспечивает лучшую производительность для геймеров Maxwell» . www.nvidia.com .
  13. ^ «Новые чипы nVidia Maxwell не поддерживают быстрое CSAA» .
  14. ^ «Видеокарты и ноутбуки серии GeForce RTX 20» . NVIDIA .
  15. ^ Райан Смит. «Обзор NVIDIA GeForce GTX 980: Maxwell Mark 2» .
  16. Перейти обратно: Перейти обратно: а б с Райан Смит. «Архитектура Maxwell 2: представляем GM204 — обзор NVIDIA GeForce GTX 980: Maxwell Mark 2» .
  17. ^ «Вот еще одна причина, по которой GeForce GTX 970 медленнее, чем GTX 980» . Технический отчет .
  18. ^ «Maxwell: самый продвинутый графический процессор CUDA из когда-либо созданных» . Параллельный Форалл . 19 сентября 2014 г.
  19. ^ Джеффри Тим (3 декабря 2015 г.). «У Nvidia GTX970 довольно серьезная ошибка распределения памяти» . Lazygamer.net .
  20. Перейти обратно: Перейти обратно: а б с д Райан Смит. «Погружение глубже: перемычка памяти Maxwell 2 и разделы ROP — GeForce GTX 970: исправление характеристик и исследование распределения памяти» .
  21. ^ Смит, Райан (17 марта 2015 г.). «Обзор NVIDIA GeForce GTX Titan X» . АнандТех . п. 2 . Проверено 6 декабря 2015 г. ...милый родной коэффициент FP64 всего 1/32
  22. Перейти обратно: Перейти обратно: а б «NVIDIA обновляет дорожную карту графических процессоров; объявляет о выпуске Pascal» . Официальный блог NVIDIA .
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: f174fff090871613dc1650cfdd6e34cc__1711534860
URL1:https://arc.ask3.ru/arc/aa/f1/cc/f174fff090871613dc1650cfdd6e34cc.html
Заголовок, (Title) документа по адресу, URL1:
Maxwell (microarchitecture) - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)