Максвелл (микроархитектура)

Нвидиа Максвелл
	NVIDIA GeForce GTX 980ti из линейки видеокарт GeForce 900 была последней крупной итерацией с микроархитектурой Maxwell (GM200-310).
Дата выпуска	февраль 2014 г.
Процесс изготовления	TSMC 28 нм , 20 нм , 16 нм
История
Предшественник	Кеплер
Преемник	Паскаль
Статус поддержки
	Поддерживается

Maxwell — это кодовое название графического процессора микроархитектуры , разработанной Nvidia в качестве преемника микроархитектуры Kepler . Архитектура Maxwell была представлена в более поздних моделях серии GeForce 700 , а также используется в сериях GeForce 800M , GeForce 900 и Quadro Mxxx, а также в некоторых Jetson продуктах .

Первыми продуктами на базе Maxwell были GeForce GTX 745 (OEM), GeForce GTX 750 и GeForce GTX 750 Ti. Оба были выпущены 18 февраля 2014 года, оба с кодовым номером чипа GM107. Ранее в графических процессорах серии GeForce 700 использовались чипы Kepler с кодовыми номерами GK1xx. Графические процессоры Maxwell первого поколения (кодовые номера GM10x) также используются в сериях GeForce 800M и Quadro Kxxx. Второе поколение продуктов на базе Maxwell было представлено 18 сентября 2014 г. с GeForce GTX 970 и GeForce GTX 980, за ним последовали GeForce GTX 960 22 января 2015 г., GeForce GTX Titan X 17 марта 2015 г. и GeForce GTX Titan X 17 марта 2015 г. GeForce GTX 980 Ti, 1 июня 2015 г. Последней картой Maxwell 2.0 с наименьшими характеристиками была GTX950, выпущенная на20 августа 2015 г.Эти графические процессоры имеют кодовые номера чипов GM20x.

Maxwell представила улучшенную конструкцию потокового мультипроцессора (SM), которая повысила энергоэффективность. ^[1] PureVideo HD шестого и седьмого поколений и вычислительные возможности CUDA 5.2.

Архитектура названа в честь Джеймса Клерка Максвелла , основателя теории электромагнитного излучения.

Архитектура Maxwell используется в системе на кристалле (SOC), процессоре мобильных приложений Tegra X1 .

(GM10x Maxwell первого поколения )

Графические процессоры Maxwell первого поколения (GM107/GM108) были выпущены как GeForce GTX 745, GTX 750/750 Ti, GTX 850M/860M (GM107) и GeForce 830M/840M (GM108). Эти новые чипы представили несколько дополнительных функций, ориентированных на потребителя, поскольку вместо этого Nvidia сосредоточилась больше на повышении энергоэффективности графического процессора. Кэш L2 был увеличен с 256 КиБ на Kepler до 2 МБ на Maxwell, что уменьшило потребность в большей пропускной способности памяти. Соответственно, шина памяти была уменьшена со 192 бит на Kepler (GK106) до 128 бит, что уменьшило площадь кристалла, стоимость и энергопотребление. ^[2]

Конструкция потокового мультипроцессора «SMX» от Kepler также была переоборудована и разделена на разделы, переименованная в «SMM» для Maxwell. Структура планировщика деформации была унаследована от Kepler, при этом текстурные блоки и ядра CUDA FP64 по-прежнему были общими, но расположение большинства исполнительных блоков было разделено таким образом, что каждый планировщик деформации в SMM управлял одним набором из 32 ядер CUDA FP32, одним набором. из 8 блоков загрузки/хранения и одного набора из 8 блоков специальных функций. В этом отличие от Kepler, где каждый SMX имел 4 планировщика, которые планировали работу с общим пулом исполнительных устройств. ^[3] Последнее потребовало использования перекладины шириной SMX, которая потребляла лишнюю мощность, чтобы обеспечить совместное использование всех исполнительных блоков. ^[3] И наоборот, более модульная конструкция Maxwell позволяет более детально и эффективно распределять ресурсы, экономя электроэнергию, когда рабочая нагрузка не оптимальна для общих ресурсов. Nvidia утверждает, что SMM со 128 ядрами CUDA имеет 90% производительности по сравнению с SMX со 192 ядрами CUDA, при этом эффективность увеличивается в 2 раза. ^[2] Кроме того, каждый кластер обработки графики, или GPC, содержит до 4 блоков SMX в Kepler и до 5 блоков SMM в Maxwell первого поколения. ^[2]

GM107 также поддерживает CUDA Compute Capability 5.0 по сравнению с версией 3.5 на графических процессорах GK110/GK208 и 3.0 на графических процессорах GK10x. Динамический параллелизм и HyperQ, две функции графических процессоров GK110/GK208, также поддерживаются во всей линейке продуктов Maxwell. Maxwell также предоставляет встроенные атомарные операции с общей памятью для 32-битных целых чисел и встроенную 32-битную и 64-битную операцию сравнения и замены (CAS) с общей памятью, которые можно использовать для реализации других атомарных функций.

Видеокодер Nvidia, NVENC, был модернизирован и теперь работает в 1,5–2 раза быстрее, чем графические процессоры на базе Kepler, а это означает, что он может кодировать видео со скоростью воспроизведения, в шесть-восемь раз превышающей скорость воспроизведения. ^[2] Feature Set E в восемь-десять раз Nvidia также заявляет об увеличении производительности декодирования видео PureVideo за счет кэша видеодекодера в сочетании с увеличением эффективности памяти. Однако H.265 не поддерживается для полного аппаратного декодирования в графических процессорах Maxwell первого поколения, поскольку используется сочетание аппаратного декодирования и программного декодирования (декодирование ЦП). ^[2] При декодировании видео на графических процессорах Maxwell используется новое состояние пониженного энергопотребления «GC5» для экономии энергии. ^[2]

Считалось, что графические процессоры Maxwell используют тайловый рендеринг . ^[4] но на самом деле они используют плиточное кэширование. ^[5]

Начиная с Maxwell первого поколения, протокол вывода графики UEFI полностью поддерживается графическими процессорами NVIDIA.

Чипсы [ править ]

GM107
GM108

( GM20x Maxwell второго поколения )

В графических процессорах Maxwell второго поколения представлено несколько новых технологий: Dynamic Super Разрешение, ^[6] Сжатие дельта-цветов третьего поколения, ^[7] Многопиксельная программная выборка, ^[8] Nvidia VXGI (воксельное освещение в реальном времени, глобальное освещение ), ^[9] ВР Директ, ^[9]^[10]^[11] Мультипроекционное ускорение, ^[7] Многокадровое выборочное сглаживание (MFAA) ^[12] (однако поддержка сглаживания выборки покрытия (CSAA) была удалена), ^[13] и API Direct3D12 на уровне функций 12_1. Также была добавлена поддержка HDMI 2.0. ^[14]^[15]

Соотношение ROP и контроллера памяти изменено с 8:1 на 16:1. ^[16] Однако некоторые ROP в GTX 970 обычно простаивают, поскольку не хватает включенных SMM, чтобы дать им работу, что снижает максимальную скорость заполнения. ^[17]

Движок Polymorph Engine, отвечающий за тесселяцию, был обновлен до версии 3.0 в графических процессорах Maxwell второго поколения, что привело к повышению производительности тесселяции на единицу/такт.

Maxwell второго поколения также имеет до 4 модулей SMM на GPC по сравнению с 5 модулями SMM на GPC. ^[16]

GM204 поддерживает CUDA Compute Capability 5.2 (по сравнению с 5.0 на графических процессорах GM107/GM108, 3,5 на графических процессорах GK110/GK208 и 3.0 на графических процессорах GK10x). ^[7]^[16]^[18]

Графические процессоры GM20x имеют обновленный NVENC, который поддерживает кодирование HEVC и добавляет поддержку разрешений кодирования H.264 при 1440p/60FPS и 4K/60FPS (по сравнению с NVENC на графических процессорах Maxwell GM10x первого поколения, которые поддерживали только кодирование H.264 1080p/60FPS). ^[11]

После жалоб потребителей, ^[19] Nvidia сообщила, что может отключать отдельные блоки, каждый из которых содержит 256 КБ кэша L2 и 8 блоков ROP, без отключения целых контроллеров памяти. ^[20] Это происходит за счет разделения шины памяти на высокоскоростной и низкоскоростной сегменты, к которым невозможно получить одновременный доступ для чтения, поскольку блок L2/ROP, управляющий обоими контроллерами GDDR5, совместно использует канал возврата чтения и шину данных записи. между контроллерами GDDR5. Это делает невозможным одновременное чтение с обоих контроллеров GDDR5 или одновременную запись на оба контроллера GDDR5. ^[20] Это используется в GeForce GTX 970, которую поэтому можно описать как имеющую 3,5 ГБ в высокоскоростном сегменте на 224-битной шине и 512 МБ в низкоскоростном сегменте на 32-битной шине. ^[20] Пиковая скорость такого графического процессора все еще может быть достигнута, но показатель пиковой скорости достижим только в том случае, если один сегмент выполняет операцию чтения, а другой сегмент выполняет операцию записи. ^[20]

Чипсы [ править ]

ГМ200
ГМ204
ГМ206

Производительность [ править ]

Теоретическая вычислительная мощность графического процессора Maxwell с одинарной точностью в FLOPS рассчитывается как 2 (операций на инструкцию FMA на ядро CUDA за цикл) × количество ядер CUDA × тактовая частота ядра (в Гц).

Теоретическая вычислительная мощность графического процессора Maxwell с двойной точностью составляет 1/32 от производительности с одинарной точностью (которая была отмечена как очень низкая по сравнению с Kepler предыдущего поколения ). ^[21]

Преемник [ править ]

Преемник Максвелла имеет кодовое имя Pascal . ^[22] Архитектура Pascal отличается унифицированной памятью с более высокой пропускной способностью и NVLink . ^[22]

См. также [ править ]

Ссылки [ править ]

^ «5 вещей, которые вам следует знать о новой архитектуре графического процессора Maxwell» . 21 февраля 2014 г.
↑ Перейти обратно: Перейти обратно: ^а ^б ^с ^д ^и ^ж Смит, Райан; Т.С., Ганеш (18 февраля 2014 г.). «Обзор NVIDIA GeForce GTX 750 Ti и GTX 750: Maxwell делает свой ход» . АнандТех . Архивировано из оригинала 18 февраля 2014 года . Проверено 18 февраля 2014 г.
↑ Перейти обратно: Перейти обратно: ^а ^б Райан Смит, Ганеш Т. С. «Максвелл: создан для энергоэффективности — обзор NVIDIA GeForce GTX 750 Ti и GTX 750: Максвелл делает свой ход» .
^ Кантер, Дэвид (1 августа 2016 г.). «Растеризация на основе тайлов в графических процессорах Nvidia» . Реальные мировые технологии . Проверено 1 апреля 2016 г.
^ «О тайловом рендеринге NVIDIA» . Техническое усиление . 1 марта 2017 года . Проверено 9 мая 2020 г.
^ «Динамическое суперразрешение улучшает ваши игры благодаря графике качества 4K на HD-мониторах» . www.nvidia.com .
↑ Перейти обратно: Перейти обратно: ^а ^б ^с «Архивная копия» (PDF) . Архивировано из оригинала (PDF) 21 июля 2017 г. Проверено 19 сентября 2014 г. {{cite web}}: CS1 maint: архивная копия в заголовке ( ссылка )
^ «NVIDIA BatteryBoost: избавьтесь от кирпича» . NVIDIA .
↑ Перейти обратно: Перейти обратно: ^а ^б «Статьи о GeForce, руководства, игровые новости, избранные истории» . www.nvidia.com .
^ «Как Maxwell VR Direct приближает игры в виртуальной реальности к реальности» . Официальный блог NVIDIA .
↑ Перейти обратно: Перейти обратно: ^а ^б Райан Смит. «Дисплей имеет значение: HDMI 2.0, HEVC и VR Direct — обзор NVIDIA GeForce GTX 980: Maxwell Mark 2» .
^ «Многокадровое выборочное сглаживание обеспечивает лучшую производительность для геймеров Maxwell» . www.nvidia.com .
^ «Новые чипы nVidia Maxwell не поддерживают быстрое CSAA» .
^ «Видеокарты и ноутбуки серии GeForce RTX 20» . NVIDIA .
^ Райан Смит. «Обзор NVIDIA GeForce GTX 980: Maxwell Mark 2» .
↑ Перейти обратно: Перейти обратно: ^а ^б ^с Райан Смит. «Архитектура Maxwell 2: представляем GM204 — обзор NVIDIA GeForce GTX 980: Maxwell Mark 2» .
^ «Вот еще одна причина, по которой GeForce GTX 970 медленнее, чем GTX 980» . Технический отчет .
^ «Maxwell: самый продвинутый графический процессор CUDA из когда-либо созданных» . Параллельный Форалл . 19 сентября 2014 г.
^ Джеффри Тим (3 декабря 2015 г.). «У Nvidia GTX970 довольно серьезная ошибка распределения памяти» . Lazygamer.net .
↑ Перейти обратно: Перейти обратно: ^а ^б ^с ^д Райан Смит. «Погружение глубже: перемычка памяти Maxwell 2 и разделы ROP — GeForce GTX 970: исправление характеристик и исследование распределения памяти» .
^ Смит, Райан (17 марта 2015 г.). «Обзор NVIDIA GeForce GTX Titan X» . АнандТех . п. 2 . Проверено 6 декабря 2015 г. ...милый родной коэффициент FP64 всего 1/32
↑ Перейти обратно: Перейти обратно: ^а ^б «NVIDIA обновляет дорожную карту графических процессоров; объявляет о выпуске Pascal» . Официальный блог NVIDIA .

[1] «5 вещей, которые вам следует знать о новой архитектуре графического процессора Maxwell» . 21 февраля 2014 г.

[anand750-2] Перейти обратно: Перейти обратно: ^а ^б ^с ^д ^и ^ж Смит, Райан; Т.С., Ганеш (18 февраля 2014 г.). «Обзор NVIDIA GeForce GTX 750 Ti и GTX 750: Maxwell делает свой ход» . АнандТех . Архивировано из оригинала 18 февраля 2014 года . Проверено 18 февраля 2014 г.

[AnandTechGTX750-3] Перейти обратно: Перейти обратно: ^а ^б Райан Смит, Ганеш Т. С. «Максвелл: создан для энергоэффективности — обзор NVIDIA GeForce GTX 750 Ti и GTX 750: Максвелл делает свой ход» .

[4] Кантер, Дэвид (1 августа 2016 г.). «Растеризация на основе тайлов в графических процессорах Nvidia» . Реальные мировые технологии . Проверено 1 апреля 2016 г.

[5] «О тайловом рендеринге NVIDIA» . Техническое усиление . 1 марта 2017 года . Проверено 9 мая 2020 г.

[6] «Динамическое суперразрешение улучшает ваши игры благодаря графике качества 4K на HD-мониторах» . www.nvidia.com .

[international.download.nvidia.com-7] Перейти обратно: Перейти обратно: ^а ^б ^с «Архивная копия» (PDF) . Архивировано из оригинала (PDF) 21 июля 2017 г. Проверено 19 сентября 2014 г. {{cite web}}: CS1 maint: архивная копия в заголовке ( ссылка )

[8] «NVIDIA BatteryBoost: избавьтесь от кирпича» . NVIDIA .

[auto-9] Перейти обратно: Перейти обратно: ^а ^б «Статьи о GeForce, руководства, игровые новости, избранные истории» . www.nvidia.com .

[10] «Как Maxwell VR Direct приближает игры в виртуальной реальности к реальности» . Официальный блог NVIDIA .

[anandtech.com-11] Перейти обратно: Перейти обратно: ^а ^б Райан Смит. «Дисплей имеет значение: HDMI 2.0, HEVC и VR Direct — обзор NVIDIA GeForce GTX 980: Maxwell Mark 2» .

[12] «Многокадровое выборочное сглаживание обеспечивает лучшую производительность для геймеров Maxwell» . www.nvidia.com .

[13] «Новые чипы nVidia Maxwell не поддерживают быстрое CSAA» .

[14] «Видеокарты и ноутбуки серии GeForce RTX 20» . NVIDIA .

[15] Райан Смит. «Обзор NVIDIA GeForce GTX 980: Maxwell Mark 2» .

[AnandTech980page3-16] Перейти обратно: Перейти обратно: ^а ^б ^с Райан Смит. «Архитектура Maxwell 2: представляем GM204 — обзор NVIDIA GeForce GTX 980: Maxwell Mark 2» .

[17] «Вот еще одна причина, по которой GeForce GTX 970 медленнее, чем GTX 980» . Технический отчет .

[18] «Maxwell: самый продвинутый графический процессор CUDA из когда-либо созданных» . Параллельный Форалл . 19 сентября 2014 г.

[19] Джеффри Тим (3 декабря 2015 г.). «У Nvidia GTX970 довольно серьезная ошибка распределения памяти» . Lazygamer.net .

[AnandTechCorrectionPage2-20] Перейти обратно: Перейти обратно: ^а ^б ^с ^д Райан Смит. «Погружение глубже: перемычка памяти Maxwell 2 и разделы ROP — GeForce GTX 970: исправление характеристик и исследование распределения памяти» .

[21] Смит, Райан (17 марта 2015 г.). «Обзор NVIDIA GeForce GTX Titan X» . АнандТех . п. 2 . Проверено 6 декабря 2015 г. ...милый родной коэффициент FP64 всего 1/32

[blogs.nvidia.com-22] Перейти обратно: Перейти обратно: ^а ^б «NVIDIA обновляет дорожную карту графических процессоров; объявляет о выпуске Pascal» . Официальный блог NVIDIA .

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

[15]

[16]

[17]

[18]

[19]

[20]

[21]

[22]