Максвелл (микроархитектура)
![]() NVIDIA GeForce GTX 980ti из линейки видеокарт GeForce 900 была последней крупной итерацией с микроархитектурой Maxwell (GM200-310). | |
Дата выпуска | февраль 2014 г. |
---|---|
Процесс изготовления | TSMC 28 нм , 20 нм , 16 нм |
История | |
Предшественник | Кеплер |
Преемник | Паскаль |
Статус поддержки | |
Поддерживается |

Maxwell — это кодовое название графического процессора микроархитектуры , разработанной Nvidia в качестве преемника микроархитектуры Kepler . Архитектура Maxwell была представлена в более поздних моделях серии GeForce 700 , а также используется в сериях GeForce 800M , GeForce 900 и Quadro Mxxx, а также в некоторых Jetson продуктах .
Первыми продуктами на базе Maxwell были GeForce GTX 745 (OEM), GeForce GTX 750 и GeForce GTX 750 Ti. Оба были выпущены 18 февраля 2014 года, оба с кодовым номером чипа GM107. Ранее в графических процессорах серии GeForce 700 использовались чипы Kepler с кодовыми номерами GK1xx. Графические процессоры Maxwell первого поколения (кодовые номера GM10x) также используются в сериях GeForce 800M и Quadro Kxxx. Второе поколение продуктов на базе Maxwell было представлено 18 сентября 2014 г. с GeForce GTX 970 и GeForce GTX 980, за ним последовали GeForce GTX 960 22 января 2015 г., GeForce GTX Titan X 17 марта 2015 г. и GeForce GTX Titan X 17 марта 2015 г. GeForce GTX 980 Ti, 1 июня 2015 г. Последней картой Maxwell 2.0 с наименьшими характеристиками была GTX950, выпущенная на20 августа 2015 г.Эти графические процессоры имеют кодовые номера чипов GM20x.
Maxwell представила улучшенную конструкцию потокового мультипроцессора (SM), которая повысила энергоэффективность. [1] PureVideo HD шестого и седьмого поколений и вычислительные возможности CUDA 5.2.
Архитектура названа в честь Джеймса Клерка Максвелла , основателя теории электромагнитного излучения.
Архитектура Maxwell используется в системе на кристалле (SOC), процессоре мобильных приложений Tegra X1 .
(GM10x Maxwell первого поколения )

Графические процессоры Maxwell первого поколения (GM107/GM108) были выпущены как GeForce GTX 745, GTX 750/750 Ti, GTX 850M/860M (GM107) и GeForce 830M/840M (GM108). Эти новые чипы представили несколько дополнительных функций, ориентированных на потребителя, поскольку вместо этого Nvidia сосредоточилась больше на повышении энергоэффективности графического процессора. Кэш L2 был увеличен с 256 КиБ на Kepler до 2 МБ на Maxwell, что уменьшило потребность в большей пропускной способности памяти. Соответственно, шина памяти была уменьшена со 192 бит на Kepler (GK106) до 128 бит, что уменьшило площадь кристалла, стоимость и энергопотребление. [2]
Конструкция потокового мультипроцессора «SMX» от Kepler также была переоборудована и разделена на разделы, переименованная в «SMM» для Maxwell. Структура планировщика деформации была унаследована от Kepler, при этом текстурные блоки и ядра CUDA FP64 по-прежнему были общими, но расположение большинства исполнительных блоков было разделено таким образом, что каждый планировщик деформации в SMM управлял одним набором из 32 ядер CUDA FP32, одним набором. из 8 блоков загрузки/хранения и одного набора из 8 блоков специальных функций. В этом отличие от Kepler, где каждый SMX имел 4 планировщика, которые планировали работу с общим пулом исполнительных устройств. [3] Последнее потребовало использования перекладины шириной SMX, которая потребляла лишнюю мощность, чтобы обеспечить совместное использование всех исполнительных блоков. [3] И наоборот, более модульная конструкция Maxwell позволяет более детально и эффективно распределять ресурсы, экономя электроэнергию, когда рабочая нагрузка не оптимальна для общих ресурсов. Nvidia утверждает, что SMM со 128 ядрами CUDA имеет 90% производительности по сравнению с SMX со 192 ядрами CUDA, при этом эффективность увеличивается в 2 раза. [2] Кроме того, каждый кластер обработки графики, или GPC, содержит до 4 блоков SMX в Kepler и до 5 блоков SMM в Maxwell первого поколения. [2]
GM107 также поддерживает CUDA Compute Capability 5.0 по сравнению с версией 3.5 на графических процессорах GK110/GK208 и 3.0 на графических процессорах GK10x. Динамический параллелизм и HyperQ, две функции графических процессоров GK110/GK208, также поддерживаются во всей линейке продуктов Maxwell. Maxwell также предоставляет встроенные атомарные операции с общей памятью для 32-битных целых чисел и встроенную 32-битную и 64-битную операцию сравнения и замены (CAS) с общей памятью, которые можно использовать для реализации других атомарных функций.
Видеокодер Nvidia, NVENC, был модернизирован и теперь работает в 1,5–2 раза быстрее, чем графические процессоры на базе Kepler, а это означает, что он может кодировать видео со скоростью воспроизведения, в шесть-восемь раз превышающей скорость воспроизведения. [2] Feature Set E в восемь-десять раз Nvidia также заявляет об увеличении производительности декодирования видео PureVideo за счет кэша видеодекодера в сочетании с увеличением эффективности памяти. Однако H.265 не поддерживается для полного аппаратного декодирования в графических процессорах Maxwell первого поколения, поскольку используется сочетание аппаратного декодирования и программного декодирования (декодирование ЦП). [2] При декодировании видео на графических процессорах Maxwell используется новое состояние пониженного энергопотребления «GC5» для экономии энергии. [2]
Считалось, что графические процессоры Maxwell используют тайловый рендеринг . [4] но на самом деле они используют плиточное кэширование. [5]
Начиная с Maxwell первого поколения, протокол вывода графики UEFI полностью поддерживается графическими процессорами NVIDIA.
Чипсы [ править ]
- GM107
- GM108
( GM20x Maxwell второго поколения )

В графических процессорах Maxwell второго поколения представлено несколько новых технологий: Dynamic Super Разрешение, [6] Сжатие дельта-цветов третьего поколения, [7] Многопиксельная программная выборка, [8] Nvidia VXGI (воксельное освещение в реальном времени, глобальное освещение ), [9] ВР Директ, [9] [10] [11] Мультипроекционное ускорение, [7] Многокадровое выборочное сглаживание (MFAA) [12] (однако поддержка сглаживания выборки покрытия (CSAA) была удалена), [13] и API Direct3D12 на уровне функций 12_1. Также была добавлена поддержка HDMI 2.0. [14] [15]
Соотношение ROP и контроллера памяти изменено с 8:1 на 16:1. [16] Однако некоторые ROP в GTX 970 обычно простаивают, поскольку не хватает включенных SMM, чтобы дать им работу, что снижает максимальную скорость заполнения. [17]
Движок Polymorph Engine, отвечающий за тесселяцию, был обновлен до версии 3.0 в графических процессорах Maxwell второго поколения, что привело к повышению производительности тесселяции на единицу/такт.
Maxwell второго поколения также имеет до 4 модулей SMM на GPC по сравнению с 5 модулями SMM на GPC. [16]
GM204 поддерживает CUDA Compute Capability 5.2 (по сравнению с 5.0 на графических процессорах GM107/GM108, 3,5 на графических процессорах GK110/GK208 и 3.0 на графических процессорах GK10x). [7] [16] [18]
Графические процессоры GM20x имеют обновленный NVENC, который поддерживает кодирование HEVC и добавляет поддержку разрешений кодирования H.264 при 1440p/60FPS и 4K/60FPS (по сравнению с NVENC на графических процессорах Maxwell GM10x первого поколения, которые поддерживали только кодирование H.264 1080p/60FPS). [11]
После жалоб потребителей, [19] Nvidia сообщила, что может отключать отдельные блоки, каждый из которых содержит 256 КБ кэша L2 и 8 блоков ROP, без отключения целых контроллеров памяти. [20] Это происходит за счет разделения шины памяти на высокоскоростной и низкоскоростной сегменты, к которым невозможно получить одновременный доступ для чтения, поскольку блок L2/ROP, управляющий обоими контроллерами GDDR5, совместно использует канал возврата чтения и шину данных записи. между контроллерами GDDR5. Это делает невозможным одновременное чтение с обоих контроллеров GDDR5 или одновременную запись на оба контроллера GDDR5. [20] Это используется в GeForce GTX 970, которую поэтому можно описать как имеющую 3,5 ГБ в высокоскоростном сегменте на 224-битной шине и 512 МБ в низкоскоростном сегменте на 32-битной шине. [20] Пиковая скорость такого графического процессора все еще может быть достигнута, но показатель пиковой скорости достижим только в том случае, если один сегмент выполняет операцию чтения, а другой сегмент выполняет операцию записи. [20]
Чипсы [ править ]
- ГМ200
- ГМ204
- ГМ206
Производительность [ править ]
Теоретическая вычислительная мощность графического процессора Maxwell с одинарной точностью в FLOPS рассчитывается как 2 (операций на инструкцию FMA на ядро CUDA за цикл) × количество ядер CUDA × тактовая частота ядра (в Гц).
Теоретическая вычислительная мощность графического процессора Maxwell с двойной точностью составляет 1/32 от производительности с одинарной точностью (которая была отмечена как очень низкая по сравнению с Kepler предыдущего поколения ). [21]
Преемник [ править ]
Преемник Максвелла имеет кодовое имя Pascal . [22] Архитектура Pascal отличается унифицированной памятью с более высокой пропускной способностью и NVLink . [22]
См. также [ править ]
- Список эпонимов микроархитектур графических процессоров Nvidia
- Список графических процессоров Nvidia
- Нвидиа НВДЕК
- Нвидиа НВЕНК
Ссылки [ править ]
- ^ «5 вещей, которые вам следует знать о новой архитектуре графического процессора Maxwell» . 21 февраля 2014 г.
- ↑ Перейти обратно: Перейти обратно: а б с д и ж Смит, Райан; Т.С., Ганеш (18 февраля 2014 г.). «Обзор NVIDIA GeForce GTX 750 Ti и GTX 750: Maxwell делает свой ход» . АнандТех . Архивировано из оригинала 18 февраля 2014 года . Проверено 18 февраля 2014 г.
- ↑ Перейти обратно: Перейти обратно: а б Райан Смит, Ганеш Т. С. «Максвелл: создан для энергоэффективности — обзор NVIDIA GeForce GTX 750 Ti и GTX 750: Максвелл делает свой ход» .
- ^ Кантер, Дэвид (1 августа 2016 г.). «Растеризация на основе тайлов в графических процессорах Nvidia» . Реальные мировые технологии . Проверено 1 апреля 2016 г.
- ^ «О тайловом рендеринге NVIDIA» . Техническое усиление . 1 марта 2017 года . Проверено 9 мая 2020 г.
- ^ «Динамическое суперразрешение улучшает ваши игры благодаря графике качества 4K на HD-мониторах» . www.nvidia.com .
- ↑ Перейти обратно: Перейти обратно: а б с «Архивная копия» (PDF) . Архивировано из оригинала (PDF) 21 июля 2017 г. Проверено 19 сентября 2014 г.
{{cite web}}
: CS1 maint: архивная копия в заголовке ( ссылка ) - ^ «NVIDIA BatteryBoost: избавьтесь от кирпича» . NVIDIA .
- ↑ Перейти обратно: Перейти обратно: а б «Статьи о GeForce, руководства, игровые новости, избранные истории» . www.nvidia.com .
- ^ «Как Maxwell VR Direct приближает игры в виртуальной реальности к реальности» . Официальный блог NVIDIA .
- ↑ Перейти обратно: Перейти обратно: а б Райан Смит. «Дисплей имеет значение: HDMI 2.0, HEVC и VR Direct — обзор NVIDIA GeForce GTX 980: Maxwell Mark 2» .
- ^ «Многокадровое выборочное сглаживание обеспечивает лучшую производительность для геймеров Maxwell» . www.nvidia.com .
- ^ «Новые чипы nVidia Maxwell не поддерживают быстрое CSAA» .
- ^ «Видеокарты и ноутбуки серии GeForce RTX 20» . NVIDIA .
- ^ Райан Смит. «Обзор NVIDIA GeForce GTX 980: Maxwell Mark 2» .
- ↑ Перейти обратно: Перейти обратно: а б с Райан Смит. «Архитектура Maxwell 2: представляем GM204 — обзор NVIDIA GeForce GTX 980: Maxwell Mark 2» .
- ^ «Вот еще одна причина, по которой GeForce GTX 970 медленнее, чем GTX 980» . Технический отчет .
- ^ «Maxwell: самый продвинутый графический процессор CUDA из когда-либо созданных» . Параллельный Форалл . 19 сентября 2014 г.
- ^ Джеффри Тим (3 декабря 2015 г.). «У Nvidia GTX970 довольно серьезная ошибка распределения памяти» . Lazygamer.net .
- ↑ Перейти обратно: Перейти обратно: а б с д Райан Смит. «Погружение глубже: перемычка памяти Maxwell 2 и разделы ROP — GeForce GTX 970: исправление характеристик и исследование распределения памяти» .
- ^ Смит, Райан (17 марта 2015 г.). «Обзор NVIDIA GeForce GTX Titan X» . АнандТех . п. 2 . Проверено 6 декабря 2015 г.
...милый родной коэффициент FP64 всего 1/32
- ↑ Перейти обратно: Перейти обратно: а б «NVIDIA обновляет дорожную карту графических процессоров; объявляет о выпуске Pascal» . Официальный блог NVIDIA .