Jump to content

Графическое ядро ​​Далее

(Перенаправлено с AMD Polaris )

Графическое ядро ​​Next ( GCN ) [1] — это кодовое название серии микроархитектур и архитектуры набора команд , которые были разработаны AMD для своих графических процессоров в качестве преемника микроархитектуры TeraScale . Первый продукт с использованием GCN был выпущен 9 января 2012 года. [2]

GCN представляет собой с сокращенным набором команд, микроархитектуру SIMD контрастирующую с архитектурой SIMD с очень длинным командным словом TeraScale. [3] GCN требует значительно больше транзисторов , чем TeraScale, но предлагает преимущества для вычислений на графическом процессоре общего назначения (GPGPU) благодаря более простому компилятору .

Графические чипы GCN были изготовлены с CMOS по техпроцессу 28 нм и с FinFET по техпроцессу 14 нм (от Samsung Electronics и GlobalFoundries ) и 7 нм (от TSMC ), доступные на некоторых моделях AMD Radeon HD 7000 , HD 8000 , 200 , 300 , 400. , 500 и Vega серии видеокарт , включая отдельно выпущенную Radeon VII. GCN также использовался в графической части ускоренных процессоров (APU), в том числе в PlayStation 4 и Xbox One .

Набор инструкций

[ редактировать ]

Набор инструкций GCN принадлежит AMD и был разработан специально для графических процессоров. нем нет микрооперации деления В .

Документация доступна для:

серверная часть компилятора LLVM . Для набора инструкций GCN доступна [5] Он используется Mesa 3D .

GNU Compiler Collection 9 поддерживает GCN 3 и GCN 5 с 2019 года. [6] для однопоточных автономных программ, причем GCC 10 также разгружается через OpenMP и OpenACC . [7]

с открытым исходным кодом MIAOW — это реализация RTL микроархитектуры GPGPU AMD Southern Islands .

В ноябре 2015 года AMD объявила о своей инициативе Больцмана, целью которой является обеспечение возможности переноса приложений на основе CUDA на общую модель программирования C++ . [8]

На мероприятии Super Computing 15 компания AMD представила компилятор гетерогенных вычислений (HCC), автономный Linux драйвер и инфраструктуру времени выполнения HSA для высокопроизводительных вычислений кластерного класса, а также инструмент интерфейса гетерогенных вычислений для переносимости (HIP) для переноса приложений CUDA. к вышеупомянутой общей модели C++.

Микроархитектуры

[ редактировать ]

По состоянию на июль 2017 года набор инструкций Graphics Core Next претерпел пять итераций. Различия между первыми четырьмя поколениями довольно минимальны, но архитектура GCN пятого поколения включает сильно модифицированные потоковые процессоры для повышения производительности и поддержки одновременной обработки двух чисел более низкой точности вместо одного числа более высокой точности. [9]

Обработка команд

[ редактировать ]
Обработка команд GCN: каждая асинхронная вычислительная машина (ACE) может анализировать входящие команды и передавать работу вычислительным блокам (CU). Каждый ACE может управлять до 8 независимыми очередями. ACE могут работать параллельно с процессором графических команд и двумя механизмами DMA. Графический командный процессор обрабатывает графические очереди, ACE обрабатывает очереди вычислений, а механизмы DMA обрабатывают очереди копирования. Каждая очередь может отправлять рабочие элементы, не дожидаясь завершения других задач, позволяя чередовать независимые потоки команд в шейдере графического процессора.

Графический командный процессор

[ редактировать ]

Процессор графических команд (GCP) — это функциональный блок микроархитектуры GCN. Помимо прочих задач, он отвечает за обработку асинхронных шейдеров . [10]

Асинхронная вычислительная машина

[ редактировать ]

Асинхронный вычислительный механизм (ACE) — это отдельный функциональный блок, обслуживающий вычислительные цели, назначение которого аналогично назначению процессора графических команд. [ двусмысленный ]

Планировщики

[ редактировать ]

Начиная с третьей итерации GCN, аппаратное обеспечение содержит два планировщика : один для планирования «волновых фронтов» во время выполнения шейдера (планировщик CU или планировщик вычислительных блоков), а другой для планирования выполнения очередей отрисовки и вычислений. Последнее повышает производительность за счет выполнения вычислительных операций, когда вычислительные блоки (CU) используются недостаточно из-за графических команд, ограниченных скоростью или пропускной способностью конвейера фиксированных функций. Эта функция известна как асинхронные вычисления.

Для данного шейдера драйверы графического процессора также могут планировать выполнение инструкций ЦП, чтобы минимизировать задержку.

Геометрический процессор

[ редактировать ]
Геометрический процессор

Геометрический процессор содержит ассемблер геометрии, тесселятор и ассемблер вершин.

Tesselator способен выполнять тесселяцию аппаратно, как это определено Direct3D 11 и OpenGL 4.5 (см. AMD 21 января 2017 г.). [11] и пришел на смену ATI TruForm AMD и аппаратной тесселяции в TeraScale в качестве новейшего на тот момент полупроводникового ядра интеллектуальной собственности .

Вычислительные единицы

[ редактировать ]

Один вычислительный блок (CU) объединяет 64 шейдерных процессора с 4 блоками отображения текстур (TMU). [12] [13] Вычислительные блоки отделены от блоков вывода рендеринга (ROP), но входят в них. [13] Каждый вычислительный блок состоит из:

Четыре вычислительных блока подключены к совместному использованию кэша инструкций L1 объемом 16 КБ и кэша данных L1 объемом 32 КБ, оба из которых доступны только для чтения. SIMD-VU работает с 16 элементами одновременно (за цикл), а SU может работать с одним элементом за раз (один за цикл). Кроме того, SU выполняет некоторые другие операции, например ветвление. [15]

Каждый SIMD-VU имеет некоторую частную память, в которой хранятся его регистры. Существует два типа регистров: скалярные регистры (S0, S1 и т. д.), каждый из которых содержит 4-байтовые числа, и векторные регистры (V0, V1 и т. д.), каждый из которых представляет собой набор из 64 4-байтовых чисел. В векторных регистрах каждая операция выполняется параллельно с 64 числами. которые соответствуют 64 входам. Например, он может работать с 64 разными пикселями одновременно (для каждого из них входные данные немного отличаются, и поэтому в конце вы получаете немного другой цвет).

В каждом SIMD-VU есть место для 512 скалярных регистров и 256 векторных регистров.

AMD утверждает, что каждый вычислительный блок GCN (CU) имеет 64 КиБ локального ресурса данных (LDS). [16]

С планировщиком

[ редактировать ]

Планировщик CU — это аппаратный функциональный блок, выбирающий, какие волновые фронты будут выполнять SIMD-VU. Для планирования он выбирает один SIMD-VU за цикл. Его не следует путать с другими аппаратными или программными планировщиками.

Волновой фронт

[ редактировать ]

Шейдер — это небольшая программа, написанная на GLSL и выполняющая обработку графики, а ядро ​​— это небольшая программа, написанная на OpenCL и выполняющая обработку GPGPU. Этим процессам не требуется так много регистров, но им необходимо загружать данные из системной или графической памяти. Эта операция сопровождается значительной задержкой. AMD и Nvidia выбрали схожие подходы, чтобы скрыть эту неизбежную задержку: группировку нескольких потоков . AMD называет такую ​​группу «волновым фронтом», тогда как Nvidia называет ее «варпом». Группа потоков — это базовая единица планирования графических процессоров, реализующих этот подход для сокрытия задержки. Это минимальный размер данных, обрабатываемых способом SIMD, наименьшая исполняемая единица кода и способ одновременной обработки одной инструкции во всех ее потоках.

Во всех графических процессорах GCN «волновой фронт» состоит из 64 потоков, а во всех графических процессорах Nvidia «варп» состоит из 32 потоков.

Решение AMD состоит в том, чтобы приписать каждому SIMD-VU несколько волновых фронтов. Аппаратное обеспечение распределяет регистры по разным волновым фронтам, и когда один волновой фронт ожидает какого-то результата, который находится в памяти, планировщик CU назначает SIMD-VU другой волновой фронт. Волновые фронты приписываются согласно SIMD-VU. SIMD-VU не обмениваются волновыми фронтами. К одному SIMD-VU можно отнести максимум 10 волновых фронтов (таким образом, 40 на каждый CU).

AMD CodeXL показывает таблицы с соотношением количества SGPR и VGPR к количеству волновых фронтов, но по существу для SGPRS оно составляет от 104 до 512 на количество волновых фронтов, а для VGPRS — 256 на количество волновых фронтов.

Обратите внимание, что в сочетании с инструкциями SSE эту концепцию самого базового уровня параллелизма часто называют «шириной вектора». Ширина вектора характеризуется общим количеством бит в нем.

Векторный блок SIMD

[ редактировать ]

Каждый векторный модуль SIMD имеет:

Каждый SIMD-VU имеет 10 буферов команд волнового фронта, и для выполнения одного волнового фронта требуется 4 цикла.

Блоки ускорения аудио и видео

[ редактировать ]

Многие реализации GCN обычно сопровождаются несколькими другими блоками ASIC AMD . Включая, помимо прочего, Unified Video Decoder , Video Coding Engine и AMD TrueAudio .

Механизм кодирования видео

[ редактировать ]

Video Coding Engine — это для кодирования видео ASIC , впервые представленный в серии Radeon HD 7000 . [17]

В исходной версии VCE добавлена ​​поддержка кодирования I и P-кадров H.264 в формате пикселей YUV420 , а также временное кодирование SVE и режим кодирования дисплея, а во второй версии добавлена ​​поддержка B-кадров для I-кадров YUV420 и YUV444.

VCE 3.0 стал частью третьего поколения GCN, добавив в него высококачественное масштабирование видео и кодек HEVC (H.265).

VCE 4.0 был частью архитектуры Vega, на смену которому впоследствии пришла Video Core Next .

Единая виртуальная память

[ редактировать ]

В превью 2011 года AnandTech писала об унифицированной виртуальной памяти, поддерживаемой Graphics Core Next. [18]

Гетерогенная системная архитектура (HSA)

[ редактировать ]
GCN включает функциональные блоки специального назначения, которые будут использоваться HSA. Поддержка этих функциональных блоков доступна через amdkfd, начиная с ядра Linux 3.19. [20]

Некоторые из конкретных функций HSA операционной системы , реализованных в аппаратном обеспечении, требуют поддержки со стороны ядра (ее подсистем) и/или со стороны конкретных драйверов устройств. Например, в июле 2014 года AMD опубликовала набор из 83 патчей, которые будут объединены в основную версию ядра Linux на базе Graphics Core Next Radeon 3.17 для поддержки своих видеокарт . Так называемый драйвер ядра HSA находится в каталоге /drivers/gpu/hsa , а драйверы графических устройств DRM находятся в /drivers/gpu/drm [21] и дополнить уже существующие драйверы DRM для карт Radeon. [22] Эта самая первая реализация ориентирована на один APU «Kaveri» и работает вместе с существующим графическим драйвером ядра Radeon (kgd).

Сжатие дельта-цветов без потерь

[ редактировать ]

Аппаратные планировщики

[ редактировать ]

Аппаратные планировщики используются для выполнения планирования. [23] и перегрузить назначение очередей вычислений ACE с драйвера на оборудование, буферизуя эти очереди до тех пор, пока не появится хотя бы одна пустая очередь хотя бы в одном ACE. Это приводит к тому, что HWS немедленно назначает буферизованные очереди ACE до тех пор, пока все очереди не заполнятся или не останется очередей, которые можно было бы безопасно назначить. [24]

Часть выполняемой работы по планированию включает очереди с приоритетом, которые позволяют критическим задачам выполняться с более высоким приоритетом, чем другие задачи, не требуя вытеснения задач с более низким приоритетом для запуска задачи с высоким приоритетом, что позволяет задачам выполняться одновременно с задачами с высоким приоритетом. запланировано максимально загружать графический процессор, позволяя другим задачам использовать ресурсы, которые не используют задачи с высоким приоритетом. [23] По сути, это асинхронные вычислительные машины, в которых отсутствуют диспетчерские контроллеры. [23] Впервые они были представлены в микроархитектуре GCN четвертого поколения. [23] но присутствовали в микроархитектуре GCN третьего поколения для целей внутреннего тестирования. [25] Обновление драйвера позволило использовать аппаратные планировщики в деталях GCN третьего поколения для производственного использования. [23]

Примитивный ускоритель сброса

[ редактировать ]

Этот модуль отбрасывает вырожденные треугольники до того, как они войдут в вершинный шейдер, и треугольники, которые не покрывают какие-либо фрагменты, прежде чем они войдут во фрагментный шейдер. [26] Это устройство было представлено с микроархитектурой GCN четвертого поколения. [26]

Поколения

[ редактировать ]

Графическое ядро ​​Далее 1

[ редактировать ]
Графическое ядро ​​AMD Next 1
Дата выпуска январь 2012 г .; 12 лет назад ( январь 2012 ) [ нужна ссылка ]
История
Предшественник ТераСкейл 3
Преемник Графическое ядро ​​Next 2
Статус поддержки
Не поддерживается

Микроархитектура GCN 1 использовалась в нескольких серии Radeon HD 7000 видеокартах .

Снимок графического процессора Tahiti, используемого в видеокартах Radeon HD 7950 ГГц Edition

Существуют асинхронные вычислительные машины, управляющие вычислениями и диспетчеризацией. [15] [30]

Нулевая мощность ядра

[ редактировать ]

ZeroCore Power — это технология энергосбережения при длительном простое, отключающая функциональные блоки графического процессора, когда он не используется. [31] Технология AMD ZeroCore Power дополняет AMD PowerTune .

Дискретные графические процессоры (семейство Южных островов):

  • Хайнань
  • Голландия
  • Кабо-Верде
  • Питкэрн
  • Таити

Графическое ядро ​​Next 2

[ редактировать ]
Графическое ядро ​​AMD Next 2
Дата выпуска сентябрь 2013 г .; 10 лет назад ( сентябрь 2013 ) [ нужна ссылка ]
История
Предшественник Графическое ядро ​​Далее 1
Преемник Графическое ядро ​​Next 3
Статус поддержки
Не поддерживается
AMD PowerTune «Бонэйр»
Снимок графического процессора Hawaii, используемого в видеокартах Radeon R9 290

Второе поколение GCN было представлено в Radeon HD 7790 , а также встречается в Radeon HD 8770 , R7 260/260X, R9 290/290X, R9 295X2 , R7 360 и R9 390/390X , а также в Steamroller. моделях на базе настольные APU «Kaveri» и мобильные APU «Kaveri» , а также Puma на базе APU «Beema» и «Mullins» . Он имеет множество преимуществ по сравнению с исходным GCN, включая поддержку FreeSync , AMD TrueAudio и обновленную версию технологии AMD PowerTune .

GCN 2-го поколения представил объект под названием «Shader Engine» (SE). Shader Engine включает в себя один геометрический процессор, до 44 CU (чип Hawaii), растеризаторы, ROP и кэш L1. В состав шейдерного механизма не входят процессор графических команд, 8 ACE, контроллеры кэша и памяти L2, а также аудио- и видеоускорители, контроллеры дисплея, 2 контроллера DMA и интерфейс PCIe .

A10-7850K «Kaveri» содержит 8 CU (вычислительных блоков) и 8 асинхронных вычислительных механизмов для независимого планирования и диспетчеризации рабочих элементов. [32]

На саммите разработчиков AMD (APU) в ноябре 2013 года Майкл Мантор представил Radeon R9 290X . [33]

Дискретные графические процессоры (семейство Sea Islands):

  • Бонайре
  • Гавайи

интегрированы в APU:

  • темы
  • дважды
  • Liverpool (то есть APU, установленный в PlayStation 4)
  • Durango (т. е. APU, установленный в Xbox One и Xbox One S)
  • Парень
  • Годавари
  • Маллинз
  • Бима
  • Карризо-Л

Графическое ядро ​​Next 3

[ редактировать ]
Графическое ядро ​​AMD Next 3
Дата выпуска июнь 2015 г .; 9 лет назад ( июнь 2015 ) [ нужна ссылка ]
История
Предшественник Графическое ядро ​​Next 2
Преемник Графическое ядро ​​Next 4
Снимок графического процессора Fiji, используемого в видеокартах Radeon R9 Nano

ГЦН 3-го поколения [34] был представлен в 2014 году вместе с Radeon R9 285 и R9 M295X с графическим процессором Tonga. Он отличается улучшенной производительностью тесселяции, дельта-сжатием цвета без потерь для уменьшения использования полосы пропускания памяти, обновленным и более эффективным набором команд, новым высококачественным масштабатором видео, кодированием HEVC (VCE 3.0) и декодированием HEVC (UVD 6.0), а также новым мультимедийным интерфейсом. движок (видеокодер/декодер). Сжатие дельта-цвета поддерживается в Mesa. [35] Однако его производительность двойной точности хуже по сравнению с предыдущим поколением. [36]

дискретные графические процессоры:

интегрированы в APU:

  • Карризо поставляется с UVD 6.0.
  • Бристоль Ридж [37]
  • Стони Ридж [37]

Графическое ядро ​​Next 4

[ редактировать ]
Графическое ядро ​​AMD Next 4
Дата выпуска июнь 2016 г .; 8 лет назад ( июнь 2016 ) [ нужна ссылка ]
История
Предшественник Графическое ядро ​​Next 3
Преемник Графическое ядро ​​Next 5
Статус поддержки
Поддерживается
Снимок графического процессора Polaris 11, используемого в видеокартах Radeon RX 460.
Снимок графического процессора Polaris 10, используемого в видеокартах Radeon RX 470.

Графические процессоры семейства Arctic Islands были представлены во втором квартале 2016 года с серией AMD Radeon 400 . 3D-движок (т.е. GCA (графический и вычислительный массив) или GFX) идентичен тому, который используется в чипах Tonga. [38] Но в Polaris используется более новый движок Display Controller, UVD версии 6.3 и т. д.

Все чипы на базе Polaris, кроме Polaris 30, производятся по 14-нм техпроцессу FinFET , разработанному Samsung Electronics и лицензированному GlobalFoundries . [39] Немного более новый, обновленный Polaris 30 построен на 12-нм техпроцессе LP FinFET, разработанном Samsung и GlobalFoundries. Архитектура набора команд GCN четвертого поколения совместима с третьим поколением. Это оптимизация 14-нм техпроцесса FinFET, обеспечивающая более высокие тактовые частоты графического процессора, чем в третьем поколении GCN. [40] Архитектурные улучшения включают новые аппаратные планировщики, новый ускоритель отбрасывания примитивов, новый контроллер дисплея и обновленный UVD, который может декодировать HEVC с разрешением 4K со скоростью 60 кадров в секунду и 10 битами на цветовой канал.

дискретные графические процессоры: [41]

  • Polaris 10 (также под кодовым названием Ellesmere ), установленный на видеокартах Radeon RX 470 и Radeon RX 480.
  • Polaris 11 (также под кодовым названием Baffin ), установленный на видеокартах марки Radeon RX 460 (также Radeon RX 560 D ).
  • Polaris 12 (также под кодовым названием Lexa), установленный на видеокартах Radeon RX 550 и Radeon RX 540.
  • Polaris 20, представляющий собой обновленный процесс ( 14 нм LPP Samsung / GloFo FinFET ) Polaris 10 с более высокими тактовыми частотами, используемый для видеокарт марок Radeon RX 570 и Radeon RX 580. [42]
  • Polaris 21, представляющий собой обновленную (14 нм техпроцесс LPP Samsung/GloFo FinFET) Polaris 11, используемый для видеокарт марки Radeon RX 560.
  • Polaris 22, установленный на видеокартах Radeon RX Vega M GH и Radeon RX Vega M GL (в составе Kaby Lake-G ).
  • Polaris 23, представляющий собой обновленную (14 нм техпроцесс LPP Samsung/GloFo FinFET) Polaris 12, используемый для видеокарт под марками Radeon Pro WX 3200 и Radeon RX 540X (также Radeon RX 640). [43]
  • Polaris 30, представляющий собой обновленный ( 12-нм техпроцесс LP GloFo FinFET) Polaris 20 с более высокими тактовыми частотами, используемый для видеокарт марки Radeon RX 590. [44]

Помимо выделенных графических процессоров, Polaris используется в APU PlayStation 4 Pro и Xbox One X под названием «Neo» и «Scorpio» соответственно.

Точность производительности

[ редактировать ]

Производительность FP64 всех графических процессоров GCN 4-го поколения составляет 1 / 16 показателей FP32.

Графическое ядро ​​Next 5

[ редактировать ]
Графическое ядро ​​AMD Next 5
Дата выпуска июнь 2017 г .; 7 лет назад ( июнь 2017 ) [ нужна ссылка ]
История
Предшественник Графическое ядро ​​Next 4
Преемник РДНА 1
Статус поддержки
Поддерживается
Снимок графического процессора Vega 10, используемого в видеокартах Radeon RX Vega 64.

AMD начала публиковать подробную информацию о своем следующем поколении архитектуры GCN, получившем название «Вычислительный блок следующего поколения», в январе 2017 года. [40] [45] [46] Ожидалось, что новый дизайн увеличит число команд за такт , увеличит тактовую частоту , поддержит HBM2 и увеличит адресное пространство памяти . Наборы микросхем дискретной графики также включают «HBCC (контроллер кэша с высокой пропускной способностью)», но не при интеграции в APU. [47] Кроме того, ожидалось, что новые чипы будут включать улучшения в блоках вывода растеризации и рендеринга . Потоковые процессоры сильно модифицированы по сравнению с предыдущими поколениями для поддержки технологии пакетных математических вычислений Rapid Pack Math для 8-битных, 16-битных и 32-битных чисел. При этом возникает значительное преимущество в производительности, когда допустима более низкая точность (например: обработка двух чисел половинной точности с той же скоростью, что и одного числа одинарной точности ).

Nvidia представила тайловую растеризацию и биннинг с помощью Maxwell . [48] и это стало важной причиной повышения эффективности Максвелла. В январе AnandTech предположила, что Vega наконец догонит Nvidia в вопросах оптимизации энергоэффективности благодаря новому «DSBR (Draw Stream Binning Rasterizer)», который будет представлен вместе с Vega. [49]

Также добавлена ​​поддержка нового этапа шейдеров — Primitive Shaders. [50] [51] Примитивные шейдеры обеспечивают более гибкую обработку геометрии и заменяют вершинные и геометрические шейдеры в конвейере рендеринга. По состоянию на декабрь 2018 года шейдеры Primitive нельзя использовать, поскольку необходимые изменения API еще не внесены. [52]

Vega 10 и Vega 12 используют 14-нм техпроцесс FinFET , разработанный Samsung Electronics и лицензированный GlobalFoundries . Vega 20 использует 7-нм техпроцесс FinFET, разработанный TSMC .

дискретные графические процессоры:

интегрированы в APU:

  • Рэйвен Ридж [58] поставляется с VCN 1, который заменяет VCE и UVD и обеспечивает полное декодирование VP9 с фиксированными функциями.
  • Пикассо
  • Ренуар
  • Сезанн

Точность производительности

[ редактировать ]

Производительность операций с плавающей запятой двойной точности (FP64) всех графических процессоров GCN 5-го поколения, за исключением Vega 20, составляет одну шестнадцатую производительности FP32. Для Vega 20 с Radeon Instinct это половина производительности FP32. Для Vega 20 с Radeon VII это четверть производительности FP32. [59] Все графические процессоры GCN 5-го поколения поддерживают вычисления с плавающей запятой половинной точности (FP16), что вдвое превышает производительность FP32.

Сравнение графических процессоров GCN

[ редактировать ]
  • В таблице представлены только дискретные графические процессоры (в том числе мобильные). APU(IGP) и консольные SoC не указаны.
Микроархитектура [60] ГЦН 1 ГЦН 2 ГЦН 3 ГЦН 4 ГЦН 5
Таити [61] Питкэрн [62] Кабо-Верде [63] Голландия [64] Хайнань [65] Бонайре [66] Гавайи [67] Топаз [68] Приехал [69] Фиджи [70] Элсмир [71] Баффин [72] Лекса [73] Вега 10 [74] Вега 12 [75] Вега 20 [76]
Кодовое имя 1 ? ? ? Число ? ? Ибица Исландия ? ? Полярис 10 Полярис 11 Полярис 12 Гренландия Обновление сокровищ Лунный выстрел
Вариант(ы) Новая Зеландия
Мальта
Уимблдон
Кюрасао
Нептун
Тринидад
Челси
Хитроу
Венера
Троп
Марс
Опал
Члены
Солнце
Джет
Экзо
Банки
Сатурн
Тобаго
Слой
Изумруд
Везувий
Гренада
Мясо
Уэстон
Полярис 24
Аметист
Антигуа
Капсаицин Полярис 20
Полярис 30
Полярис 21 Полярис 23
Потрясающе TSMC 28 нм GlobalFoundries 14 нм / 12 нм (Polaris 30) TSMC 7 нм
Размер матрицы (мм 2 ) 352/365 (Мальта) 212 123 77 56 160 438 125 366 596 232 123 103 495 Un­known 331
Транзисторы (млн) 4,313 2,800 1,500 950 690 2,080 6,200 1,550 5,000 8,900 5,700 3,000 2,200 12,500 Un­known 13,230
Плотность транзисторов (МТР/мм 2 ) 12,3 / 12,8 (Мальта) 13.2 12.2 12.3 13.0 14.2 12.4 13.7 14.9 24.6 24.4 21.4 25.3 Un­known 40.0
Асинхронные вычислительные механизмы 2 8 ? 8 4 ? 4
Геометрические двигатели 2 1 2 ? 4 ? 4
Шейдерные движки 4 ? 4 2
Аппаратные планировщики 2 ? 2
Вычислительные единицы 32 20 10 / 8 (Челси) 6 5 / 6 (Джет) 14 44 6 32 64 36 16 10 64 20 64
Потоковые процессоры 2048 1280 640/512 (Челси) 384 320/384 (Джет) 896 2816 384 2048 4096 2304 1024 640 4096 1280 4096
Единицы наложения текстур 128 80 40/32 (Челси) 24 20 / 24 (Джет) 56 176 24 128 256 144 64 40 256 80 256
Единицы вывода рендеринга 32 16 8 16 64 8 32 64 32 16 64 32 64
Z/Трафарет ОПС 128 64 16 64 256 16 128 256
L1 Кэш (КБ) 16 на вычислительный блок (CU)
Кэш L2 (КБ) 768 512 256 128/256 (Реактивный) 256 1024 256 768 2048 1024 512 4096 1024 4096
Основной движок дисплея 6.0 6.4 8.2 8.5 10.0 11.2 12.0 12.1
Единый видеодекодер 3.2 4.0 4.2 5.0 6.0 6.3 7.0 7.2
Механизм кодирования видео 1.0 2.0 3.0 3.4 4.0 4.1
Запуск 2 декабрь 2011 г. март 2012 г. февраль 2012 г. январь 2013 г. май 2015 г. март 2013 г. октябрь 2013 г. 2014 август 2014 г. июнь 2015 г. июнь 2016 г. август 2016 г. апрель 2017 г. июнь 2017 г. ноябрь 2018 г. ноябрь 2018 г.
Серия (Семейный) Южные острова Морские острова Вулканические острова Пиратские острова Арктические острова Вега Вега II
Примечания мобильный/ОЕМ мобильный/ОЕМ мобильный

1 Старые кодовые названия, такие как Treasure (Lexa) или Hawaii Refresh (Ellesmere), не указаны.
2 Дата первоначального запуска. Даты запуска вариантов чипов, таких как Polaris 20 (апрель 2017 г.), не указаны.

См. также

[ редактировать ]
[ редактировать ]
  1. ^ AMD Developer Central (31 января 2014 г.). «GS-4106 Архитектура AMD GCN — ускоренный курс, Лейла Мах» . Slideshare.net .
  2. ^ «AMD выпускает самую быструю в мире однопроцессорную видеокарту — AMD Radeon HD 7970» (пресс-релиз). АМД. 22 декабря 2011. Архивировано из оригинала 20 января 2015 года . Проверено 20 января 2015 г.
  3. ^ Гулати, Абхик (11 ноября 2019 г.). «Глубокое погружение в архитектуру графических процессоров AMD TeraScale, GCN и RDNA» . Середина . Проверено 12 декабря 2021 г.
  4. ^ «Форумы сообщества AMD» . Сообщество.amd.com . 15 июля 2016 г.
  5. ^ «Безопасная часть LLVM amdgpu» . Llvm.org .
  6. ^ «Изменения, новые функции и исправления серии выпусков GCC 9» . Проверено 13 ноября 2019 г.
  7. ^ «Поддержка разгрузки AMD GCN» . Проверено 13 ноября 2019 г.
  8. ^ «Инициатива AMD Больцмана — интерфейс гетерогенных вычислений для портативности (HIP)» . 16 ноября 2015 года. Архивировано из оригинала 26 января 2016 года . Проверено 8 декабря 2019 г.
  9. ^ Смит, Райан (5 января 2017 г.). «Обзор архитектуры графического процессора AMD Vega» . Anandtech.com . Проверено 11 июля 2017 г.
  10. ^ Смит, Райан. «AMD углубляется в асинхронное шейдинг» . Anandtech.com .
  11. ^ «Соответствующая продукция» . Хронос.орг . 26 октября 2017 г.
  12. ^ Технический документ о вычислительных ядрах (PDF) . АМД. 2014. с. 5.
  13. ^ Jump up to: а б Смит, Райан (21 декабря 2011 г.). «Следующий обзор графического ядра AMD» . Anandtech.com . Проверено 18 апреля 2017 г.
  14. ^ «Архитектура AMD Graphics Core Next (GCN)» (PDF) . TechPowerUp . Проверено 26 февраля 2024 г.
  15. ^ Jump up to: а б Мантор, Майкл; Хьюстон, Майк (15 июня 2011 г.). «AMD Graphics Core Next» (PDF) . АМД . п. 40 . Проверено 15 июля 2014 г. Асинхронная вычислительная машина (ACE)
  16. ^ «Оптимизация загрузки графического процессора и использования ресурсов с помощью больших групп потоков» . AMD GPUОткрыть . Проверено 1 января 2024 г.
  17. ^ «Информационный документ AMD UnifiedVideoDecoder (UVD)» (PDF) . 15 июня 2012 года . Проверено 20 мая 2017 г.
  18. ^ Jump up to: а б «Не только новая архитектура, но и новые возможности» . АнандТех . 21 декабря 2011 года . Проверено 11 июля 2014 г.
  19. ^ «Микроархитектура Кавери» . Полуточный . 15 января 2014 г.
  20. ^ Эйрли, Дэйв (26 ноября 2014 г.). «Объединить АМДКФД» . сайт freedesktop.org . Проверено 21 января 2015 г.
  21. ^ "/drivers/gpu/drm" . Кернел.орг .
  22. ^ «[ИСПРАВЛЕНИЕ 00/83] Драйвер ядра AMD HSA» . ЛКМЛ . 10 июля 2014 года . Проверено 11 июля 2014 г.
  23. ^ Jump up to: а б с д и Анджелини, Крис (29 июня 2016 г.). «Обзор AMD Radeon RX 480 8 ГБ» . Аппаратное обеспечение Тома . п. 1 . Проверено 11 августа 2016 г.
  24. ^ «Анализ архитектуры Полярной звезды» (PDF) . 2016. Архивировано из оригинала (PDF) 20 сентября 2016 года . Проверено 12 августа 2016 г.
  25. ^ Шраут, Райан (29 июня 2016 г.). «Обзор AMD Radeon RX 480 — обещание Polaris» . Перспектива ПК . п. 2. Архивировано из оригинала 10 октября 2016 года . Проверено 12 августа 2016 г.
  26. ^ Jump up to: а б Смит, Райан (29 июня 2016 г.). «Предварительный обзор AMD Radeon RX 480: Polaris становится популярным» . АнандТех . п. 3 . Проверено 11 августа 2016 г.
  27. ^ «Серия AMD Radeon HD 7000 будет совместима с PCI-Express 3.0» . TechPowerUp . Проверено 21 июля 2011 г.
  28. ^ «AMD подробно описывает архитектуру графического процессора следующего поколения» . Проверено 3 августа 2011 г.
  29. ^ Тони Чен; Джейсон Гривз, «Архитектура AMD Graphics Core Next (GCN)» (PDF) , AMD , заархивировано из оригинала (PDF) 18 января 2023 г. , получено 13 августа 2016 г.
  30. ^ «Следующий обзор графического ядра AMD: новый графический процессор AMD, созданный для вычислений» . АнандТех . 21 декабря 2011 года . Проверено 15 июля 2014 г. Новые асинхронные вычислительные механизмы AMD служат командными процессорами для вычислительных операций в GCN. Основная цель ACE будет заключаться в приеме работы и отправке ее в CU для обработки.
  31. ^ «Управление энергопотреблением в режиме ожидания: введение ZeroCore Power» . AnandTech.com . 22 декабря 2011 года . Проверено 29 апреля 2015 г.
  32. ^ «Протестировано AMD Kaveri A10-7850K» . АнандТех . 14 января 2014 года . Проверено 7 июля 2014 г.
  33. ^ «АМД Радеон Р9-290Х» . 21 ноября 2013 г.
  34. ^ «Обзор Карризо» (PNG) . Images.anandtech.com . Проверено 20 июля 2018 г.
  35. ^ «Добавить поддержку DCC» . Freedesktop.org . 11 октября 2015 г.
  36. ^ Смит, Райан (10 сентября 2014 г.). «Обзор AMD Radeon R9 285» . Anandtech.com . Проверено 13 марта 2017 г.
  37. ^ Jump up to: а б Катресс, Ян (1 июня 2016 г.). «AMD анонсирует APU 7-го поколения» . Anandtech.com . Проверено 1 июня 2016 г.
  38. ^ «Функция Радеон» . www.x.org .
  39. ^ «Группа Radeon Technologies – январь 2016 г. – Архитектура AMD Polaris» . Guru3d.com .
  40. ^ Jump up to: а б Смит, Райан (5 января 2017 г.). «Тизер архитектуры AMD Vega: более высокий IPC, тайлинг и многое другое, выйдет в первом полугодии 2017 года» . Anandtech.com . Проверено 10 января 2017 г.
  41. ^ WhyCry (24 марта 2016 г.). «AMD подтверждает, что Polaris 10 — это Элсмир, а Polaris 11 — это Баффин» . ВидеоКардз . Проверено 8 апреля 2016 г.
  42. ^ «Утечка почти полных аппаратных характеристик серии AMD Radeon RX 500» . www.3dcenter.org .
  43. ^ «АМД Поларис 23» . TechPowerUp . Проверено 12 мая 2022 г.
  44. ^ О, Нейт (15 ноября 2018 г.). «Обзор AMD Radeon RX 590 с участием XFX и PowerColor: Polaris возвращается (снова)» . anandtech.com . Проверено 24 ноября 2018 г.
  45. ^ Кампман, Джефф (5 января 2017 г.). «Занавес поднимается над архитектурой AMD Vega» . TechReport.com . Проверено 10 января 2017 г.
  46. ^ Шраут, Райан (5 января 2017 г.). «Предварительный обзор архитектуры графического процессора AMD Vega: обновленная архитектура памяти» . Перспектива ПК . Проверено 10 января 2017 г.
  47. ^ Кампман, Джефф (26 октября 2017 г.). «Представлены APU AMD Ryzen 7 2700U и Ryzen 5 2500U» . Techreport.com . Проверено 26 октября 2017 г.
  48. ^ Рэйвенлорд (1 марта 2017 г.). «О тайловом рендеринге NVIDIA» . techPowerUp .
  49. ^ «Vega Teaser: растеризатор биннинга потоков рисования» . Anandtech.com .
  50. ^ «Анализ Radeon RX Vega: AMD обещает игровую производительность в разрешении 4K за 499 долларов — надежные обзоры» . Trustedreviews.com . 31 июля 2017. Архивировано из оригинала 14 июля 2017 года . Проверено 20 марта 2017 г.
  51. ^ «Занавес поднимается над архитектурой AMD Vega» . Techreport.com . Архивировано из оригинала 1 сентября 2017 года . Проверено 20 марта 2017 г.
  52. ^ Кампман, Джефф (23 января 2018 г.). «Примитивным шейдерам Radeon RX Vega потребуется поддержка API» . Techreport.com . Проверено 29 декабря 2018 г.
  53. ^ «ROCm-OpenCL-Runtime/libUtils.cpp в мастере · RadeonOpenCompute/ROCm-OpenCL-Runtime» . github.com . 3 мая 2017 г. Проверено 10 ноября 2018 г.
  54. ^ «Обзор AMD Radeon RX Vega 64 и RX Vega 56: Vega Burning Bright» . Anandtech.com . 14 августа 2017 г. Проверено 16 ноября 2017 г.
  55. ^ «Мобильная версия Vega от AMD: Vega Pro 20 и 16 в обновленных MacBook Pro в ноябре» . Anandtech.com . 30 октября 2018 г. . Проверено 10 ноября 2018 г.
  56. ^ «AMD анонсирует ускорители Radeon Instinct MI60 и MI50: на базе 7-нм техпроцесса Vega» . Anandtech.com . 6 ноября 2018 г. . Проверено 10 ноября 2018 г.
  57. ^ «AMD представляет первый в мире игровой графический процессор, изготовленный по 7-нм техпроцессу: исключительная производительность и невероятные впечатления для геймеров, авторов и энтузиастов» (пресс-релиз). Лас-Вегас, Невада: AMD. 9 января 2019 года . Проверено 12 января 2019 г.
  58. ^ Феррейра, Бруно (16 мая 2017 г.). «Мобильные APU Ryzen появятся на ноутбуке рядом с вами» . Технический отчет . Проверено 16 мая 2017 г.
  59. ^ «AMD представляет первые в мире 7-нм графические процессоры для центров обработки данных – основа новой эры искусственного интеллекта, облачных вычислений и высокопроизводительных вычислений (HPC) | AMD» . AMD.com (пресс-релиз). 6 ноября 2018 г. . Проверено 10 ноября 2018 г.
  60. ^ «Функция Радеон» . х.Орг . Проверено 21 ноября 2022 г.
  61. ^ «Характеристики графического процессора AMD Tahiti» . TechPowerUp . Проверено 20 ноября 2022 г.
  62. ^ «Характеристики графического процессора AMD Pitcairn» . TechPowerUp . Проверено 20 ноября 2022 г.
  63. ^ «Спецификации графического процессора AMD Кабо-Верде» . TechPowerUp . Проверено 20 ноября 2022 г.
  64. ^ «Спецификации графического процессора AMD Oland» . TechPowerUp . Проверено 20 ноября 2022 г.
  65. ^ «Спецификации графического процессора AMD Hainan» . TechPowerUp . Проверено 20 ноября 2022 г.
  66. ^ «Спецификации графического процессора AMD Bonaire» . TechPowerUp . Проверено 21 ноября 2022 г.
  67. ^ «Спецификации графического процессора AMD Hawaii» . TechPowerUp . Проверено 21 ноября 2022 г.
  68. ^ «Характеристики графического процессора AMD Topaz» . TechPowerUp . Проверено 21 ноября 2022 г.
  69. ^ «Характеристики графического процессора AMD Tonga» . TechPowerUp . Проверено 21 ноября 2022 г.
  70. ^ «Спецификации графического процессора AMD Fiji» . TechPowerUp . Проверено 21 ноября 2022 г.
  71. ^ «Спецификации графического процессора AMD Ellesmere» . TechPowerUp . Проверено 21 ноября 2022 г.
  72. ^ «Спецификации графического процессора AMD Baffin» . TechPowerUp . Проверено 21 ноября 2022 г.
  73. ^ «Спецификации графического процессора AMD Lexa» . TechPowerUp . Проверено 21 ноября 2022 г.
  74. ^ «Характеристики графического процессора AMD Vega 10» . TechPowerUp . Проверено 21 ноября 2022 г.
  75. ^ «Характеристики графического процессора AMD Vega 12» . TechPowerUp . Проверено 21 ноября 2022 г.
  76. ^ «Характеристики графического процессора AMD Vega 20» . TechPowerUp . Проверено 21 ноября 2022 г.
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 3d6a1acce1d107de59dd4d12cb2e784b__1718684280
URL1:https://arc.ask3.ru/arc/aa/3d/4b/3d6a1acce1d107de59dd4d12cb2e784b.html
Заголовок, (Title) документа по адресу, URL1:
Graphics Core Next - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)