Графическое ядро Далее
Эта статья предоставляет недостаточный контекст для тех, кто не знаком с предметом . ( Октябрь 2020 г. ) |
Графическое ядро Next ( GCN ) [1] — это кодовое название серии микроархитектур и архитектуры набора команд , которые были разработаны AMD для своих графических процессоров в качестве преемника микроархитектуры TeraScale . Первый продукт с использованием GCN был выпущен 9 января 2012 года. [2]
GCN представляет собой с сокращенным набором команд, микроархитектуру SIMD контрастирующую с архитектурой SIMD с очень длинным командным словом TeraScale. [3] GCN требует значительно больше транзисторов , чем TeraScale, но предлагает преимущества для вычислений на графическом процессоре общего назначения (GPGPU) благодаря более простому компилятору .
Графические чипы GCN были изготовлены с CMOS по техпроцессу 28 нм и с FinFET по техпроцессу 14 нм (от Samsung Electronics и GlobalFoundries ) и 7 нм (от TSMC ), доступные на некоторых моделях AMD Radeon HD 7000 , HD 8000 , 200 , 300 , 400. , 500 и Vega серии видеокарт , включая отдельно выпущенную Radeon VII. GCN также использовался в графической части ускоренных процессоров (APU), в том числе в PlayStation 4 и Xbox One .
Набор инструкций
[ редактировать ]Набор инструкций GCN принадлежит AMD и был разработан специально для графических процессоров. нем нет микрооперации деления В .
Документация доступна для:
- набор инструкций Graphics Core Next 1 ,
- набор инструкций Graphics Core Next 2 ,
- наборы инструкций Graphics Core Next 3 и 4 , [4]
- набор инструкций Graphics Core Next 5 и
- 7-нм архитектура набора команд Vega (также называемая Graphics Core Next 5.1).
серверная часть компилятора LLVM . Для набора инструкций GCN доступна [5] Он используется Mesa 3D .
GNU Compiler Collection 9 поддерживает GCN 3 и GCN 5 с 2019 года. [6] для однопоточных автономных программ, причем GCC 10 также разгружается через OpenMP и OpenACC . [7]
с открытым исходным кодом MIAOW — это реализация RTL микроархитектуры GPGPU AMD Southern Islands .
В ноябре 2015 года AMD объявила о своей инициативе Больцмана, целью которой является обеспечение возможности переноса приложений на основе CUDA на общую модель программирования C++ . [8]
На мероприятии Super Computing 15 компания AMD представила компилятор гетерогенных вычислений (HCC), автономный Linux драйвер и инфраструктуру времени выполнения HSA для высокопроизводительных вычислений кластерного класса, а также инструмент интерфейса гетерогенных вычислений для переносимости (HIP) для переноса приложений CUDA. к вышеупомянутой общей модели C++.
Микроархитектуры
[ редактировать ]По состоянию на июль 2017 года набор инструкций Graphics Core Next претерпел пять итераций. Различия между первыми четырьмя поколениями довольно минимальны, но архитектура GCN пятого поколения включает сильно модифицированные потоковые процессоры для повышения производительности и поддержки одновременной обработки двух чисел более низкой точности вместо одного числа более высокой точности. [9]
Обработка команд
[ редактировать ]Графический командный процессор
[ редактировать ]Процессор графических команд (GCP) — это функциональный блок микроархитектуры GCN. Помимо прочих задач, он отвечает за обработку асинхронных шейдеров . [10]
Асинхронная вычислительная машина
[ редактировать ]Асинхронный вычислительный механизм (ACE) — это отдельный функциональный блок, обслуживающий вычислительные цели, назначение которого аналогично назначению процессора графических команд. [ двусмысленный ]
Планировщики
[ редактировать ]Начиная с третьей итерации GCN, аппаратное обеспечение содержит два планировщика : один для планирования «волновых фронтов» во время выполнения шейдера (планировщик CU или планировщик вычислительных блоков), а другой для планирования выполнения очередей отрисовки и вычислений. Последнее повышает производительность за счет выполнения вычислительных операций, когда вычислительные блоки (CU) используются недостаточно из-за графических команд, ограниченных скоростью или пропускной способностью конвейера фиксированных функций. Эта функция известна как асинхронные вычисления.
Для данного шейдера драйверы графического процессора также могут планировать выполнение инструкций ЦП, чтобы минимизировать задержку.
Геометрический процессор
[ редактировать ]Геометрический процессор содержит ассемблер геометрии, тесселятор и ассемблер вершин.
Tesselator способен выполнять тесселяцию аппаратно, как это определено Direct3D 11 и OpenGL 4.5 (см. AMD 21 января 2017 г.). [11] и пришел на смену ATI TruForm AMD и аппаратной тесселяции в TeraScale в качестве новейшего на тот момент полупроводникового ядра интеллектуальной собственности .
Вычислительные единицы
[ редактировать ]Один вычислительный блок (CU) объединяет 64 шейдерных процессора с 4 блоками отображения текстур (TMU). [12] [13] Вычислительные блоки отделены от блоков вывода рендеринга (ROP), но входят в них. [13] Каждый вычислительный блок состоит из:
- планировщик СО
- Отделение филиалов и сообщений
- 4 16-полосных векторных блока SIMD (SIMD-VU)
- 4 файла векторного регистра общего назначения (VGPR) по 64 КиБ
- 1 скалярная единица (SU)
- размером 8 КиБ скалярный GPR- файл [14]
- доля локальных данных 64 КиБ
- 4 блока текстурных фильтров
- 16 блоков загрузки/сохранения выборки текстур
- уровня 1 (L1) объемом 16 КиБ кэш-память
Четыре вычислительных блока подключены к совместному использованию кэша инструкций L1 объемом 16 КБ и кэша данных L1 объемом 32 КБ, оба из которых доступны только для чтения. SIMD-VU работает с 16 элементами одновременно (за цикл), а SU может работать с одним элементом за раз (один за цикл). Кроме того, SU выполняет некоторые другие операции, например ветвление. [15]
Каждый SIMD-VU имеет некоторую частную память, в которой хранятся его регистры. Существует два типа регистров: скалярные регистры (S0, S1 и т. д.), каждый из которых содержит 4-байтовые числа, и векторные регистры (V0, V1 и т. д.), каждый из которых представляет собой набор из 64 4-байтовых чисел. В векторных регистрах каждая операция выполняется параллельно с 64 числами. которые соответствуют 64 входам. Например, он может работать с 64 разными пикселями одновременно (для каждого из них входные данные немного отличаются, и поэтому в конце вы получаете немного другой цвет).
В каждом SIMD-VU есть место для 512 скалярных регистров и 256 векторных регистров.
AMD утверждает, что каждый вычислительный блок GCN (CU) имеет 64 КиБ локального ресурса данных (LDS). [16]
С планировщиком
[ редактировать ]Планировщик CU — это аппаратный функциональный блок, выбирающий, какие волновые фронты будут выполнять SIMD-VU. Для планирования он выбирает один SIMD-VU за цикл. Его не следует путать с другими аппаратными или программными планировщиками.
Волновой фронт
[ редактировать ]Шейдер — это небольшая программа, написанная на GLSL и выполняющая обработку графики, а ядро — это небольшая программа, написанная на OpenCL и выполняющая обработку GPGPU. Этим процессам не требуется так много регистров, но им необходимо загружать данные из системной или графической памяти. Эта операция сопровождается значительной задержкой. AMD и Nvidia выбрали схожие подходы, чтобы скрыть эту неизбежную задержку: группировку нескольких потоков . AMD называет такую группу «волновым фронтом», тогда как Nvidia называет ее «варпом». Группа потоков — это базовая единица планирования графических процессоров, реализующих этот подход для сокрытия задержки. Это минимальный размер данных, обрабатываемых способом SIMD, наименьшая исполняемая единица кода и способ одновременной обработки одной инструкции во всех ее потоках.
Во всех графических процессорах GCN «волновой фронт» состоит из 64 потоков, а во всех графических процессорах Nvidia «варп» состоит из 32 потоков.
Решение AMD состоит в том, чтобы приписать каждому SIMD-VU несколько волновых фронтов. Аппаратное обеспечение распределяет регистры по разным волновым фронтам, и когда один волновой фронт ожидает какого-то результата, который находится в памяти, планировщик CU назначает SIMD-VU другой волновой фронт. Волновые фронты приписываются согласно SIMD-VU. SIMD-VU не обмениваются волновыми фронтами. К одному SIMD-VU можно отнести максимум 10 волновых фронтов (таким образом, 40 на каждый CU).
AMD CodeXL показывает таблицы с соотношением количества SGPR и VGPR к количеству волновых фронтов, но по существу для SGPRS оно составляет от 104 до 512 на количество волновых фронтов, а для VGPRS — 256 на количество волновых фронтов.
Обратите внимание, что в сочетании с инструкциями SSE эту концепцию самого базового уровня параллелизма часто называют «шириной вектора». Ширина вектора характеризуется общим количеством бит в нем.
Векторный блок SIMD
[ редактировать ]Каждый векторный модуль SIMD имеет:
- 16-полосное арифметико-логическое устройство (ALU) для целых чисел и векторов с плавающей запятой
- размером 64 КиБ. Файл векторного регистра общего назначения (VGPR)
- 10 48-битных счетчиков программ
- Буфер инструкций на 10 волновых фронтов (каждый волновой фронт представляет собой группу из 64 потоков или размера одного логического VGPR)
- 64-поточный волновой фронт выдается на 16-канальный модуль SIMD за четыре цикла.
Каждый SIMD-VU имеет 10 буферов команд волнового фронта, и для выполнения одного волнового фронта требуется 4 цикла.
Блоки ускорения аудио и видео
[ редактировать ]Многие реализации GCN обычно сопровождаются несколькими другими блоками ASIC AMD . Включая, помимо прочего, Unified Video Decoder , Video Coding Engine и AMD TrueAudio .
Механизм кодирования видео
[ редактировать ]Video Coding Engine — это для кодирования видео ASIC , впервые представленный в серии Radeon HD 7000 . [17]
В исходной версии VCE добавлена поддержка кодирования I и P-кадров H.264 в формате пикселей YUV420 , а также временное кодирование SVE и режим кодирования дисплея, а во второй версии добавлена поддержка B-кадров для I-кадров YUV420 и YUV444.
VCE 3.0 стал частью третьего поколения GCN, добавив в него высококачественное масштабирование видео и кодек HEVC (H.265).
VCE 4.0 был частью архитектуры Vega, на смену которому впоследствии пришла Video Core Next .
TrueAudio
[ редактировать ]Этот раздел пуст. Вы можете помочь, добавив к нему . ( август 2018 г. ) |
Единая виртуальная память
[ редактировать ]В превью 2011 года AnandTech писала об унифицированной виртуальной памяти, поддерживаемой Graphics Core Next. [18]
- Классическая архитектура настольного компьютера с отдельной видеокартой через PCI Express . CPU и GPU имеют отдельную физическую память с разными адресными пространствами. Все данные необходимо скопировать по шине PCIe. Примечание. На диаграмме показана пропускная способность, но не задержка памяти .
- GCN поддерживает «унифицированную виртуальную память», поэтому включает нулевое копирование : вместо данных только указатели копируются и «передаются» . Это важнейшая функция HSA .
- Интегрированные графические решения (и APU AMD с графикой TeraScale ) страдают от разделения основной памяти : часть системной памяти выделяется исключительно графическому процессору. Нулевое копирование невозможно, данные необходимо копировать (по шине системной памяти) из одного раздела в другой.
- Гибридные процессоры AMD с графикой GCN выигрывают от использования унифицированной основной памяти, сохраняя ограниченную пропускную способность. [19]
Гетерогенная системная архитектура (HSA)
[ редактировать ]Некоторые из конкретных функций HSA операционной системы , реализованных в аппаратном обеспечении, требуют поддержки со стороны ядра (ее подсистем) и/или со стороны конкретных драйверов устройств. Например, в июле 2014 года AMD опубликовала набор из 83 патчей, которые будут объединены в основную версию ядра Linux на базе Graphics Core Next Radeon 3.17 для поддержки своих видеокарт . Так называемый драйвер ядра HSA находится в каталоге /drivers/gpu/hsa , а драйверы графических устройств DRM находятся в /drivers/gpu/drm [21] и дополнить уже существующие драйверы DRM для карт Radeon. [22] Эта самая первая реализация ориентирована на один APU «Kaveri» и работает вместе с существующим графическим драйвером ядра Radeon (kgd).
Сжатие дельта-цветов без потерь
[ редактировать ]Этот раздел нуждается в расширении . Вы можете помочь, добавив к нему . ( август 2018 г. ) |
Аппаратные планировщики
[ редактировать ]Аппаратные планировщики используются для выполнения планирования. [23] и перегрузить назначение очередей вычислений ACE с драйвера на оборудование, буферизуя эти очереди до тех пор, пока не появится хотя бы одна пустая очередь хотя бы в одном ACE. Это приводит к тому, что HWS немедленно назначает буферизованные очереди ACE до тех пор, пока все очереди не заполнятся или не останется очередей, которые можно было бы безопасно назначить. [24]
Часть выполняемой работы по планированию включает очереди с приоритетом, которые позволяют критическим задачам выполняться с более высоким приоритетом, чем другие задачи, не требуя вытеснения задач с более низким приоритетом для запуска задачи с высоким приоритетом, что позволяет задачам выполняться одновременно с задачами с высоким приоритетом. запланировано максимально загружать графический процессор, позволяя другим задачам использовать ресурсы, которые не используют задачи с высоким приоритетом. [23] По сути, это асинхронные вычислительные машины, в которых отсутствуют диспетчерские контроллеры. [23] Впервые они были представлены в микроархитектуре GCN четвертого поколения. [23] но присутствовали в микроархитектуре GCN третьего поколения для целей внутреннего тестирования. [25] Обновление драйвера позволило использовать аппаратные планировщики в деталях GCN третьего поколения для производственного использования. [23]
Примитивный ускоритель сброса
[ редактировать ]Этот модуль отбрасывает вырожденные треугольники до того, как они войдут в вершинный шейдер, и треугольники, которые не покрывают какие-либо фрагменты, прежде чем они войдут во фрагментный шейдер. [26] Это устройство было представлено с микроархитектурой GCN четвертого поколения. [26]
Поколения
[ редактировать ]Графическое ядро Далее 1
[ редактировать ]Дата выпуска | январь 2012 г нужна ссылка ] | [
---|---|
История | |
Предшественник | ТераСкейл 3 |
Преемник | Графическое ядро Next 2 |
Статус поддержки | |
Не поддерживается |
Микроархитектура GCN 1 использовалась в нескольких серии Radeon HD 7000 видеокартах .
- поддержка 64-битной адресации ( адресное пространство x86-64 ) с единым адресным пространством для ЦП и ГП. [18]
- поддержка PCIe 3.0 [27]
- Графический процессор отправляет запросы на прерывание процессору при различных событиях (например, ошибках страницы ).
- поддержка частично резидентных текстур, [28] которые обеспечивают поддержку виртуальной памяти через DirectX и OpenGL. расширения
- Поддержка AMD PowerTune , которая динамически регулирует производительность, чтобы оставаться в пределах определенного TDP. [29]
- поддержка Mantle (API)
Существуют асинхронные вычислительные машины, управляющие вычислениями и диспетчеризацией. [15] [30]
Нулевая мощность ядра
[ редактировать ]ZeroCore Power — это технология энергосбережения при длительном простое, отключающая функциональные блоки графического процессора, когда он не используется. [31] Технология AMD ZeroCore Power дополняет AMD PowerTune .
Чипсы
[ редактировать ]Дискретные графические процессоры (семейство Южных островов):
- Хайнань
- Голландия
- Кабо-Верде
- Питкэрн
- Таити
Графическое ядро Next 2
[ редактировать ]Дата выпуска | сентябрь 2013 г нужна ссылка ] | [
---|---|
История | |
Предшественник | Графическое ядро Далее 1 |
Преемник | Графическое ядро Next 3 |
Статус поддержки | |
Не поддерживается |
Второе поколение GCN было представлено в Radeon HD 7790 , а также встречается в Radeon HD 8770 , R7 260/260X, R9 290/290X, R9 295X2 , R7 360 и R9 390/390X , а также в Steamroller. моделях на базе настольные APU «Kaveri» и мобильные APU «Kaveri» , а также Puma на базе APU «Beema» и «Mullins» . Он имеет множество преимуществ по сравнению с исходным GCN, включая поддержку FreeSync , AMD TrueAudio и обновленную версию технологии AMD PowerTune .
GCN 2-го поколения представил объект под названием «Shader Engine» (SE). Shader Engine включает в себя один геометрический процессор, до 44 CU (чип Hawaii), растеризаторы, ROP и кэш L1. В состав шейдерного механизма не входят процессор графических команд, 8 ACE, контроллеры кэша и памяти L2, а также аудио- и видеоускорители, контроллеры дисплея, 2 контроллера DMA и интерфейс PCIe .
A10-7850K «Kaveri» содержит 8 CU (вычислительных блоков) и 8 асинхронных вычислительных механизмов для независимого планирования и диспетчеризации рабочих элементов. [32]
На саммите разработчиков AMD (APU) в ноябре 2013 года Майкл Мантор представил Radeon R9 290X . [33]
Чипсы
[ редактировать ]Дискретные графические процессоры (семейство Sea Islands):
- Бонайре
- Гавайи
интегрированы в APU:
- темы
- дважды
- Liverpool (то есть APU, установленный в PlayStation 4)
- Durango (т. е. APU, установленный в Xbox One и Xbox One S)
- Парень
- Годавари
- Маллинз
- Бима
- Карризо-Л
Графическое ядро Next 3
[ редактировать ]Дата выпуска | июнь 2015 г нужна ссылка ] | [
---|---|
История | |
Предшественник | Графическое ядро Next 2 |
Преемник | Графическое ядро Next 4 |
ГЦН 3-го поколения [34] был представлен в 2014 году вместе с Radeon R9 285 и R9 M295X с графическим процессором Tonga. Он отличается улучшенной производительностью тесселяции, дельта-сжатием цвета без потерь для уменьшения использования полосы пропускания памяти, обновленным и более эффективным набором команд, новым высококачественным масштабатором видео, кодированием HEVC (VCE 3.0) и декодированием HEVC (UVD 6.0), а также новым мультимедийным интерфейсом. движок (видеокодер/декодер). Сжатие дельта-цвета поддерживается в Mesa. [35] Однако его производительность двойной точности хуже по сравнению с предыдущим поколением. [36]
Чипсы
[ редактировать ]дискретные графические процессоры:
- Тонга (семейство вулканических островов) поставляется с UVD 5.0 (унифицированным видеодекодером).
- Фиджи (семейство Пиратских островов) поставляется с UVD 6.0 и памятью с высокой пропускной способностью (HBM 1).
интегрированы в APU:
Графическое ядро Next 4
[ редактировать ]Дата выпуска | июнь 2016 г нужна ссылка ] | [
---|---|
История | |
Предшественник | Графическое ядро Next 3 |
Преемник | Графическое ядро Next 5 |
Статус поддержки | |
Поддерживается |
Графические процессоры семейства Arctic Islands были представлены во втором квартале 2016 года с серией AMD Radeon 400 . 3D-движок (т.е. GCA (графический и вычислительный массив) или GFX) идентичен тому, который используется в чипах Tonga. [38] Но в Polaris используется более новый движок Display Controller, UVD версии 6.3 и т. д.
Все чипы на базе Polaris, кроме Polaris 30, производятся по 14-нм техпроцессу FinFET , разработанному Samsung Electronics и лицензированному GlobalFoundries . [39] Немного более новый, обновленный Polaris 30 построен на 12-нм техпроцессе LP FinFET, разработанном Samsung и GlobalFoundries. Архитектура набора команд GCN четвертого поколения совместима с третьим поколением. Это оптимизация 14-нм техпроцесса FinFET, обеспечивающая более высокие тактовые частоты графического процессора, чем в третьем поколении GCN. [40] Архитектурные улучшения включают новые аппаратные планировщики, новый ускоритель отбрасывания примитивов, новый контроллер дисплея и обновленный UVD, который может декодировать HEVC с разрешением 4K со скоростью 60 кадров в секунду и 10 битами на цветовой канал.
Чипсы
[ редактировать ]дискретные графические процессоры: [41]
- Polaris 10 (также под кодовым названием Ellesmere ), установленный на видеокартах Radeon RX 470 и Radeon RX 480.
- Polaris 11 (также под кодовым названием Baffin ), установленный на видеокартах марки Radeon RX 460 (также Radeon RX 560 D ).
- Polaris 12 (также под кодовым названием Lexa), установленный на видеокартах Radeon RX 550 и Radeon RX 540.
- Polaris 20, представляющий собой обновленный процесс ( 14 нм LPP Samsung / GloFo FinFET ) Polaris 10 с более высокими тактовыми частотами, используемый для видеокарт марок Radeon RX 570 и Radeon RX 580. [42]
- Polaris 21, представляющий собой обновленную (14 нм техпроцесс LPP Samsung/GloFo FinFET) Polaris 11, используемый для видеокарт марки Radeon RX 560.
- Polaris 22, установленный на видеокартах Radeon RX Vega M GH и Radeon RX Vega M GL (в составе Kaby Lake-G ).
- Polaris 23, представляющий собой обновленную (14 нм техпроцесс LPP Samsung/GloFo FinFET) Polaris 12, используемый для видеокарт под марками Radeon Pro WX 3200 и Radeon RX 540X (также Radeon RX 640). [43]
- Polaris 30, представляющий собой обновленный ( 12-нм техпроцесс LP GloFo FinFET) Polaris 20 с более высокими тактовыми частотами, используемый для видеокарт марки Radeon RX 590. [44]
Помимо выделенных графических процессоров, Polaris используется в APU PlayStation 4 Pro и Xbox One X под названием «Neo» и «Scorpio» соответственно.
Точность производительности
[ редактировать ]Производительность FP64 всех графических процессоров GCN 4-го поколения составляет 1 / 16 показателей FP32.
Графическое ядро Next 5
[ редактировать ]Дата выпуска | июнь 2017 г нужна ссылка ] | [
---|---|
История | |
Предшественник | Графическое ядро Next 4 |
Преемник | РДНА 1 |
Статус поддержки | |
Поддерживается |
AMD начала публиковать подробную информацию о своем следующем поколении архитектуры GCN, получившем название «Вычислительный блок следующего поколения», в январе 2017 года. [40] [45] [46] Ожидалось, что новый дизайн увеличит число команд за такт , увеличит тактовую частоту , поддержит HBM2 и увеличит адресное пространство памяти . Наборы микросхем дискретной графики также включают «HBCC (контроллер кэша с высокой пропускной способностью)», но не при интеграции в APU. [47] Кроме того, ожидалось, что новые чипы будут включать улучшения в блоках вывода растеризации и рендеринга . Потоковые процессоры сильно модифицированы по сравнению с предыдущими поколениями для поддержки технологии пакетных математических вычислений Rapid Pack Math для 8-битных, 16-битных и 32-битных чисел. При этом возникает значительное преимущество в производительности, когда допустима более низкая точность (например: обработка двух чисел половинной точности с той же скоростью, что и одного числа одинарной точности ).
Nvidia представила тайловую растеризацию и биннинг с помощью Maxwell . [48] и это стало важной причиной повышения эффективности Максвелла. В январе AnandTech предположила, что Vega наконец догонит Nvidia в вопросах оптимизации энергоэффективности благодаря новому «DSBR (Draw Stream Binning Rasterizer)», который будет представлен вместе с Vega. [49]
Также добавлена поддержка нового этапа шейдеров — Primitive Shaders. [50] [51] Примитивные шейдеры обеспечивают более гибкую обработку геометрии и заменяют вершинные и геометрические шейдеры в конвейере рендеринга. По состоянию на декабрь 2018 года шейдеры Primitive нельзя использовать, поскольку необходимые изменения API еще не внесены. [52]
Vega 10 и Vega 12 используют 14-нм техпроцесс FinFET , разработанный Samsung Electronics и лицензированный GlobalFoundries . Vega 20 использует 7-нм техпроцесс FinFET, разработанный TSMC .
Чипсы
[ редактировать ]дискретные графические процессоры:
- Vega 10 ( 14-нм Samsung / GloFo FinFET процесс ) (также под кодовым названием Greenland) [53] ) встречается на видеокартах Radeon RX Vega 64, Radeon RX Vega 56, Radeon Vega Frontier Edition, Radeon Pro V340, Radeon Pro WX 9100 и Radeon Pro WX 8200. [54]
- Vega 12 (14-нм техпроцесс Samsung/GloFo FinFET), используемый в мобильных видеокартах Radeon Pro Vega 20 и Radeon Pro Vega 16. [55]
- Vega 20 ( 7-нм техпроцесс TSMC FinFET), установленный на ускорительных картах Radeon Instinct MI50 и Radeon Instinct MI60, [56] Видеокарты торговых марок Radeon Pro Vega II и Radeon VII. [57]
интегрированы в APU:
- Рэйвен Ридж [58] поставляется с VCN 1, который заменяет VCE и UVD и обеспечивает полное декодирование VP9 с фиксированными функциями.
- Пикассо
- Ренуар
- Сезанн
Точность производительности
[ редактировать ]Производительность операций с плавающей запятой двойной точности (FP64) всех графических процессоров GCN 5-го поколения, за исключением Vega 20, составляет одну шестнадцатую производительности FP32. Для Vega 20 с Radeon Instinct это половина производительности FP32. Для Vega 20 с Radeon VII это четверть производительности FP32. [59] Все графические процессоры GCN 5-го поколения поддерживают вычисления с плавающей запятой половинной точности (FP16), что вдвое превышает производительность FP32.
Сравнение графических процессоров GCN
[ редактировать ]- В таблице представлены только дискретные графические процессоры (в том числе мобильные). APU(IGP) и консольные SoC не указаны.
Микроархитектура [60] | ГЦН 1 | ГЦН 2 | ГЦН 3 | ГЦН 4 | ГЦН 5 | ||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Таити [61] | Питкэрн [62] | Кабо-Верде [63] | Голландия [64] | Хайнань [65] | Бонайре [66] | Гавайи [67] | Топаз [68] | Приехал [69] | Фиджи [70] | Элсмир [71] | Баффин [72] | Лекса [73] | Вега 10 [74] | Вега 12 [75] | Вега 20 [76] | ||
Кодовое имя 1 | ? | ? | ? | Число | ? | ? | Ибица | Исландия | ? | ? | Полярис 10 | Полярис 11 | Полярис 12 | Гренландия | Обновление сокровищ | Лунный выстрел | |
Вариант(ы) | Новая Зеландия Мальта | Уимблдон Кюрасао Нептун Тринидад | Челси Хитроу Венера Троп | Марс Опал Члены | Солнце Джет Экзо Банки | Сатурн Тобаго Слой Изумруд | Везувий Гренада | Мясо Уэстон Полярис 24 | Аметист Антигуа | Капсаицин | Полярис 20 Полярис 30 | Полярис 21 | Полярис 23 | — | — | — | |
Потрясающе | TSMC 28 нм | GlobalFoundries 14 нм / 12 нм (Polaris 30) | TSMC 7 нм | ||||||||||||||
Размер матрицы (мм 2 ) | 352/365 (Мальта) | 212 | 123 | 77 | 56 | 160 | 438 | 125 | 366 | 596 | 232 | 123 | 103 | 495 | Unknown | 331 | |
Транзисторы (млн) | 4,313 | 2,800 | 1,500 | 950 | 690 | 2,080 | 6,200 | 1,550 | 5,000 | 8,900 | 5,700 | 3,000 | 2,200 | 12,500 | Unknown | 13,230 | |
Плотность транзисторов (МТР/мм 2 ) | 12,3 / 12,8 (Мальта) | 13.2 | 12.2 | 12.3 | 13.0 | 14.2 | 12.4 | 13.7 | 14.9 | 24.6 | 24.4 | 21.4 | 25.3 | Unknown | 40.0 | ||
Асинхронные вычислительные механизмы | 2 | 8 | ? | 8 | 4 | ? | 4 | ||||||||||
Геометрические двигатели | 2 | 1 | 2 | — | ? | — | 4 | ? | 4 | ||||||||
Шейдерные движки | — | 4 | ? | 4 | 2 | — | |||||||||||
Аппаратные планировщики | — | 2 | ? | 2 | |||||||||||||
Вычислительные единицы | 32 | 20 | 10 / 8 (Челси) | 6 | 5 / 6 (Джет) | 14 | 44 | 6 | 32 | 64 | 36 | 16 | 10 | 64 | 20 | 64 | |
Потоковые процессоры | 2048 | 1280 | 640/512 (Челси) | 384 | 320/384 (Джет) | 896 | 2816 | 384 | 2048 | 4096 | 2304 | 1024 | 640 | 4096 | 1280 | 4096 | |
Единицы наложения текстур | 128 | 80 | 40/32 (Челси) | 24 | 20 / 24 (Джет) | 56 | 176 | 24 | 128 | 256 | 144 | 64 | 40 | 256 | 80 | 256 | |
Единицы вывода рендеринга | 32 | 16 | 8 | 16 | 64 | 8 | 32 | 64 | 32 | 16 | 64 | 32 | 64 | ||||
Z/Трафарет ОПС | 128 | 64 | 16 | 64 | 256 | 16 | 128 | 256 | — | ||||||||
L1 Кэш (КБ) | 16 на вычислительный блок (CU) | ||||||||||||||||
Кэш L2 (КБ) | 768 | 512 | 256 | 128/256 (Реактивный) | 256 | 1024 | 256 | 768 | 2048 | 1024 | 512 | 4096 | 1024 | 4096 | |||
Основной движок дисплея | 6.0 | 6.4 | — | 8.2 | 8.5 | — | 10.0 | 11.2 | 12.0 | 12.1 | |||||||
Единый видеодекодер | 3.2 | 4.0 | — | 4.2 | — | 5.0 | 6.0 | 6.3 | 7.0 | 7.2 | |||||||
Механизм кодирования видео | 1.0 | — | 2.0 | — | 3.0 | 3.4 | 4.0 | 4.1 | |||||||||
Запуск 2 | декабрь 2011 г. | март 2012 г. | февраль 2012 г. | январь 2013 г. | май 2015 г. | март 2013 г. | октябрь 2013 г. | 2014 | август 2014 г. | июнь 2015 г. | июнь 2016 г. | август 2016 г. | апрель 2017 г. | июнь 2017 г. | ноябрь 2018 г. | ноябрь 2018 г. | |
Серия (Семейный) | Южные острова | Морские острова | Вулканические острова | Пиратские острова | Арктические острова | Вега | Вега II | ||||||||||
Примечания | мобильный/ОЕМ | мобильный/ОЕМ | мобильный |
1 Старые кодовые названия, такие как Treasure (Lexa) или Hawaii Refresh (Ellesmere), не указаны.
2 Дата первоначального запуска. Даты запуска вариантов чипов, таких как Polaris 20 (апрель 2017 г.), не указаны.
См. также
[ редактировать ]Внешние ссылки
[ редактировать ]Ссылки
[ редактировать ]- ^ AMD Developer Central (31 января 2014 г.). «GS-4106 Архитектура AMD GCN — ускоренный курс, Лейла Мах» . Slideshare.net .
- ^ «AMD выпускает самую быструю в мире однопроцессорную видеокарту — AMD Radeon HD 7970» (пресс-релиз). АМД. 22 декабря 2011. Архивировано из оригинала 20 января 2015 года . Проверено 20 января 2015 г.
- ^ Гулати, Абхик (11 ноября 2019 г.). «Глубокое погружение в архитектуру графических процессоров AMD TeraScale, GCN и RDNA» . Середина . Проверено 12 декабря 2021 г.
- ^ «Форумы сообщества AMD» . Сообщество.amd.com . 15 июля 2016 г.
- ^ «Безопасная часть LLVM amdgpu» . Llvm.org .
- ^ «Изменения, новые функции и исправления серии выпусков GCC 9» . Проверено 13 ноября 2019 г.
- ^ «Поддержка разгрузки AMD GCN» . Проверено 13 ноября 2019 г.
- ^ «Инициатива AMD Больцмана — интерфейс гетерогенных вычислений для портативности (HIP)» . 16 ноября 2015 года. Архивировано из оригинала 26 января 2016 года . Проверено 8 декабря 2019 г.
- ^ Смит, Райан (5 января 2017 г.). «Обзор архитектуры графического процессора AMD Vega» . Anandtech.com . Проверено 11 июля 2017 г.
- ^ Смит, Райан. «AMD углубляется в асинхронное шейдинг» . Anandtech.com .
- ^ «Соответствующая продукция» . Хронос.орг . 26 октября 2017 г.
- ^ Технический документ о вычислительных ядрах (PDF) . АМД. 2014. с. 5.
- ^ Jump up to: а б Смит, Райан (21 декабря 2011 г.). «Следующий обзор графического ядра AMD» . Anandtech.com . Проверено 18 апреля 2017 г.
- ^ «Архитектура AMD Graphics Core Next (GCN)» (PDF) . TechPowerUp . Проверено 26 февраля 2024 г.
- ^ Jump up to: а б Мантор, Майкл; Хьюстон, Майк (15 июня 2011 г.). «AMD Graphics Core Next» (PDF) . АМД . п. 40 . Проверено 15 июля 2014 г.
Асинхронная вычислительная машина (ACE)
- ^ «Оптимизация загрузки графического процессора и использования ресурсов с помощью больших групп потоков» . AMD GPUОткрыть . Проверено 1 января 2024 г.
- ^ «Информационный документ AMD UnifiedVideoDecoder (UVD)» (PDF) . 15 июня 2012 года . Проверено 20 мая 2017 г.
- ^ Jump up to: а б «Не только новая архитектура, но и новые возможности» . АнандТех . 21 декабря 2011 года . Проверено 11 июля 2014 г.
- ^ «Микроархитектура Кавери» . Полуточный . 15 января 2014 г.
- ^ Эйрли, Дэйв (26 ноября 2014 г.). «Объединить АМДКФД» . сайт freedesktop.org . Проверено 21 января 2015 г.
- ^ "/drivers/gpu/drm" . Кернел.орг .
- ^ «[ИСПРАВЛЕНИЕ 00/83] Драйвер ядра AMD HSA» . ЛКМЛ . 10 июля 2014 года . Проверено 11 июля 2014 г.
- ^ Jump up to: а б с д и Анджелини, Крис (29 июня 2016 г.). «Обзор AMD Radeon RX 480 8 ГБ» . Аппаратное обеспечение Тома . п. 1 . Проверено 11 августа 2016 г.
- ^ «Анализ архитектуры Полярной звезды» (PDF) . 2016. Архивировано из оригинала (PDF) 20 сентября 2016 года . Проверено 12 августа 2016 г.
- ^ Шраут, Райан (29 июня 2016 г.). «Обзор AMD Radeon RX 480 — обещание Polaris» . Перспектива ПК . п. 2. Архивировано из оригинала 10 октября 2016 года . Проверено 12 августа 2016 г.
- ^ Jump up to: а б Смит, Райан (29 июня 2016 г.). «Предварительный обзор AMD Radeon RX 480: Polaris становится популярным» . АнандТех . п. 3 . Проверено 11 августа 2016 г.
- ^ «Серия AMD Radeon HD 7000 будет совместима с PCI-Express 3.0» . TechPowerUp . Проверено 21 июля 2011 г.
- ^ «AMD подробно описывает архитектуру графического процессора следующего поколения» . Проверено 3 августа 2011 г.
- ^ Тони Чен; Джейсон Гривз, «Архитектура AMD Graphics Core Next (GCN)» (PDF) , AMD , заархивировано из оригинала (PDF) 18 января 2023 г. , получено 13 августа 2016 г.
- ^ «Следующий обзор графического ядра AMD: новый графический процессор AMD, созданный для вычислений» . АнандТех . 21 декабря 2011 года . Проверено 15 июля 2014 г.
Новые асинхронные вычислительные механизмы AMD служат командными процессорами для вычислительных операций в GCN. Основная цель ACE будет заключаться в приеме работы и отправке ее в CU для обработки.
- ^ «Управление энергопотреблением в режиме ожидания: введение ZeroCore Power» . AnandTech.com . 22 декабря 2011 года . Проверено 29 апреля 2015 г.
- ^ «Протестировано AMD Kaveri A10-7850K» . АнандТех . 14 января 2014 года . Проверено 7 июля 2014 г.
- ^ «АМД Радеон Р9-290Х» . 21 ноября 2013 г.
- ^ «Обзор Карризо» (PNG) . Images.anandtech.com . Проверено 20 июля 2018 г.
- ^ «Добавить поддержку DCC» . Freedesktop.org . 11 октября 2015 г.
- ^ Смит, Райан (10 сентября 2014 г.). «Обзор AMD Radeon R9 285» . Anandtech.com . Проверено 13 марта 2017 г.
- ^ Jump up to: а б Катресс, Ян (1 июня 2016 г.). «AMD анонсирует APU 7-го поколения» . Anandtech.com . Проверено 1 июня 2016 г.
- ^ «Функция Радеон» . www.x.org .
- ^ «Группа Radeon Technologies – январь 2016 г. – Архитектура AMD Polaris» . Guru3d.com .
- ^ Jump up to: а б Смит, Райан (5 января 2017 г.). «Тизер архитектуры AMD Vega: более высокий IPC, тайлинг и многое другое, выйдет в первом полугодии 2017 года» . Anandtech.com . Проверено 10 января 2017 г.
- ^ WhyCry (24 марта 2016 г.). «AMD подтверждает, что Polaris 10 — это Элсмир, а Polaris 11 — это Баффин» . ВидеоКардз . Проверено 8 апреля 2016 г.
- ^ «Утечка почти полных аппаратных характеристик серии AMD Radeon RX 500» . www.3dcenter.org .
- ^ «АМД Поларис 23» . TechPowerUp . Проверено 12 мая 2022 г.
- ^ О, Нейт (15 ноября 2018 г.). «Обзор AMD Radeon RX 590 с участием XFX и PowerColor: Polaris возвращается (снова)» . anandtech.com . Проверено 24 ноября 2018 г.
- ^ Кампман, Джефф (5 января 2017 г.). «Занавес поднимается над архитектурой AMD Vega» . TechReport.com . Проверено 10 января 2017 г.
- ^ Шраут, Райан (5 января 2017 г.). «Предварительный обзор архитектуры графического процессора AMD Vega: обновленная архитектура памяти» . Перспектива ПК . Проверено 10 января 2017 г.
- ^ Кампман, Джефф (26 октября 2017 г.). «Представлены APU AMD Ryzen 7 2700U и Ryzen 5 2500U» . Techreport.com . Проверено 26 октября 2017 г.
- ^ Рэйвенлорд (1 марта 2017 г.). «О тайловом рендеринге NVIDIA» . techPowerUp .
- ^ «Vega Teaser: растеризатор биннинга потоков рисования» . Anandtech.com .
- ^ «Анализ Radeon RX Vega: AMD обещает игровую производительность в разрешении 4K за 499 долларов — надежные обзоры» . Trustedreviews.com . 31 июля 2017. Архивировано из оригинала 14 июля 2017 года . Проверено 20 марта 2017 г.
- ^ «Занавес поднимается над архитектурой AMD Vega» . Techreport.com . Архивировано из оригинала 1 сентября 2017 года . Проверено 20 марта 2017 г.
- ^ Кампман, Джефф (23 января 2018 г.). «Примитивным шейдерам Radeon RX Vega потребуется поддержка API» . Techreport.com . Проверено 29 декабря 2018 г.
- ^ «ROCm-OpenCL-Runtime/libUtils.cpp в мастере · RadeonOpenCompute/ROCm-OpenCL-Runtime» . github.com . 3 мая 2017 г. Проверено 10 ноября 2018 г.
- ^ «Обзор AMD Radeon RX Vega 64 и RX Vega 56: Vega Burning Bright» . Anandtech.com . 14 августа 2017 г. Проверено 16 ноября 2017 г.
- ^ «Мобильная версия Vega от AMD: Vega Pro 20 и 16 в обновленных MacBook Pro в ноябре» . Anandtech.com . 30 октября 2018 г. . Проверено 10 ноября 2018 г.
- ^ «AMD анонсирует ускорители Radeon Instinct MI60 и MI50: на базе 7-нм техпроцесса Vega» . Anandtech.com . 6 ноября 2018 г. . Проверено 10 ноября 2018 г.
- ^ «AMD представляет первый в мире игровой графический процессор, изготовленный по 7-нм техпроцессу: исключительная производительность и невероятные впечатления для геймеров, авторов и энтузиастов» (пресс-релиз). Лас-Вегас, Невада: AMD. 9 января 2019 года . Проверено 12 января 2019 г.
- ^ Феррейра, Бруно (16 мая 2017 г.). «Мобильные APU Ryzen появятся на ноутбуке рядом с вами» . Технический отчет . Проверено 16 мая 2017 г.
- ^ «AMD представляет первые в мире 7-нм графические процессоры для центров обработки данных – основа новой эры искусственного интеллекта, облачных вычислений и высокопроизводительных вычислений (HPC) | AMD» . AMD.com (пресс-релиз). 6 ноября 2018 г. . Проверено 10 ноября 2018 г.
- ^ «Функция Радеон» . х.Орг . Проверено 21 ноября 2022 г.
- ^ «Характеристики графического процессора AMD Tahiti» . TechPowerUp . Проверено 20 ноября 2022 г.
- ^ «Характеристики графического процессора AMD Pitcairn» . TechPowerUp . Проверено 20 ноября 2022 г.
- ^ «Спецификации графического процессора AMD Кабо-Верде» . TechPowerUp . Проверено 20 ноября 2022 г.
- ^ «Спецификации графического процессора AMD Oland» . TechPowerUp . Проверено 20 ноября 2022 г.
- ^ «Спецификации графического процессора AMD Hainan» . TechPowerUp . Проверено 20 ноября 2022 г.
- ^ «Спецификации графического процессора AMD Bonaire» . TechPowerUp . Проверено 21 ноября 2022 г.
- ^ «Спецификации графического процессора AMD Hawaii» . TechPowerUp . Проверено 21 ноября 2022 г.
- ^ «Характеристики графического процессора AMD Topaz» . TechPowerUp . Проверено 21 ноября 2022 г.
- ^ «Характеристики графического процессора AMD Tonga» . TechPowerUp . Проверено 21 ноября 2022 г.
- ^ «Спецификации графического процессора AMD Fiji» . TechPowerUp . Проверено 21 ноября 2022 г.
- ^ «Спецификации графического процессора AMD Ellesmere» . TechPowerUp . Проверено 21 ноября 2022 г.
- ^ «Спецификации графического процессора AMD Baffin» . TechPowerUp . Проверено 21 ноября 2022 г.
- ^ «Спецификации графического процессора AMD Lexa» . TechPowerUp . Проверено 21 ноября 2022 г.
- ^ «Характеристики графического процессора AMD Vega 10» . TechPowerUp . Проверено 21 ноября 2022 г.
- ^ «Характеристики графического процессора AMD Vega 12» . TechPowerUp . Проверено 21 ноября 2022 г.
- ^ «Характеристики графического процессора AMD Vega 20» . TechPowerUp . Проверено 21 ноября 2022 г.