Графический процессор
Графический процессор ( GPU ) — специализированная электронная схема, изначально предназначенная для цифровой обработки изображений и ускорения компьютерной графики , присутствующая либо в виде дискретной видеокарты , либо встроенная в материнские платы , мобильные телефоны , персональные компьютеры , рабочие станции и игровые приставки . После первоначального проектирования графические процессоры оказались полезными для неграфических вычислений, включающих в себя до невозможности параллельные задачи, из-за их параллельной структуры . Другие неграфические применения включают обучение нейронных сетей и майнинг криптовалют .
История
[ редактировать ]1970-е годы
[ редактировать ]В системных платах аркадных систем с 1970-х годов используются специализированные графические схемы. В раннем оборудовании для видеоигр оперативная память для буферов кадров была дорогой, поэтому видеочипы объединяли данные во время сканирования изображения на мониторе. [ 1 ]
Специализированная схема переключения ствола помогала ЦП анимировать графику кадрового буфера для различных аркадных видеоигр 1970-х годов от Midway и Taito , таких как Gun Fight (1975), Sea Wolf (1976) и Space Invaders (1978). [ 2 ] В аркадной системе Namco Galaxian в 1979 году использовалось специализированное графическое оборудование , поддерживающее цвет RGB , разноцветные спрайты и фоновые карты. [ 3 ] Аппаратное обеспечение Galaxian широко использовалось в золотой век аркадных видеоигр такими игровыми компаниями, как Namco , Centuri , Gremlin , Irem , Konami , Midway, Nichibutsu , Sega и Taito. [ 4 ]
В Atari 2600 в 1977 году использовался видеопереключатель под названием « Адаптер телевизионного интерфейса» . [ 5 ] 8-битные компьютеры Atari (1979) имели ANTIC , видеопроцессор, который интерпретировал инструкции, описывающие « список отображения » — способ отображения строк развертки в определенные растровые или символьные режимы и место хранения памяти (поэтому не было необходимости в непрерывный буфер кадров). [ нужны разъяснения ] [ 6 ] 6502 машинного кода Подпрограммы можно было запустить на строках сканирования , установив бит в инструкции списка отображения. [ нужны разъяснения ] [ 7 ] ANTIC также поддерживал плавную вертикальную и горизонтальную прокрутку независимо от процессора. [ 8 ]
1980-е годы
[ редактировать ]NEC μPD7220 был первой реализацией персонального компьютера процессора графического дисплея микросхемы большой интеграции (LSI) в виде одной интегральной . Это позволило разработать недорогие и высокопроизводительные видеокарты, например, от Number Nine Visual Technology . Он стал самым известным графическим процессором до середины 1980-х годов. [ 9 ] Это был первый полностью интегрированный ) со сверхкрупной интеграцией процессор графического дисплея металл-оксид-полупроводник ( NMOS до для ПК, поддерживавший разрешение 1024×1024 и заложивший основы развивающегося рынка графики для ПК. Он использовался в ряде видеокарт и был лицензирован для таких клонов, как Intel 82720, первый графический процессор Intel . [ 10 ] Аркадные игры Williams Electronics Robotron 2084 , Joust , Sinistar и Bubbles , выпущенные в 1982 году, содержат специальные блиттерные чипы для работы с 16-цветными растровыми изображениями. [ 11 ] [ 12 ]
В 1984 году Hitachi выпустила ARTC HD63484, первый крупный графический процессор CMOS для персональных компьютеров. до ARTC может отображать разрешение 4K в монохромном режиме. В конце 1980-х годов он использовался во многих видеокартах и терминалах. [ 13 ] В 1985 году была выпущена Amiga со специальным графическим чипом, включающим блиттер для манипуляций с растровыми изображениями, рисования линий и заливки областей. Он также включал в себя сопроцессор с собственным простым набором команд, который был способен манипулировать регистрами графического оборудования синхронно с видеолучом (например, для переключения палитры для каждой строки сканирования, мультиплексирования спрайтов и аппаратной оконной обработки) или управлять блиттером. В 1986 году компания Texas Instruments выпустила TMS34010 , первый полностью программируемый графический процессор. [ 14 ] Он мог выполнять код общего назначения, но имел набор команд, ориентированный на графику. В 1990–1992 годах этот чип стал основой с графической архитектурой Texas Instruments («TIGA») карт -ускорителей Windows .
В 1987 году IBM 8514 была выпущена графическая система . Это была одна из первых видеокарт для IBM PC-совместимых устройств, реализовавшая 2D-примитивы с фиксированными функциями в электронном оборудовании . Sharp В модели X68000 , выпущенной в 1987 году, использовался специальный графический чипсет. [ 15 ] с 65 536 цветовой палитрой и аппаратной поддержкой спрайтов, прокрутки и нескольких игровых полей. [ 16 ] Он служил машиной для разработки аркадной платы Capcom System CP . Компьютер Fujitsu FM Towns , выпущенный в 1989 году, поддерживал 16 777 216 цветов. [ 17 ] В 1988 году первые специализированные полигональные 3D- графики были представлены на игровых автоматах Namco System 21. [ 18 ] и Taito Air System. [ 19 ]
В 1987 году IBM представила свой собственный стандарт отображения Video Graphics Array (VGA) с максимальным разрешением 640×480 пикселей. В ноябре 1988 года NEC Home Electronics объявила о создании Ассоциации стандартов видеоэлектроники (VESA) для разработки и продвижения Super VGA (SVGA) стандарта компьютерного дисплея в качестве преемника VGA. с поддержкой Super VGA Разрешение графического дисплея достигает 800×600 пикселей , что на 36 % больше. [ 20 ]
1990-е годы
[ редактировать ]В 1991 году компания S3 Graphics представила S3 86C911 , которую дизайнеры назвали в честь Porsche 911 в знак обещанного увеличения производительности. [ 21 ] У 86C911 появилось множество подражателей: к 1995 году все основные производители графических чипов для ПК добавили 2D- ускорения. в свои чипы поддержку [ 22 ] с фиксированными функциями Ускорители Windows превзошли по производительности дорогие графические сопроцессоры общего назначения, и такие сопроцессоры исчезли с рынка ПК.
На протяжении 1990-х годов ускорение 2D GUI развивалось. По мере улучшения производственных возможностей рос и уровень интеграции графических чипов. Дополнительные интерфейсы прикладного программирования (API) появились для различных задач, такие как Microsoft WinG графическая библиотека для Windows 3.x и их более поздний интерфейс DirectDraw для аппаратного ускорения 2D-игр в Windows 95 и более поздних версиях.
В начале и середине 1990-х годов 3D-графика в реальном времени стала все более распространенной в аркадных, компьютерных и консольных играх, что привело к увеличению общественного спроса на 3D-графику с аппаратным ускорением. Ранние примеры массового оборудования для 3D-графики можно найти в игровых системных платах, таких как Sega Model 1 , Namco System 22 и Sega Model 2 , а также в игровых консолях пятого поколения, таких как Saturn , PlayStation и Nintendo 64. . Аркадные системы, такие как Sega Model 2 и Namco Magic Edge Hornet Simulator на базе SGI Onyx в 1993 году, были способны к аппаратному T&L ( преобразованию, обрезке и освещению ) за несколько лет до появления в потребительских видеокартах. [ 23 ] [ 24 ] Еще одним ранним примером является чип Super FX , RISC, на основе графический чип используемый в некоторых для SNES играх , особенно в Doom и Star Fox . Некоторые системы использовали DSP для ускорения преобразований. Fujitsu , работавшая над аркадной системой Sega Model 2, [ 25 ] начал работу над интеграцией T&L в единое решение LSI для использования в домашних компьютерах в 1995 году; [ 26 ] Fujitsu Pinolite, первый процессор 3D-геометрической обработки для персональных компьютеров, выпущенный в 1997 году. [ 27 ] Первым аппаратным графическим процессором T&L на домашних игровых консолях стал Nintendo 64 для сопроцессор Reality Coprocessor , выпущенный в 1996 году. [ 28 ] В 1997 году Mitsubishi выпустила 3Dpro/2MP , графический процессор с возможностью трансформации и освещения для рабочих станций и настольных компьютеров под управлением Windows NT ; [ 29 ] ATi использовала его для своей FireGL 4000 видеокарты , выпущенной в 1997 году. [ 30 ]
Термин «графический процессор» был придуман Sony для обозначения 32-битного графического процессора Sony (разработанного Toshiba ) в PlayStation , выпущенной в 1994 году. игровой консоли [ 31 ]
В мире ПК заметными неудачными попытками создания недорогих графических чипов 3D были S3 ViRGE , ATI Rage и Matrox Mystique . По сути, эти чипы представляли собой 2D-ускорители предыдущего поколения с встроенными 3D-функциями. Многие из них были совместимы по выводам с чипами предыдущего поколения для простоты реализации и минимальной стоимости. Первоначально 3D-графика была возможна только с помощью дискретных плат, предназначенных для ускорения 3D-функций (и полностью отсутствовавших ускорения 2D-графического пользовательского интерфейса (GUI)), таких как PowerVR и 3dfx Voodoo . Однако по мере развития производственных технологий видео, ускорение 2D GUI и функциональность 3D были интегрированы в один чип. от Rendition Чипсеты Verite были одними из первых, кто хорошо справился с этой задачей. В 1997 году Rendition сотрудничала с Hercules и Fujitsu в проекте «Thriller Conspiracy», в котором геометрический процессор Fujitsu FXG-1 Pinolite сочетался с ядром Verité V2200 для создания видеокарты с полным движком T&L за несколько лет до появления GeForce 256 от Nvidia. ; Эта карта, предназначенная для снижения нагрузки на процессор системы, так и не поступила на рынок. [ нужна ссылка ] NVIDIA RIVA 128 была одним из первых ориентированных на потребителя графических процессоров, интегрированных в один кристалл.
OpenGL был представлен в начале 90-х годов компанией SGI как профессиональный графический API с собственной аппаратной поддержкой растеризации 3D. В 1994 году Microsoft приобрела Softimage , доминирующий инструмент для создания фильмов CGI, который использовался для создания таких ранних хитов CGI, как «Парк Юрского периода», «Терминатор 2» и «Титаник». В результате этой сделки были заключены стратегические отношения с SGI и коммерческая лицензия на библиотеки SGI OpenGL, позволяющая Microsoft портировать API в ОС Windows NT, но не в предстоящую версию Windows '95. Хотя в то время об этом было мало известно, SGI заключила с Microsoft контракт на переход с Unix на будущую ОС Windows NT , о сделке, подписанной в 1995 году, не было публично объявлено до 1998 года. В промежуточный период Microsoft тесно сотрудничала с SGI, чтобы порт OpenGL на Windows NT. В ту эпоху у OpenGL не было стандартной модели драйверов для конкурирующих аппаратных ускорителей, которые могли бы конкурировать на основе поддержки более высокого уровня функциональности 3D-текстурирования и освещения. В 1994 году Microsoft анонсировала DirectX 1.0 и поддержку игр в будущей потребительской ОС Windows '95, в '95 Microsoft объявила о приобретении британской компании Rendermorphics Ltd и модели драйверов Direct3D для ускорения потребительской 3D-графики. Модель драйвера Direct3D поставлялась вместе с DirectX 2.0 в 1996 году. Она включала стандарты и спецификации для производителей 3D-чипов, которые могли конкурировать за поддержку 3D-текстур, освещения и Z-буферизации. ATI, которая позже была приобретена AMD, начала разработку первого графического процессора Direct3D. Nvidia быстро перешла от неудавшейся сделки с Sega в 1996 году к агрессивному переходу на поддержку Direct3D. В эту эпоху Microsoft объединила свои внутренние команды Direct3D и OpenGL и тесно сотрудничала с SGI, чтобы унифицировать стандарты драйверов как для промышленных, так и для потребительских аппаратных ускорителей 3D-графики. Microsoft проводила ежегодные мероприятия для производителей 3D-чипов под названием «Meltdowns», чтобы проверить их 3D-оборудование и драйверы на работу как с Direct3D, так и с OpenGL. Именно в этот период сильного влияния Microsoft на стандарты 3D карты 3D-ускорителей вышли за рамки простых растеризаторов. стать более мощными процессорами общего назначения, поскольку поддержка аппаратного ускорения текстурирования, освещения, Z-буферизации и вычислений создала современный графический процессор. В этот период та же команда Microsoft, ответственная за стандартизацию драйверов Direct3D и OpenGL, представила свой собственный дизайн 3D-чипа Microsoft под названием Talisman . Подробности этой эпохи подробно описаны в книгах: « Игра X » версии 1 и 2 Рассела Демарии, « Отступники Империи » Майка Драммонда, « Открытие Xbox » Дина Такахаши и « Мастера судьбы». » Дэвида Кушнера. Nvidia ; GeForce 256 (также известная как NV10) была первой картой потребительского уровня с аппаратным ускорением T&L Хотя API OpenGL обеспечивал программную поддержку для наложения текстур и освещения, первое аппаратное 3D-ускорение для этих функций появилось вместе с первыми потребительскими графическими процессорами с ускорением Direct3D .
2000-е
[ редактировать ]Nvidia была первой, кто выпустил чип, способный программировать затенение : GeForce 3 . Каждый пиксель теперь мог обрабатываться короткой программой, которая могла включать дополнительные текстуры изображения в качестве входных данных, и каждая геометрическая вершина также могла обрабатываться короткой программой перед ее проецированием на экран. Этот чип, используемый в консоли Xbox , конкурировал с чипом в PlayStation 2 , который использовал специальный векторный блок для аппаратной ускоренной обработки вершин (обычно называемый VU0/VU1). Самые ранние версии механизмов выполнения шейдеров, использовавшихся в Xbox, не были универсальными и не могли выполнять произвольный пиксельный код. Вершины и пиксели обрабатывались разными модулями, которые имели свои собственные ресурсы, при этом пиксельные шейдеры имели более жесткие ограничения (поскольку они выполняются с более высокой частотой, чем вершины). Механизмы шейдинга пикселей на самом деле были больше похожи на настраиваемый функциональный блок и на самом деле не «запускали» программу. Многие из этих различий между вершинным и пиксельным затенением не были устранены до тех пор, пока Единая шейдерная модель .
В октябре 2002 года, с появлением ATI Radeon 9700 (также известной как R300), первый в мире ускоритель Direct3D 9.0, пиксельные и вершинные шейдеры могли реализовывать циклы и длинные математические вычисления с плавающей запятой и быстро становились такими же гибкими, как процессоры, но заказы на порядок быстрее для операций с массивами изображений. Затенение пикселей часто используется для рельефного отображения , которое добавляет текстуру, чтобы объект выглядел блестящим, тусклым, шероховатым или даже круглым или выдавленным. [ 32 ]
С появлением серии Nvidia GeForce 8 и новых универсальных блоков потоковой обработки графические процессоры стали более универсальными вычислительными устройствами. Параллельные графические процессоры совершают вычислительное вторжение в центральные процессоры, и подобласть исследований, получившая название GPU-вычисления или GPGPU ( вычисления общего назначения на графическом процессоре) , нашла применение в таких разнообразных областях, как машинное обучение , [ 33 ] разведка нефти , научная обработка изображений , линейная алгебра , [ 34 ] статистика , [ 35 ] 3D-реконструкция и оценка опционов на акции . GPGPU был предшественником того, что сейчас называется вычислительным шейдером (например, CUDA, OpenCL, DirectCompute), и фактически в некоторой степени злоупотреблял аппаратным обеспечением, обрабатывая данные, передаваемые алгоритмам, как карты текстур и выполняя алгоритмы, рисуя треугольник или четырехугольник с соответствующим пиксельный шейдер. [ нужны разъяснения ] Это влечет за собой некоторые накладные расходы, поскольку такие модули, как преобразователь сканирования, задействуются там, где они не нужны (а манипуляции с треугольниками даже не вызывают беспокойства — за исключением вызова пиксельного шейдера). [ нужны разъяснения ]
от Nvidia Платформа CUDA , впервые представленная в 2007 году. [ 36 ] была самой ранней широко распространенной моделью программирования для вычислений на графических процессорах. OpenCL — это открытый стандарт, определенный Khronos Group , который позволяет разрабатывать код как для графических процессоров, так и для центральных процессоров с упором на переносимость. [ 37 ] Решения OpenCL поддерживаются Intel, AMD, Nvidia и ARM, и согласно отчету Evans Data за 2011 год, OpenCL стал вторым по популярности инструментом HPC. [ 38 ]
2010-е годы
[ редактировать ]В 2010 году Nvidia заключила партнерское соглашение с Audi для питания приборных панелей своих автомобилей, используя графический процессор Tegra для обеспечения расширенной функциональности автомобильных навигационных и развлекательных систем. [ 39 ] Достижения в области технологий графического процессора в автомобилях способствовали развитию технологии беспилотного вождения . [ 40 ] Карты серии AMD Radeon HD 6000 были выпущены в 2010 году, а в 2011 году AMD выпустила дискретные графические процессоры серии 6000M для мобильных устройств. [ 41 ] Линейка видеокарт Kepler от Nvidia была выпущена в 2012 году и использовалась в картах Nvidia серий 600 и 700. Особенностью этой микроархитектуры графического процессора было усиление графического процессора — технология, которая регулирует тактовую частоту видеокарты, увеличивая или уменьшая ее в зависимости от ее энергопотребления. [ 42 ] Микроархитектура Kepler изготовлена по техпроцессу 28 нм. [ нужны разъяснения ] .
PS4 ; и Xbox One были выпущены в 2013 году они оба используют графические процессоры на базе AMD Radeon HD 7850 и 7790 . [ 43 ] За линейкой графических процессоров Nvidia Kepler последовала линейка Maxwell , производившаяся по тому же процессу. Чипы Nvidia, изготовленные по 28-нм техпроцессу, производились компанией TSMC на Тайване по 28-нм техпроцессу. По сравнению с прежней технологией 40 нм этот производственный процесс позволил повысить производительность на 20 процентов при меньшем энергопотреблении. [ 44 ] [ 45 ] Гарнитуры виртуальной реальности предъявляют высокие системные требования; производители рекомендовали GTX 970 и R9 290X или лучше на момент их выпуска. [ 46 ] [ 47 ] Карты на базе микроархитектуры Pascal были выпущены в 2016 году. Серия карт GeForce 10 относится к этому поколению видеокарт. Они изготовлены с использованием производственного процесса 16 нм, который улучшает предыдущие микроархитектуры. [ 48 ] Nvidia выпустила одну непотребительскую карту с новой архитектурой Volta , Titan V. Изменения по сравнению с Titan XP, высокопроизводительной картой Pascal, включают увеличение количества ядер CUDA, добавление тензорных ядер и HBM2 . Тензорные ядра предназначены для глубокого обучения, а память с высокой пропускной способностью — это встроенная в стек память с более низкой тактовой частотой, которая предлагает чрезвычайно широкую шину памяти. Чтобы подчеркнуть, что Titan V не является игровой картой, Nvidia удалила суффикс «GeForce GTX», который она добавляет к потребительским игровым картам.
В 2018 году Nvidia выпустила графические процессоры серии RTX 20, в которых к графическим процессорам добавлены ядра трассировки лучей, что улучшило их производительность при работе с световыми эффектами. [ 49 ] Графические процессоры Polaris 11 и Polaris 10 от AMD производятся по 14-нм техпроцессу. Их выпуск привел к существенному увеличению производительности на ватт видеокарт AMD. [ 50 ] AMD также выпустила серию графических процессоров Vega для рынка высокого класса в качестве конкурента высокопроизводительным картам Pascal от Nvidia, также оснащенным HBM2, как и Titan V.
В 2019 году AMD выпустила преемника своей микроархитектуры/набора инструкций Graphics Core Next (GCN). Первым продуктом, получившим название RDNA, была Radeon RX 5000 . серия видеокарт [ 51 ]
Компания объявила, что преемник микроархитектуры RDNA будет инкрементным (так называемым обновлением). AMD представила серию Radeon RX 6000 , свои видеокарты RDNA 2 с поддержкой аппаратно-ускоренной трассировки лучей. [ 52 ] Серия продуктов, выпущенная в конце 2020 года, состояла из RX 6800, RX 6800 XT и RX 6900 XT. [ 53 ] [ 54 ] RX 6700 XT, основанный на Navi 22, был выпущен в начале 2021 года. [ 55 ]
PlayStation 5 , Xbox Series X и Series S были выпущены в 2020 году; они оба используют графические процессоры на основе микроархитектуры RDNA 2 с постепенными улучшениями и различными конфигурациями графических процессоров в каждой реализации системы. [ 56 ] [ 57 ] [ 58 ]
Intel впервые вышла на рынок графических процессоров в конце 1990-х годов, но производила тусклые 3D-ускорители по сравнению с конкурентами того времени. Вместо того, чтобы пытаться конкурировать с производителями high-end оборудования Nvidia и ATI/AMD, они начали интегрировать графические процессоры Intel Graphics Technology в наборы микросхем материнских плат, начиная с Intel 810 для Pentium III, а затем и в процессоры. Они начали с процессора Intel Atom Pineview для ноутбуков в 2009 году, а в 2010 году продолжили процессоры для настольных ПК первого поколения линейки Intel Core , а также современные процессоры Pentium и Celeron. Это привело к большой номинальной доле рынка, поскольку большинство компьютеров с процессором Intel также имели этот встроенный графический процессор. Они обычно отставали от дискретных процессоров по производительности. Intel вновь вышла на рынок дискретных графических процессоров в 2022 году со своей серией Arc , которая конкурировала с нынешними картами серии GeForce 30 и Radeon 6000 по конкурентоспособным ценам. [ нужна ссылка ]
2020-е годы
[ редактировать ]В 2020-х годах графические процессоры все чаще стали использоваться для вычислений, связанных с досадно параллельными задачами, такими как обучение нейронных сетей на огромных наборах данных, которые необходимы для больших языковых моделей . Специализированные вычислительные ядра на графических процессорах некоторых современных рабочих станций предназначены для глубокого обучения , поскольку они значительно увеличивают производительность FLOPS за счет использования матричного умножения и деления 4 × 4, что приводит к производительности оборудования до 128 TFLOPS в некоторых приложениях. [ 59 ] Ожидается, что эти тензорные ядра появятся и в потребительских картах. [ нужно обновить ] [ 60 ]
Компании, производящие графические процессоры
[ редактировать ]Многие компании производят графические процессоры под разными торговыми марками. В 2009 году [ нужно обновить ] Intel , Nvidia и AMD / ATI лидировали на рынке с долями рынка 49,4%, 27,8% и 20,6% соответственно. Кроме того, Матрокс [ 61 ] производит графические процессоры. В современных смартфонах используются в основном графические процессоры Adreno от Qualcomm , графические процессоры PowerVR от Imagination Technologies и графические процессоры Mali от ARM .
Вычислительные функции
[ редактировать ]Современные графические процессоры традиционно используют большую часть своих транзисторов для выполнения вычислений, связанных с компьютерной 3D-графикой . В дополнение к аппаратному обеспечению 3D современные графические процессоры включают в себя базовое 2D-ускорение и возможности кадрового буфера (обычно с режимом совместимости с VGA). В новых картах, таких как AMD/ATI HD5000–HD7000, отсутствует специальное 2D-ускорение; он эмулируется 3D-оборудованием. Изначально графические процессоры использовались для ускорения ресурсоемкой работы по наложению текстур и рендерингу полигонов. Позже единицы [ нужны разъяснения ] были добавлены для ускорения геометрических таких как вращение и перевод вершин вычислений , в разные системы координат . Последние разработки в области графических процессоров включают поддержку программируемых шейдеров , которые могут манипулировать вершинами и текстурами с помощью многих из тех же операций, которые поддерживаются центральными процессорами , методы передискретизации и интерполяции для уменьшения псевдонимов , а также очень высокоточные цветовые пространства .
Несколько факторов конструкции графического процессора влияют на производительность карты при рендеринге в реальном времени, например, размер разъемов при изготовлении полупроводниковых устройств , частота тактового сигнала , а также количество и размер различных кэшей памяти на кристалле . На производительность также влияет количество потоковых мультипроцессоров (SM) для графических процессоров NVidia или вычислительных блоков (CU) для графических процессоров AMD или ядер Xe для дискретных графических процессоров Intel, которые описывают количество ядерных процессорных блоков в кристалле графического процессора. которые выполняют основные вычисления, обычно работая параллельно с другими SM/CU на графическом процессоре. Производительность графического процессора обычно измеряется в операциях с плавающей запятой в секунду ( флопс ); Графические процессоры 2010-х и 2020-х годов обычно обеспечивают производительность, измеряемую в терафлопсах (терафлопс). Это приблизительный показатель производительности, поскольку на фактическую скорость отображения могут влиять и другие факторы. [ 62 ]
Декодирование и кодирование видео с ускорением графического процессора
[ редактировать ]Большинство графических процессоров, выпущенных с 1995 года, поддерживают YUV цветовое пространство и аппаратные наложения , важные для воспроизведения цифрового видео , а многие графические процессоры, выпущенные с 2000 года, также поддерживают примитивы MPEG , такие как компенсация движения и iDCT . Это декодирование видео с аппаратным ускорением, при котором части процесса декодирования видео и постобработки видео перекладываются на аппаратное обеспечение графического процессора, обычно называется «декодированием видео с ускорением графического процессора», «декодированием видео с помощью графического процессора», «декодированием видео с аппаратным ускорением графического процессора». декодирование видео» или «декодирование видео с аппаратной поддержкой графического процессора».
Последние видеокарты декодируют видео высокой четкости на карте, разгружая центральный процессор. Наиболее распространенными API-интерфейсами для декодирования видео с ускорением на графическом процессоре являются DxVA для Microsoft Windows операционных систем и VDPAU , VAAPI , XvMC и XvBA для Linux и UNIX-подобных операционных систем. Все, кроме XvMC, способны декодировать видео, закодированные в форматах MPEG-1 , MPEG-2 , MPEG-4 ASP (MPEG-4 Part 2) , MPEG-4 AVC (H.264/DivX 6), VC-1 , WMV3 / WMV9. , Xvid /OpenDivX (DivX 4) и DivX 5 кодеки , тогда как XvMC способен декодировать только MPEG-1 и MPEG-2.
Существует несколько специализированных аппаратных решений для декодирования и кодирования видео .
Процессы декодирования видео, которые можно ускорить
[ редактировать ]Процессы декодирования видео, которые можно ускорить с помощью современного оборудования графического процессора:
- Компенсация движения (мокомп)
- Обратное дискретное косинусное преобразование (iDCT)
- Обратная телекинокоррекция 3:2 и 2:2
- Обратное модифицированное дискретное косинусное преобразование (iMDCT)
- Внутриконтурный фильтр деблокировки
- Внутрикадровое предсказание
- Обратное квантование (IQ)
- Декодирование переменной длины (VLD) , более известное как ускорение на уровне слайсов.
- Пространственно-временной деинтерлейсинг и автоматическое развертки чересстрочной / прогрессивной обнаружение источника
- Обработка битового потока ( контекстно-адаптивное кодирование переменной длины / контекстно-адаптивное двоичное арифметическое кодирование ) и идеальное позиционирование пикселей
Эти операции также применяются при редактировании, кодировании и перекодировании видео.
API 2D-графики
[ редактировать ]Более ранние графические процессоры могут поддерживать один или несколько API 2D-графики для 2D-ускорения, например GDI и DirectDraw . [ 63 ]
API 3D-графики
[ редактировать ]Графический процессор может поддерживать один или несколько API 3D-графики, например DirectX , Metal , OpenGL , OpenGL ES , Vulkan .
Формы графического процессора
[ редактировать ]Терминология
[ редактировать ]В 1970-х годах термин «графический процессор» первоначально обозначал графический процессор и описывал программируемый процессор, работающий независимо от центрального процессора и отвечающий за графические манипуляции и вывод. [ 64 ] [ 65 ] В 1994 году Sony использовала этот термин (теперь обозначающий графический процессор ) в отношении PlayStation для консоли Toshiba , разработанного графического процессора Sony . [ 31 ] Этот термин был популяризирован компанией Nvidia в 1999 году, которая позиционировала GeForce 256 как «первый в мире графический процессор». [ 66 ] Он был представлен как «однокристальный процессор со встроенными механизмами преобразования, освещения, настройки/обрезки треугольников и рендеринга». [ 67 ] Конкурирующая компания ATI Technologies ввела термин « визуальный процессор » или VPU вместе с выпуском Radeon 9700 в 2002 году. [ 68 ] AMD Alveo MA35D оснащен двумя видеопроцессорами, каждый из которых использует 5-нм техпроцесс в 2023 году. [ 69 ]
В персональных компьютерах существует две основные формы графических процессоров. У каждого есть много синонимов: [ 70 ]
- Выделенная графика также называется дискретной графикой .
- Интегрированная графика также называется общими графическими решениями , интегрированными графическими процессорами (IGP) или унифицированной архитектурой памяти (UMA).
Графический процессор для конкретного использования
[ редактировать ]Большинство графических процессоров предназначены для конкретного использования, трехмерной графики в реальном времени или других массовых вычислений:
- Игры
- Облачные игры
- Нвидиа ГРИД
- Радеон Скай
- Рабочая станция
- Облачная рабочая станция
- Обучение искусственному интеллекту и облачным технологиям
- Автоматизированный/беспилотный автомобиль
- Нвидиа Драйв ПХ
Выделенный графический процессор
[ редактировать ]Выделенные графические процессоры используют оперативную память , выделенную для графического процессора, а не основную системную память компьютера. Эта оперативная память обычно специально выбирается с учетом ожидаемой последовательной нагрузки видеокарты (см. GDDR ). Иногда системы с выделенными дискретными графическими процессорами назывались системами «DIS», а не системами «UMA» (см. следующий раздел). [ 71 ]
Выделенные графические процессоры не обязательно являются съемными и не обязательно взаимодействуют с материнской платой стандартным образом. Термин «выделенный» относится к тому факту, что видеокарты имеют оперативную память, предназначенную для использования карты, а не к тому факту, что большинство выделенных графических процессоров являются съемными. Выделенные графические процессоры для портативных компьютеров чаще всего подключаются через нестандартный и часто собственный слот из-за ограничений по размеру и весу. Такие порты по-прежнему могут считаться PCIe или AGP с точки зрения их логического хост-интерфейса, даже если они физически не взаимозаменяемы со своими аналогами.
Видеокарты с выделенными графическими процессорами обычно взаимодействуют с материнской платой посредством слота расширения, такого как PCI Express (PCIe) или ускоренного графического порта (AGP). Обычно их можно относительно легко заменить или обновить, при условии, что материнская плата способна поддерживать обновление. Некоторые видеокарты по-прежнему используют слоты Peripheral Component Interconnect (PCI), но их пропускная способность настолько ограничена, что они обычно используются только тогда, когда слот PCIe или AGP недоступен.
Такие технологии, как Scan-Line Interleave от 3dfx, SLI и NVLink от Nvidia и CrossFire от AMD, позволяют нескольким графическим процессорам одновременно рисовать изображения на одном экране, увеличивая вычислительную мощность, доступную для графики. Однако эти технологии становятся все более редкими; большинство игр не используют в полной мере несколько графических процессоров, поскольку большинство пользователей не могут себе это позволить. [ 72 ] [ 73 ] [ 74 ] Несколько графических процессоров до сих пор используются на суперкомпьютерах (как в Summit ), на рабочих станциях для ускорения видео (обработка нескольких видео одновременно) [ 75 ] [ 76 ] [ 77 ] и 3D-рендеринг, [ 78 ] для визуальных эффектов , [ 79 ] Рабочие нагрузки GPGPU и моделирование, [ 80 ] и в области искусственного интеллекта для ускорения обучения, как в случае с линейкой рабочих станций и серверов DGX от Nvidia, графическими процессорами Tesla и графическими процессорами Intel Ponte Vecchio.
Встроенный графический процессор
[ редактировать ]Интегрированные графические процессоры (IGPU), интегрированная графика , общие графические решения , интегрированные графические процессоры (IGP) или унифицированные архитектуры памяти (UMA) используют часть системной оперативной памяти компьютера, а не выделенную графическую память. IGP могут быть интегрированы в материнскую плату как часть чипсета северного моста . [ 81 ] или на одном кристалле (интегральной схеме) с процессором (например, AMD APU или Intel HD Graphics ). На некоторых материнских платах [ 82 ] IGP AMD могут использовать выделенную память бокового порта: отдельный фиксированный блок высокопроизводительной памяти, предназначенный для использования графическим процессором. По состоянию на начало 2007 г. [update] компьютеры со встроенной графикой составляют около 90% всех поставок ПК. [ 83 ] [ нужно обновить ] Их реализация менее затратна, чем специализированная обработка графики, но, как правило, они менее эффективны. Исторически интегрированная обработка считалась непригодной для 3D-игр или графически насыщенных программ, но могла запускать менее ресурсоемкие программы, такие как Adobe Flash. Примерами таких IGP могут быть предложения SiS и VIA примерно в 2004 году. [ 84 ] Однако современные интегрированные графические процессоры, такие как ускоренный процессор AMD и графическая технология Intel (HD, UHD, Iris, Iris Pro, Iris Plus и Xe-LP ), могут обрабатывать 2D-графику или 3D-графику с низким уровнем нагрузки.
Поскольку вычисления графического процессора требуют большого объема памяти, встроенная обработка может конкурировать с центральным процессором за относительно медленную системную оперативную память, поскольку она имеет минимальную выделенную видеопамять или вообще ее не имеет. IGP используют системную память с пропускной способностью до текущего максимума 128 ГБ/с, тогда как дискретная видеокарта может иметь пропускную способность более 1000 ГБ/с между ее видеопамятью и ядром графического процессора. Такая пропускная способность шины памяти может ограничивать производительность графического процессора, хотя многоканальная память может смягчить этот недостаток. [ 85 ] В старых чипсетах интегрированной графики отсутствовали аппаратные преобразования и подсветка , но в новых они есть. [ 86 ] [ 87 ]
В системах с «унифицированной архитектурой памяти» (UMA), включая современные процессоры AMD со встроенной графикой, [ 88 ] современные процессоры Intel со встроенной графикой, [ 89 ] Процессоры Apple, серии PS5 и Xbox (среди прочих), ядра ЦП и блок графического процессора используют один и тот же пул ОЗУ и адресное пространство памяти. Это позволяет системе динамически распределять память между ядрами ЦП и блоком графического процессора в зависимости от потребностей памяти (без необходимости большого статического разделения ОЗУ), а благодаря нулевой передаче копий устраняется необходимость либо копирования данных по шине (вычисления ) между физически отдельными пулами ОЗУ или копированием между отдельными адресными пространствами в одном физическом пуле ОЗУ, что позволяет более эффективно передавать данные.
Гибридная графическая обработка
[ редактировать ]Гибридные графические процессоры конкурируют со встроенной графикой на рынках недорогих настольных компьютеров и ноутбуков. Наиболее распространенными реализациями этого являются HyperMemory от ATI и TurboCache от Nvidia .
Гибридные видеокарты несколько дороже интегрированных, но гораздо дешевле дискретных видеокарт. Они разделяют память с системой и имеют небольшой выделенный кеш-память, чтобы компенсировать высокую задержку системной оперативной памяти. Технологии PCI Express делают это возможным. Хотя эти решения иногда рекламируются как имеющие до 768 МБ ОЗУ, это относится к тому, какой объем может использоваться совместно с системной памятью.
Потоковая обработка и графические процессоры общего назначения (GPGPU)
[ редактировать ]Обычно используется графический процессор общего назначения (GPGPU) в качестве модифицированной формы потокового процессора (или векторного процессора ), на котором выполняются вычислительные ядра . Это превращает огромную вычислительную мощность шейдерного конвейера современного графического ускорителя в вычислительную мощность общего назначения. В некоторых приложениях, требующих массивных векторных операций, это может обеспечить производительность на несколько порядков выше, чем у обычного ЦП. Два крупнейших производителя дискретных графических процессоров (см. выше « Выделенный графический процессор »), AMD и Nvidia , реализуют этот подход во множестве приложений. И Nvidia, и AMD объединились со Стэнфордским университетом для создания клиента на базе графического процессора для проекта распределенных вычислений Folding@home для расчета сворачивания белков. В определенных обстоятельствах графический процессор выполняет вычисления в сорок раз быстрее, чем центральные процессоры, традиционно используемые такими приложениями. [ 90 ] [ 91 ]
GPGPU можно использовать для многих типов невероятно параллельных задач, включая трассировку лучей . Они обычно подходят для вычислений с высокой пропускной способностью, которые демонстрируют параллелизм данных с широкой векторной шириной для использования архитектуры SIMD графического процессора.
Высокопроизводительные компьютеры на базе графических процессоров играют важную роль в крупномасштабном моделировании. Три из десяти самых мощных суперкомпьютеров в мире используют ускорение графического процессора. [ 92 ]
Графические процессоры поддерживают расширения API для языка программирования C, такие как OpenCL и OpenMP . Более того, каждый поставщик графических процессоров представил свой собственный API, который работает только со своими картами: AMD APP SDK от AMD и CUDA от Nvidia. Они позволяют функциям, называемым вычислительными ядрами, работать на потоковых процессорах графического процессора. Это позволяет программам на C использовать преимущества способности графического процессора параллельно работать с большими буферами, при этом при необходимости используя процессор. CUDA был первым API, который позволял приложениям на базе ЦП напрямую обращаться к ресурсам графического процессора для вычислений более общего назначения без ограничений использования графического API. [ нужна ссылка ]
С 2005 года наблюдается интерес к использованию производительности графических процессоров для эволюционных вычислений в целом и для ускорения оценки приспособленности в генетическом программировании в частности. Большинство подходов компилируют линейные или древовидные программы на главном ПК и передают исполняемый файл на графический процессор для запуска. Обычно преимущество в производительности достигается только за счет одновременного запуска одной активной программы и решения множества примеров задач с использованием архитектуры SIMD графического процессора . [ 93 ] Однако существенного ускорения можно получить и не компилируя программы, а передавая их на графический процессор для интерпретации там. [ 94 ] Ускорение может быть достигнуто либо одновременной интерпретацией нескольких программ, одновременным выполнением нескольких примеров задач, либо комбинацией того и другого. Современный графический процессор может одновременно интерпретировать сотни тысяч очень маленьких программ.
Внешний графический процессор (eGPU)
[ редактировать ]Внешний графический процессор — это графический процессор, расположенный вне корпуса компьютера, похожий на большой внешний жесткий диск. В портативных компьютерах иногда используются внешние графические процессоры. Ноутбуки могут иметь значительный объем оперативной памяти и достаточно мощный центральный процессор (ЦП), но часто не имеют мощного графического процессора и вместо этого имеют менее мощный, но более энергоэффективный встроенный графический чип. Встроенные графические чипы зачастую недостаточно мощны для видеоигр или других графически ресурсоемких задач, таких как редактирование видео или 3D-анимация/рендеринг.
Поэтому желательно подключить графический процессор к какой-нибудь внешней шине ноутбука. PCI Express — единственная шина, используемая для этой цели. Порт может быть, например, портом ExpressCard или mPCIe (PCIe ×1, до 5 или 2,5 Гбит/с соответственно), портом Thunderbolt 1, 2 или 3 (PCIe ×4, до 10, 20 или 40 Гбит/с соответственно) или порт OCuLink . Эти порты доступны только на некоторых ноутбуках. [ 95 ] [ 96 ] Корпуса eGPU включают в себя собственный источник питания (PSU), поскольку мощные графические процессоры могут потреблять сотни ватт. [ 97 ]
Официальная поддержка внешних графических процессоров поставщиками набирает обороты. Важным событием стало решение Apple о поддержке внешних графических процессоров в MacOS High Sierra 10.13.4. [ 98 ] Несколько крупных поставщиков оборудования (HP, Razer) выпустили корпуса eGPU Thunderbolt 3. [ 99 ] [ 100 ] Эта поддержка стимулирует внедрение eGPU энтузиастами. [ нужны разъяснения ] [ 101 ]
Энергоэффективность
[ редактировать ]Графические процессоры (GPU) продолжают потреблять больше энергии, в то время как разработчики процессоров в последнее время [ когда? ] сосредоточено на повышении производительности на ватт. Высокопроизводительные графические процессоры могут потреблять большое количество энергии, поэтому для управления энергопотреблением графических процессоров необходимы интеллектуальные методы. Такие показатели, как показатель 3DMark2006 на ватт, могут помочь определить более эффективные графические процессоры. [ 102 ] Однако это может не обеспечивать адекватную эффективность при обычном использовании, когда много времени тратится на выполнение менее требовательных задач. [ 103 ]
В современных графических процессорах потребление энергии является важным ограничением максимальных вычислительных возможностей, которых можно достичь. Конструкции графических процессоров обычно хорошо масштабируются, что позволяет производителю устанавливать несколько чипов на одну видеокарту или использовать несколько видеокарт, работающих параллельно. Пиковая производительность любой системы по существу ограничена количеством энергии, которую она может потреблять, и количеством тепла, которое она может рассеивать. Следовательно, производительность на ватт графического процессора напрямую преобразуется в пиковую производительность системы, использующей эту конструкцию.
Поскольку графические процессоры также могут использоваться для некоторых вычислений общего назначения , иногда их производительность измеряется в терминах, также применяемых к процессорам, например, в FLOPS на ватт.Продажи
[ редактировать ]В 2013 году по всему миру было поставлено 438,3 миллиона графических процессоров, а прогноз на 2014 год составил 414,2 миллиона. Однако к третьему кварталу 2022 года поставки интегрированных графических процессоров составили около 75,5 млн единиц, что на 19% меньше, чем в прошлом году. [ 104 ] [ нужно обновить ] [ 105 ]
См. также
[ редактировать ]- Блок текстурирования (TMU)
- Блок вывода рендеринга (ROP)
- Атака грубой силы
- Компьютерное оборудование
- Компьютерный монитор
- Кэш графического процессора
- Виртуализация графического процессора
- Многоядерный процессор
- Физический процессор (ППУ)
- Тензорный процессор (ТПУ)
- Аппаратное обеспечение трассировки лучей
- Программный рендеринг
- Блок обработки изображений (VPU)
- Векторный процессор
- Видеокарта
- Контроллер видеодисплея
- Игровая консоль
- ИИ-ускоритель
- Внутренние особенности векторного процессора графического процессора
Аппаратное обеспечение
[ редактировать ]- Список графических процессоров AMD
- Список графических процессоров Nvidia
- Список графических процессоров Intel
- Интел ГМА
- Ларраби
- Nvidia PureVideo – технология битового потока от Nvidia, используемая в их графических чипах для ускорения декодирования видео на аппаратном графическом процессоре с DXVA.
- SoC
- UVD (Unified Video Decoder) — технология декодирования битового потока видео от ATI для поддержки аппаратного декодирования (GPU) с DXVA.
API
[ редактировать ]- API OpenGL
- API DirectX Video Acceleration (DxVA) для Microsoft Windows . операционной системы
- Мантия (API)
- Вулкан (API)
- API ускорения видео (VA API)
- VDPAU (API декодирования и представления видео для Unix)
- X-Video Bitstream Acceleration (XvBA) , X11-эквивалент DXVA для MPEG-2, H.264 и VC-1.
- Компенсация движения X-Video — эквивалент X11, только для видеокодека MPEG-2.
Приложения
[ редактировать ]- Кластер графического процессора
- Mathematica – включает встроенную поддержку выполнения CUDA и OpenCL на графическом процессоре.
- Молекулярное моделирование на GPU
- Deeplearning4j — распределенное глубокое обучение с открытым исходным кодом для Java.
Ссылки
[ редактировать ]- ^ Хейг, Джеймс (10 сентября 2013 г.). «Почему существуют специализированные игровые консоли?» . Программирование в XXI веке . Архивировано из оригинала 4 мая 2015 года . Проверено 11 ноября 2015 г.
- ^ «mame/8080bw.c на master 路 mamedev/mame 路 GitHub» . Гитхаб . Архивировано из оригинала 21 ноября 2014 г.
- «mame/mw8080bw.c на master 路 mamedev/mame 路 GitHub» . Гитхаб . Архивировано из оригинала 21 ноября 2014 г.
- «Аркады/SpaceInvaders – Компьютерная археология» . www.computerarcheology.com . Архивировано из оригинала 13 сентября 2014 г.
- ^ «mame/galaxian.c на master или mamedev/mame или GitHub» . Гитхаб . Архивировано из оригинала 2 ноября 2014 г.
- ^ «mame/galaxian.c на master или mamedev/mame или GitHub» . Гитхаб . Архивировано из оригинала 2 ноября 2014 г.
- «МАМЕ – src/mame/drivers/galdrvr.c» . Архивировано из оригинала 3 января 2014 года.
- ^ Спрингманн, Алессондра. «Разборка Atari 2600: что внутри вашей старой консоли?» . Вашингтон Пост . Архивировано из оригинала 14 июля 2015 года . Проверено 14 июля 2015 г.
- ^ «Что такое чипы 6502, ANTIC, CTIA/GTIA, POKEY и FREDDIE?» . Atari8.com . Архивировано из оригинала 5 марта 2016 г.
- ^ Вигерс, Карл Э. (апрель 1984 г.). «Прерывания списка отображения Atari» . Вычислите! (47): 161. Архивировано из оригинала 4 марта 2016 г.
- ^ Вигерс, Карл Э. (декабрь 1985 г.). «Тонкая прокрутка Atari» . Вычислите! (67): 110. Архивировано из оригинала 16 февраля 2006 г.
- ^ Хопгуд, Ф. Роберт А.; Хабболд, Роджер Дж.; Дуче, Дэвид А., ред. (1986). Достижения в области компьютерной графики II . Спрингер. п. 169. ИСБН 9783540169109 .
Пожалуй, самым известным из них является NEC 7220.
- ^ Андерсон, Мэриан (18 июля 2018 г.). «Известные графические чипы: контроллер графического дисплея NEC μPD7220» . Компьютерное общество IEEE . Проверено 17 октября 2023 г.
- ^ Риддл, Шон. «Блиттерская информация» . Архивировано из оригинала 22 декабря 2015 г.
- ^ Вольф, Марк Дж. П. (июнь 2012 г.). Перед крахом: ранняя история видеоигр . Издательство Государственного университета Уэйна. п. 185. ИСБН 978-0814337226 .
- ^ Андерсон, Мэриан (07 октября 2018 г.). «История графического процессора: Hitachi ARTC HD63484» . Компьютерное общество IEEE . Проверено 17 октября 2023 г.
- ^ «Знаменитые графические чипы: TI TMS34010 и VRAM. Первый чип программируемого графического процессора | IEEE Computer Society» . 10 января 2019 г.
- ^ «Х68000» . Архивировано из оригинала 3 сентября 2014 г. Проверено 12 сентября 2014 г.
- ^ "музей ~ Sharp X68000" . Old-computers.com. Архивировано из оригинала 19 февраля 2015 г. Проверено 28 января 2015 г.
- ^ «Hardcore Gaming 101: Японские ретро-компьютеры: последний рубеж игр» . hardcoregaming101.net . Архивировано из оригинала 13 января 2011 г.
- ^ «Система 16 – Оборудование Namco System 21 (Namco)» . system16.com . Архивировано из оригинала 18 мая 2015 г.
- ^ «Система 16 — Оборудование пневматической системы Taito (Taito)» . system16.com . Архивировано из оригинала 16 марта 2015 г.
- ^ Браунштейн, Марк (14 ноября 1988 г.). «NEC формирует группу по стандартам видео» . Инфомир . Том. 10, нет. 46. с. 3. ISSN 0199-6649 . Проверено 27 мая 2016 г.
- ^ «Видеоплаты S3» . Инфомир . 14 (20): 62. 18 мая 1992. Архивировано из оригинала 22 ноября 2017 года . Проверено 13 июля 2015 г.
- ^ «Что означают цифры» . Журнал ПК . 12 : 128. 23 февраля 1993. Архивировано из оригинала 11 апреля 2017 года . Проверено 29 марта 2016 г.
- Певец, Грэм. «История современного графического процессора» . Техспот. Архивировано из оригинала 29 марта 2016 года . Проверено 29 марта 2016 г.
- ^ «Система 16 — оборудование симулятора Namco Magic Edge Hornet (Namco)» . system16.com . Архивировано из оригинала 12 сентября 2014 г.
- ^ «MAME – src/mame/video/model2.c» . Архивировано из оригинала 4 января 2013 года.
- ^ «Система 16 — Оборудование Sega Model 2 (Sega)» . system16.com . Архивировано из оригинала 21 декабря 2010 г.
- ^ «Набор микросхем процессора 3D-графики» (PDF) . Архивировано из оригинала (PDF) 11 октября 2016 г. Проверено 8 августа 2016 г.
- «Система 3D-CG с видеотекстурированием для персональных компьютеров» (PDF) . Архивировано из оригинала (PDF) 6 сентября 2014 г. Проверено 8 августа 2016 г.
- ^ «Fujitsu разрабатывает первый в мире процессор трехмерной геометрии» . fujitsu.com . Архивировано из оригинала 12 сентября 2014 г.
- ^ «Nintendo 64 — одно из величайших игровых устройств всех времен» . ксенол . Архивировано из оригинала 18 ноября 2015 г.
- ^ «Набор микросхем 3DPro/2mp от Mitsubishi устанавливает новые рекорды самого быстрого ускорителя 3D-графики для систем Windows NT; 3DPro/2mp лидирует в производительности Viewperf; другие высокопроизводительные тесты ясно показывают, что производительность 3DPro превосходит всех конкурентов Windows NT» . Архивировано из оригинала 15 ноября 2018 г. Проверено 18 февраля 2022 г.
- ^ Власк. «VGA Legacy MKIII – Diamond Fire GL 4000 (Mitsubishi 3DPro/2mp)» . Архивировано из оригинала 18 ноября 2015 г.
- ^ Jump up to: а б «Пришло ли время переименовать графический процессор? | Компьютерное общество IEEE» . 17 июля 2018 г.
- ^ Дрейер, Сорен. «Bump Mapping с использованием компьютерной графики (3-е издание)» . Архивировано из оригинала 20 января 2010 г. Проверено 30 мая 2007 г.
- ^ Райна, Раджат; Мадхаван, Ананд; Нг, Эндрю Ю. (14 июня 2009 г.). «Масштабное глубокое обучение без учителя с использованием графических процессоров». Материалы 26-й ежегодной международной конференции по машинному обучению – ICML '09 . Dl.acm.org. стр. 1–8. дои : 10.1145/1553374.1553486 . ISBN 9781605585161 . S2CID 392458 .
- ^ «Операторы линейной алгебры для реализации численных алгоритмов на графическом процессоре» , Крюгер и Вестерманн, Международная конференция по компьютерной графике и интерактивным методам, 2005 г.
- ^ Лиепе; и др. (2010). «ABC-SysBio — приближенные байесовские вычисления на Python с поддержкой графического процессора» . Биоинформатика . 26 (14): 1797–1799. doi : 10.1093/биоинформатика/btq278 . ПМЦ 2894518 . ПМИД 20591907 . Архивировано из оригинала 05.11.2015 . Проверено 15 октября 2010 г.
- ^ Сандерс, Джейсон; Кандрот, Эдвард (19 июля 2010 г.). CUDA на примере: введение в программирование на графическом процессоре общего назначения, переносимые документы . Аддисон-Уэсли Профессионал. ISBN 9780132180139 . Архивировано из оригинала 12 апреля 2017 г.
- ^ «OpenCL — открытый стандарт параллельного программирования гетерогенных систем» . khronos.org . Архивировано из оригинала 9 августа 2011 г.
- ^ Хэнди, Алекс (28 сентября 2011 г.). «AMD помогает OpenCL завоевать позиции в сфере высокопроизводительных вычислений» . СД Таймс . Проверено 4 июня 2023 г.
- ^ Теглет, Траян (8 января 2010 г.). «NVIDIA Tegra внутри каждого автомобиля Audi 2010 года» . Архивировано из оригинала 4 октября 2016 г. Проверено 3 августа 2016 г.
- ^ «В школе идут занятия – беспилотная система Nvidia учится, наблюдая» . 30 апреля 2016 г. Архивировано из оригинала 1 мая 2016 г. Проверено 3 августа 2016 г.
- ^ «Серия AMD Radeon HD 6000M – не называйте ее ATI!» . CNET . Архивировано из оригинала 11 октября 2016 г. Проверено 3 августа 2016 г.
- ^ «Обзор NVIDIA GeForce GTX 680 2 ГБ» . Архивировано из оригинала 11 сентября 2016 г. Проверено 3 августа 2016 г.
- ^ «Xbox One против PlayStation 4: какая игровая консоль лучше?» . ЭкстримТех . Проверено 13 мая 2019 г.
- ^ «Кеплер ТМ ГК110» (PDF) . Корпорация NVIDIA. 2012. Архивировано (PDF) из оригинала 11 октября 2016 года . Проверено 3 августа 2016 г.
- ^ «Тайваньская компания по производству полупроводников с ограниченной ответственностью» . www.tsmc.com . Архивировано из оригинала 10 августа 2016 г. Проверено 3 августа 2016 г.
- ^ «Сборка ПК для HTC Vive» . 16 июня 2016 г. Архивировано из оригинала 29 июля 2016 г. Проверено 3 августа 2016 г.
- ^ «Компьютеры с поддержкой VIVE» . Виве. Архивировано из оригинала 24 февраля 2016 г. Проверено 30 июля 2021 г.
- ^ «Чудовищный графический процессор Pascal от NVIDIA оснащен передовыми технологиями и содержит 15 миллиардов транзисторов» . 5 апреля 2016 г. Архивировано из оригинала 31 июля 2016 г. Проверено 3 августа 2016 г.
- ^ Саркар, Самит (20 августа 2018 г.). «Раскрыты графические процессоры Nvidia RTX 2070, RTX 2080, RTX 2080 Ti: характеристики, цена, дата выпуска» . Полигон . Проверено 11 сентября 2019 г.
- ^ «Графические процессоры AMD RX 480, 470 и 460 Polaris обеспечат «самый революционный скачок производительности»» . 16 января 2016 г. Архивировано из оригинала 1 августа 2016 г. Проверено 3 августа 2016 г.
- ^ Пресс-релиз AMD: «AMD анонсирует передовые продукты нового поколения на выставке Computex 2019» . АМД . Проверено 5 октября 2019 г.
- ^ «AMD представит новые графические процессоры RDNA следующего поколения в 2020 году, а не типичное «обновление» Navi» . Аппаратное обеспечение Тома . 29 января 2020 г. Проверено 8 февраля 2020 г.
- Гарреффа, Энтони (9 сентября 2020 г.). «28 октября компания AMD представит видеокарты следующего поколения Big Navi RDNA 2» . ТвикТаун . Проверено 9 сентября 2020 г.
- Лайлс, Тейлор (9 сентября 2020 г.). «Процессоры AMD Zen 3 следующего поколения и графический процессор Radeon RX 6000 Big Navi будут представлены в следующем месяце» . Грань . Проверено 10 сентября 2020 г.
- ^ «AMD сообщает показатели производительности карты Radeon RX 6000: нацелены на 3080?» . АнандТех . 08.10.2020 . Проверено 25 октября 2020 г.
- «AMD объявляет о презентациях Ryzen Zen 3 и Radeon RDNA2 в октябре: новое путешествие начинается» . АнандТех . 09.09.2020 . Проверено 25 октября 2020 г.
- ^ Джадд, Уилл (28 октября 2020 г.). «AMD представляет три видеокарты Radeon 6000 с трассировкой лучей и производительностью, превосходящей RTX» . Еврогеймер . Проверено 28 октября 2020 г.
- ^ Муджтаба, Хасан (30 ноября 2020 г.). «Сообщается, что специальные модели AMD Radeon RX 6700 XT с графическим процессором Navi 22 повышают частоту до 2,95 ГГц» . Wccftech . Проверено 3 декабря 2020 г.
- Тайсон, Марк (3 декабря 2020 г.). «Выступление генерального директора AMD запланировано на выставке CES 2020 12 января» . ГЕКСУС . Проверено 3 декабря 2020 г.
- Катресс, Ян (12 января 2021 г.). «AMD выпустит настольную графику RDNA 2 среднего класса в первой половине 2021 года» . АнандТех . Проверено 4 января 2021 г.
- ^ Фанк, Бен (12 декабря 2020 г.). «Sony PS5 подвергается полному разбору с подробным описанием достоинств и славы RDNA 2» . Горячее оборудование . Архивировано из оригинала 12 декабря 2020 года . Проверено 3 января 2021 г.
- ^ Гартенберг, Хаим (18 марта 2020 г.). «Sony раскрывает полные характеристики оборудования PS5» . Грань . Проверено 3 января 2021 г.
- ^ Смит, Райан. «Microsoft раскрывает дополнительные технические характеристики Xbox Series X: Zen 2 + RDNA 2, графический процессор с производительностью 12 терафлопс, HDMI 2.1 и специальный твердотельный накопитель» . АнандТех . Проверено 19 марта 2020 г.
- ^ Смит, Райан. «Представление NVIDIA Volta: анонсирован графический процессор GV100 и ускоритель Tesla V100» . АнандТех . Проверено 16 августа 2018 г.
- ^ Хилл, Брэндон (11 августа 2017 г.). «Сообщается, что 7-нм графическая архитектура AMD Navi будет включать выделенную схему искусственного интеллекта» . Горячее оборудование . Архивировано из оригинала 17 августа 2018 года . Проверено 16 августа 2018 г.
- ^ «Matrox Graphics – Продукты – Видеокарты» . Matrox.com. Архивировано из оригинала 5 февраля 2014 г. Проверено 21 января 2014 г.
- ^ Грушка, Джоэл (10 февраля 2021 г.). «Как работают видеокарты?» . Экстремальные технологии . Проверено 17 июля 2021 г.
- ^ Предварительные данные CL-GD5446 64-битного VisualMedia Accelerator (PDF) , Cirrus Logic, ноябрь 1996 г. , получено 30 января 2024 г. - из архива таблиц данных
- ^ Бэррон, ET; Глориозо, РМ (сентябрь 1973 г.). «Микроуправляемый периферийный процессор». Протокол конференции 6-го ежегодного семинара по микропрограммированию – MICRO 6 . стр. 122–128. дои : 10.1145/800203.806247 . ISBN 9781450377836 . S2CID 36942876 .
- ^ Левин, Кен (август 1978 г.). «Основной стандартный графический пакет для VGI 3400» . ACM SIGGRAPH Компьютерная графика . 12 (3): 298–300. дои : 10.1145/965139.807405 .
- ^ «NVIDIA выпускает первый в мире графический процессор: GeForce 256» . Нвидиа. 31 августа 1999 года. Архивировано из оригинала 12 апреля 2016 года . Проверено 28 марта 2016 г.
- ^ «Графический процессор (GPU)» . Нвидиа. 16 декабря 2009 года. Архивировано из оригинала 8 апреля 2016 года . Проверено 29 марта 2016 г.
- ^ Пабст, Томас (18 июля 2002 г.). «ATi берет на себя лидерство в 3D-технологиях с Radeon 9700» . Аппаратное обеспечение Тома . Проверено 29 марта 2016 г.
- ^ Чайлд, Дж. (6 апреля 2023 г.). «AMD представляет 5-нм ускоритель на базе ASIC для эпохи интерактивной потоковой передачи» . EETech Медиа . Проверено 24 декабря 2023 г.
- ^ «Помогите мне выбрать: видеокарты» . Делл . Архивировано из оригинала 9 сентября 2016 г. Проверено 17 сентября 2016 г.
- ^ «Документация Nvidia Optimus для драйвера устройства Linux» . бесплатный рабочий стол. 13 ноября 2023 г. Проверено 24 декабря 2023 г.
- ^ Абазович, Ф. (3 июля 2015 г.). «Рынок Crossfire и SLI составляет всего 300 000 единиц» . фудзилла . Проверено 24 декабря 2023 г.
- ^ «Мульти-GPU мертв?» . 7 января 2018 г.
- ^ «Nvidia SLI и AMD CrossFire мертвы – но стоит ли нам оплакивать игры с несколькими графическими процессорами? | TechRadar» . 24 августа 2019 г.
- ^ «Руководство по перекодированию NVIDIA FFmpeg» . 24 июля 2019 г.
- ^ «Руководство по выбору и настройке оборудования DaVinci Resolve 15» (PDF) . Блэкмэджик дизайн. 2018 . Проверено 31 мая 2022 г.
- ^ «Рекомендуемая система: Рекомендуемые системы для DaVinci Resolve» . Пьюджет Системс .
- ^ «Масштабирование производительности V-Ray Next с несколькими графическими процессорами» . 20 августа 2019 г.
- «Часто задаваемые вопросы | Программное обеспечение для 3D-рендеринга с графическим процессором | Redshift» .
- «Предварительная версия OctaneRender 2020™ уже здесь!» . Отой .
- «Изучение производительности с помощью бета-версии графического процессора Arnold Renderer от Autodesk» . 8 апреля 2019 г.
- «Рендеринг с помощью графического процессора — Руководство по Blender» .
- ^ «V-Ray для Nuke — рендеринг с трассировкой лучей для композиторов | Chaos Group» .
- ^ «А как насчет поддержки нескольких графических процессоров? – Folding@home» .
- ^ «Эволюция графики Intel: от I740 до Iris Pro» . 4 февраля 2017 г.
- ^ «Обзор GA-890GPA-UD3H» . Архивировано из оригинала 15 апреля 2015 г. Проверено 15 апреля 2015 г.
- ^ Ключ, Гэри. «AnandTech – μATX Часть 2: Обзор производительности Intel G33» . anandtech.com . Архивировано из оригинала 31 мая 2008 г.
- ^ Чеблоков, Тим. «Xbit Labs: обзор 7 современных интегрированных графических чипсетов для платформ Socket 478 и Socket A» . Архивировано из оригинала 26 мая 2007 г. Проверено 3 июня 2007 г.
- ^ Коэльо, Рафаэль (18 января 2016 г.). «Влияет ли двухканальная память на производительность встроенного видео?» . Аппаратные секреты . Проверено 4 января 2019 г.
- ^ Сэнфорд, Брэдли. «Интегрированные графические решения для приложений с интенсивным использованием графики» (PDF) . Архивировано (PDF) из оригинала 28 ноября 2007 г. Проверено 2 сентября 2007 г.
- ^ Сэнфорд, Брэдли. «Интегрированные графические решения для приложений с интенсивным использованием графики» . Архивировано из оригинала 7 января 2012 г. Проверено 2 сентября 2007 г.
- ^ Шимпи, Ананд Лал. «AMD обрисовывает дорожную карту HSA: унифицированная память для CPU/GPU в 2013 году, графические процессоры HSA в 2014 году» . www.anandtech.com . Проверено 8 января 2024 г.
- ^ Лейк, Адам Т. «Как получить максимальную отдачу от OpenCL™ 1.2: как повысить производительность с помощью…» Intel . Проверено 8 января 2024 г.
- ^ Мерф, Даррен (29 сентября 2006 г.). «Стэнфордский университет адаптирует Folding@home для графических процессоров» . Архивировано из оригинала 12 октября 2007 г. Проверено 4 октября 2007 г.
- ^ Хьюстон, Майк. «Folding@Home – ГПГПУ» . Архивировано из оригинала 27 октября 2007 г. Проверено 4 октября 2007 г.
- ^ «Список Top500 – июнь 2012 г. | TOP500 суперкомпьютерных сайтов» . Топ500.org. Архивировано из оригинала 13 января 2014 г. Проверено 21 января 2014 г.
- ^ Николлс, Джон. «Стэнфордская лекция: Масштабируемое параллельное программирование с помощью CUDA на многоядерных графических процессорах» . Ютуб . Архивировано из оригинала 11 октября 2016 г.
- Хардинг, С.; Банжаф, В. «Быстрое генетическое программирование на графических процессорах» . Архивировано из оригинала 9 июня 2008 г. Проверено 1 мая 2008 г.
- ^ Лэнгдон, В.; Банцхаф, В. «Интерпретатор SIMD для генетического программирования на видеокартах с графическим процессором» . Архивировано из оригинала 9 июня 2008 г. Проверено 1 мая 2008 г.
- В. Гарсия, Э. Дебрев и М. Барло. Быстрый поиск ближайшего соседа с использованием графического процессора . В материалах семинара CVPR по компьютерному зрению на графическом процессоре, Анкоридж, Аляска, США, июнь 2008 г.
- ^ «Список систем-кандидатов eGPU» . Форумы Tech-Inferno . 15 июля 2013 г.
- ^ Мор, Нил. «Как сделать внешний графический адаптер для ноутбука» . ТехРадар . Архивировано из оригинала 26 июня 2017 г.
- ^ «Лучшая внешняя видеокарта 2020 года (EGPU) [Полное руководство]» . 16 марта 2020 г.
- ^ «Используйте внешний графический процессор с вашим Mac» . Поддержка Apple . Проверено 11 декабря 2018 г.
- ^ «Ускоритель OMEN | Официальный сайт HP®» . www8.hp.com . Проверено 11 декабря 2018 г.
- ^ «Графический усилитель Alienware | Dell, США» . Делл . Проверено 11 декабря 2018 г.
- «Razer Core X – внешний графический процессор Thunderbolt™ 3» . Рейзер . Проверено 11 декабря 2018 г.
- ^ Вставка, ► Предложения (25 ноября 2016 г.). «Руководства по сборке пользователей» . eGPU.io. Проверено 11 декабря 2018 г.
- ^ Этвуд, Джефф (18 августа 2006 г.). «Энергопотребление видеокарты» . Архивировано из оригинала 8 сентября 2008 года . Проверено 26 марта 2008 г.
- ^ «Энергопотребление видеокарты» . Xbit Labs . Архивировано из оригинала 4 сентября 2011 г.
- ^ «Самое большое квартальное падение производительности графических процессоров в третьем квартале 2022 года со времен рецессии 2009 года» . Исследования Джона Педди . 20 ноября 2022 г. Проверено 6 июня 2023 г.
- ^ «Рынок графических чипов оживает» . ТГ Дейли. 20 августа 2014. Архивировано из оригинала 26 августа 2014 года . Проверено 22 августа 2014 г.
Источники
[ редактировать ]- Педди, Джон (1 января 2023 г.). История ГПУ – Новые разработки . Спрингер Природа. ISBN 978-3-03-114047-1 . OCLC 1356877844 .
Внешние ссылки
[ редактировать ]- NVIDIA – Что такое вычисления на графическом процессоре?
- « GPU Gems» Серия книг
- - История графического оборудования, заархивированная 31 марта 2022 г. на Wayback Machine.
- [1] [ постоянная мертвая ссылка ]
- Как работают графические процессоры
- GPU Caps Viewer — утилита для получения информации о видеокарте
- Архитектура OpenGPU-GPU (на китайском языке)
- Обзор графических процессоров ARM Mali