Jump to content

AMD FireStream

(Перенаправлено из AMD Stream )

AMD FireStream был AMD брендом Radeon для их линейки продуктов на основе , нацеленной на обработку потока и/или GPGPU в суперкомпьютерах . Первоначально разработанный ATI Technologies в Radeon X1900 XTX в 2006 году, линейка продуктов была ранее маркирована как ATI FireStream и процессор AMD . [ 1 ] AMD FireStream также может быть использован в качестве с плавающей точкой со-процедуры для разгрузки расчетов процессора, которая является частью инициативы Torrenza . Линия FireStream была прекращена с 2012 года, когда рабочие нагрузки GPGPU были полностью сложены в линию AMD FirePro .

Линия FireStream представляет собой серию дополнительных карт расширения, выпущенных с 2006 по 2010 год, на основе стандартных графических процессоров Radeon, но предназначенных для того, чтобы служить в качестве со-процедуры общего назначения , а не для рендеринга и вывода 3D-графики. Как и линия Firegl/Fire -Fire , им дали больше памяти и пропускной способности памяти, но карты FireStream не обязательно имеют порты вывода видео. Все поддерживают 32-разрядную с одной режиссером плавающую запястье и все, кроме первого выпуска, 64-разрядной двойной препараты . Линия была в партнерстве с новыми API, чтобы обеспечить более высокую производительность, чем существующие OpenGL и Direct3D API -интерфейсы Шейдера, начиная с близкого к металлу , за которыми следуют OpenCL и потоковой вычисление SDK, и в конечном итоге интегрированы в приложение SDK .

Для очень параллельных рабочих нагрузок по математике с плавающей запятой карты могут ускорить большие вычисления более чем в 10 раз; Склад@Home, самый ранний и один из самых заметных пользователей GPGPU, получил 20-40 раз превышает производительность процессора. [ 2 ] Каждый шейдер Pixel и Vertex, или Unified Shader в более поздних моделях, могут выполнять произвольные расчеты с плавающей точкой.

После выпуска ядра Radeon R520 и Geforce G70 GPU с программируемыми шейдерами , большая пропускная способность с плавающей точкой привлек внимание академических и коммерческих групп, экспериментируя с использованием затем для нерафки. Интерес привел ATI (и NVIDIA ) к созданию продуктов GPGPU-способных рассчитать математические формулы общего назначения массово параллельно-для обработки тяжелых вычислений, традиционно выполняемых в процессорах по математике с плавающей точкой и специализированных совместных процедурам . Предполагалось, что GPGPU имели немедленное повышение производительности в размере 10 или более, по сравнению с современными расчетами только для CPU, только для многонарального процессора.

Благодаря разработке высокопроизводительного X1900 XFX, почти завершенного, ATI основала свой первый дизайн процессора потока, объявив его как предстоящий FireStream ATI вместе с новым Metal API на Siggraph 2006. [ 3 ] Само ядро ​​было в основном неизменным, за исключением удвоения бортовой памяти и полосы пропускания, аналогично Firegl V7350 ; Новая поддержка драйвера и программного обеспечения составляла большую часть разницы. Folding@Home начал использовать X1900 для общих вычислений, используя предварительную релиз версии 6.5 драйвера Catalyst ATI, и сообщил о улучшении графического процессора на 20-40x по сравнению с ЦП. [ 2 ] Первый продукт был выпущен в конце 2006 года, переименован в процессор AMD Stream после слияния с AMD. [ 4 ]

Бренд стал FireStream AMD со вторым поколением потоковых процессоров в 2007 году, основанным на чипе RV650 с новыми унифицированными шейдерами и двойной точной поддержкой. [ 5 ] Асинхронный DMA также улучшил производительность, позволяя большему пулу памяти без помощи ЦП. Одна модель была выпущена, 9170, по первоначальной цене 1999 долл. США. Планы включали разработку потокового процессора на модуле MXM к 2008 году для вычислений для ноутбуков, [ 6 ] но так и не был выпущен.

Третье поколение быстро последовало в 2008 году с драматическими улучшениями производительности от ядра RV770; the 9250 had nearly double the performance of the 9170, and became the first single-chip teraflop processor, despite dropping the price to under $1000. [ 7 ] Вскоре после этого был выпущен более быстрый брат, 9270 за 1999 год.

В 2010 году вышло последнее поколение FireStreams, карты 9350 и 9370, основанные на Cypress Chip, представленном в HD 5800. Это поколение снова удвоило производительность относительно предыдущих, до 2 терафлопов в 9350 и 2,6 терафлопах в 9370 В [ 8 ] и был первым построенным с нуля для OpenCl . Это поколение также было единственным, кто имел полное пассивное охлаждение, и активное охлаждение было недоступным.

Поколения Северных и Южных островов были пропущены, и в 2012 году AMD объявил, что новая серия FirePro W (Workstation) и S (сервер) на основе новой графики Core Next Architecture займет место карт FireStream. [ 9 ]

Модель
( Кодовое имя )
Запуск Архитектура
( Fab )
Автобусный интерфейс Потоковые процессоры Такта Память Обработка мощности [ А ]
( GFLOPS )
TDP ( Watts )
Ядро (MHZ) Память (МГц) Размер ( MB ) Тип Ширина автобуса ( бит ) Пропускная способность ( ГБ /с) Одинокий Двойной
Потоковой процессор
(R580)
2006 R500
80 нм
240 600 1024 GDDR3 256 83.2 375 [ 10 ] N/a 165
FireStream 9170
(RV670) [ 11 ] [ 12 ]
8 ноября 2007 г. Терапия 1
55 нм
PCIE 2.0 X16 320 800 800 2048 GDDR3 256 51.2 512 102.4 105
FireStream 9250
(RV770) [ 13 ] [ 14 ]
16 июня 2008 г. Терапия 1
55 нм
PCIE 2.0 X16 800 625 993 1024 GDDR3 256 63.6 1000 200 150
FireStream 9270
(RV770) [ 15 ] [ 16 ]
13 ноября 2008 г. Терапия 1
55 нм
PCIE 2.0 X16 800 750 850 2048 GDDR5 256 108.8 1200 240 160
FireStream 9350
(Cypress XT) [ 17 ]
23 июня 2010 г. Терапия 2
40 нм
PCIE 2.1 X16 1440 700 1000 2048 GDDR5 256 128 2016 403.2 150
FireStream 9370
(Cypress XT) [ 18 ]
23 июня 2010 г. Терапия 2
40 нм
PCIE 2.1 X16 1600 825 1150 4096 GDDR5 256 147.2 2640 528 225
  1. ^ Точность производительности рассчитывается по базовой (или усилению) основной тактовой скорости на основе работы FMA .

Программное обеспечение

[ редактировать ]

AMD FireStream был запущен с широким спектром поддержки программной платформы. Одной из вспомогательных фирм был PeakStream (приобретен Google в июне 2007 года), которая была первой, чтобы предоставить открытую бета -версию программного обеспечения для поддержки CTM и AMD FireStream, а также процессоров x86 и ячеек (широко широкополосный двигатель). Предполагается, что FireStream находится в 20 раз быстрее в типичных приложениях, чем обычные процессоры после запуска программного обеспечения Peakstream [ Цитация необходима ] Полем Rapidmind также предоставил программное обеспечение для обработки потоков, которое работало с ATI и Nvidia, а также сотовыми процессорами. [ 19 ]

Комплект для разработки программного обеспечения

[ редактировать ]

После отказа от их недолговечных близких к металлическому API AMD сосредоточился на OpenCl . AMD впервые выпустил свой потоковой вычислитель SDK (v1.0), в декабре 2007 года при AMD Eula , который будет запущен в Windows XP . [ 19 ] SDK включает в себя «Brook+», оптимизированную версию AMD-оборудования, разработанную Stanford University, само по себе вариант ANSI C ( C-Language ), с открытым исходным кодом и оптимизированным для потоковых вычислений. Библиотека AMD Core Math (ACML) и библиотека производительности AMD (APL) с оптимизацией для AMD FireStream и видео библиотеки COBRA (дополнительно переименованного в «Ускоренное видео транскодирование» или AVT) для ускорения транскодирования видео . Другая важная часть SDK, слой Compute Abstraction (CAL), представляет собой слой разработки программного обеспечения, предназначенный для доступа низкого уровня, через аппаратный интерфейс CTM, к архитектуре GPU для программного обеспечения для настройки производительности, написанного на различных языках программирования высокого уровня .

В августе 2011 года AMD выпустила версию 2.5 комплекта разработки программного обеспечения ATI APP, [ 19 ] который включает в себя поддержку OpenCl 1.1 , параллельного языка вычислений, разработанного группой Khronos . Концепция вычислительных шейдеров , официально называемой DirectCompute, в API Microsoft следующего поколения под названием DirectX 11 уже включена в драйверы графики с поддержкой DirectX 11.

В соответствии с системой AMD-Demonstry [ 20 ] С двумя двухъядерными процессорами AMD Opteron и двумя ядрами Radeon R600, работающими на Microsoft Windows XP Professional , 1 Teraflop (TFLOP) может быть достигнут с помощью универсального расчета Universe Multiply-ADD (MADD). Для сравнения, процессор Intel Core 2 Quad Q9650 3,0 ГГц в то время может достичь 48 GFLOP. [ 21 ]

В демонстрации антивирусного сканирования Касперского, которое было оптимизировано для обработчиков AMD, смогла сканировать в 21 раз быстрее при ускорении на основе R670, чем с поиском, работающим полностью на Opteron, в 2007 году. [ 22 ]

Ограничения

[ редактировать ]
  • Рекурсивные функции не поддерживаются в Brook+, потому что все вызовы функций вставлены во время компиляции. Используя CAL, функции (рекурсивные или иные) поддерживаются на 32 уровнях. [ 23 ]
  • Поддерживается только билинейная фильтрация текстур; MIPMAPMAPED TEXTURES и анизотропная фильтрация не поддерживаются.
  • Функции не могут иметь переменное количество аргументов. Та же проблема возникает для рекурсивных функций.
  • Преобразование чисел с плавающей точкой в ​​целые числа на графических процессорах осуществляется иначе, чем на процессорах x86; Это не совсем совместно с IEEE-754 .
  • Делать «глобальную синхронизацию» на графическом процессоре не очень эффективно, что заставляет графический процессор разделять ядро ​​и синхронизировать на процессоре. Учитывая переменное количество многопроцессорных и других факторов, не может быть идеального решения этой проблемы.
  • Пропускная способность автобуса и задержка между процессором и графическим процессором могут стать узким местом .

Смотрите также

[ редактировать ]
  1. ^ AMD Пресс -релиз
  2. ^ Jump up to: а беременный Gasior, Джефф (16 октября 2006 г.). «Более внимательный взгляд на склад@Home на графическом процессоре» . Технический отчет . Получено 2016-05-26 .
  3. ^ ATI Siggraph 2006 Презентация (PDF) (отчет). ATI Technologies. Архивировано из оригинала (PDF) 2016-12-21 . Получено 2016-05-26 .
  4. ^ Валич, Тео (16 ноября 2006 г.). «Ati FireStream Amd Stream Board раскрыта» . Inquirer . Архивировано из оригинала 21 августа 2009 года . Получено 2016-05-26 . {{cite news}}: Cs1 maint: непредвзятый URL ( ссылка )
  5. ^ «AMD обеспечивает первую потоковую процессор с двойной точной технологией с плавающей запятой» . Амд. 8 ноября 2007 г. Архивировано с оригинала 2017-06-19 . Получено 2016-05-26 .
  6. ^ AMD WW HPC 2007 Презентация (PDF) (отчет). п. 37
  7. ^ «Сначала процессор AMD Stream, чтобы преодолеть 1 терафлоп -барьер» . Амд. 16 июня 2008 года. Архивировано с оригинала 2017-06-19 . Получено 2016-05-26 .
  8. ^ «Новейшие графические графические процессоры AMD (TM) вычисляющие акселераторы обеспечивают почти 2 -кратную и двойную точную производительность и производительность пика и производительность на ватт по сравнению с последним поколением» . Амд. 23 июня 2010 г. Архивировано с оригинала 2017-06-19 . Получено 2016-05-26 .
  9. ^ Смит, Райан (14 августа 2012 г.). «Обзор AMD FirePro W9000 W8000 Часть 1» . Anandtech.com . Получено 28 июня 2016 года .
  10. ^ «Beyond3d - ATI R580: Radeon X1900 XTX & Crossfire» . За 3d .
  11. ^ «AMD обеспечивает первую потоковую процессор с двойной точной технологией с плавающей запятой» . Амд. 8 ноября 2007 г. Получено 2016-05-26 .
  12. ^ "AMD FireStream 9170 Спецификации" . TechPowerup .
  13. ^ AMD FireStream 9250 - страница продукта , архивная 13 мая 2010 г., на машине Wayback
  14. ^ «Спецификации AMD FireStream 9250» . TechPowerup .
  15. ^ AMD FireStream 9270 - Страница продукта Архивирована 16 февраля 2010 г. на The Wayback Machine
  16. ^ "AMD FireStream 9270 Спецификации" . TechPowerup .
  17. ^ "AMD FireStream 9350 Спецификации" . TechPowerup .
  18. ^ "AMD FireStream 9370 Спецификации" . TechPowerup .
  19. ^ Jump up to: а беременный в AMD APP SDK Страница загрузки Архивирована 2012-09-03 на машине Wayback и потоке вычислений SDK Eula Archived 6 марта 2009 г. на The Wayback Machine , полученная 29 декабря 2007 г.
  20. ^ HARDOCP отчет за архив 2016-03-04 на машине Wayback , полученном 17 июля 2007 г.
  21. ^ Метрики соответствия экспорта микропроцессора Intel
  22. ^ Валич, Тео (12 сентября 2007 г.). «GPGPU резко ускоряет антивирусное программное обеспечение» . Inquirer . Архивировано из оригинала 23 сентября 2009 года . Получено 2016-05-26 . {{cite news}}: Cs1 maint: непредвзятый URL ( ссылка )
  23. ^ Справочное руководство по промежуточному языку AMD, август 2008 г.
[ редактировать ]
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: ea1c50683eab5a0dfa572df17f47c8b1__1721505000
URL1:https://arc.ask3.ru/arc/aa/ea/b1/ea1c50683eab5a0dfa572df17f47c8b1.html
Заголовок, (Title) документа по адресу, URL1:
AMD FireStream - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)