Jump to content

Ларраби (микроархитектура)

Архитектура графического процессора Larrabee, представленная на конференции SIGGRAPH в августе 2008 года.

Larrabee кодовое название отмененного чипа GPGPU , который Intel разрабатывала отдельно от своей нынешней линейки интегрированных графических ускорителей . Он назван в честь горы Ларраби или государственного парка Ларраби в округе Уотком, штат Вашингтон , США, недалеко от города Беллингем . [1] [2] Чип должен был быть выпущен в 2010 году в качестве ядра потребительской 3D-видеокарты , но эти планы были отменены из-за задержек и неутешительных ранних показателей производительности. [3] [4] Проект по производству розничного продукта графического процессора непосредственно на основе исследовательского проекта Ларраби был прекращен в мае 2010 года. [5] и его технология была передана Xeon Phi . Многопроцессорная архитектура Intel MIC , анонсированная в 2010 году, унаследовала многие элементы дизайна от проекта Larrabee, но не функционирует как графический процессор; продукт предназначен в качестве сопроцессора для высокопроизводительных вычислений .

Почти десять лет спустя, 12 июня 2018 года; Идея выделенного графического процессора Intel снова возродилась благодаря желанию Intel создать дискретный графический процессор к 2020 году. [6] Этот проект в конечном итоге стал серией Intel Xe и Intel Arc , выпущенными в сентябре 2020 года и марте 2022 года соответственно, но оба они не были связаны с работой над проектом Larrabee.

Статус проекта [ править ]

4 декабря 2009 года Intel официально объявила, что Larrabee первого поколения не будет выпускаться в качестве потребительского графического процессора. [7] Вместо этого он должен был быть выпущен как платформа разработки графики и высокопроизводительных вычислений . Официальной причиной стратегической перезагрузки были названы задержки в разработке аппаратного и программного обеспечения. [8] 25 мая 2010 года блог Technology@Intel объявил, что Larrabee не будет выпущен как графический процессор, а вместо этого будет выпущен как продукт для высокопроизводительных вычислений, конкурирующий с Nvidia Tesla . [9]

Проект по производству розничного продукта с графическими процессорами непосредственно на основе исследовательского проекта Ларраби был прекращен в мае 2010 года. [5] Многопроцессорная архитектура Intel MIC , анонсированная в 2010 году, унаследовала многие элементы дизайна от проекта Larrabee, но не функционирует как графический процессор; продукт предназначен в качестве сопроцессора для высокопроизводительных вычислений. Прототип карты был назван Knights Ferry построенной по 22-нм техпроцессу, , производство карты Knights Corner, планировалось начать в 2012 году или позже. [ нужна ссылка ]

Сравнение с конкурирующими продуктами [ править ]

По данным Intel, Larrabee имеет полностью программируемый конвейер, в отличие от видеокарт текущего поколения, которые программируются лишь частично.

Larrabee можно считать гибридом многоядерного процессора и графического процессора , и он имеет сходство с обоими. Его кэша когерентная иерархия и совместимость с архитектурой x86 аналогичны процессору, а его широкие векторные блоки SIMD и аппаратное обеспечение выборки текстур аналогичны графическому процессору.

В качестве графического процессора Larrabee поддерживал бы традиционную растровую 3D-графику ( Direct3D и OpenGL ) для игр. Однако гибридизация функций ЦП и графического процессора также должна была подходить для графического процессора общего назначения (GPGPU) или потоковой обработки задач . Например, он мог выполнять трассировку лучей или физическую обработку , [10] в режиме реального времени для игр или в автономном режиме для научных исследований в качестве компонента суперкомпьютера . [11]

Ранняя презентация Ларраби вызвала некоторую критику со стороны конкурентов графических процессоров. На NVISION 08 сотрудник Nvidia назвал статью Intel SIGGRAPH о Larrabee «маркетинговой затяжкой» и процитировал отраслевого аналитика ( Питера Гласковски ), который предположил, что архитектура Larrabee «похожа на графический процессор 2006 года». [12] К июню 2009 года Intel заявила, что прототипы Larrabee не уступали Nvidia GeForce GTX 285 . [13] Джастин Раттнер Intel , технический директор , выступил с основным докладом на конференции Supercomputing 2009 17 ноября 2009 года. В ходе своего выступления он продемонстрировал разогнанный процессор Larrabee, производительность которого превысила один терафлопс. Он заявил, что это первая публичная демонстрация однокристальной системы, мощность которой превышает один терафлопс. Он отметил, что это был ранний кремний, тем самым оставив открытым вопрос о возможной производительности архитектуры. Поскольку это было лишь одной пятой от доступных конкурирующих графических плат, 4 декабря 2009 года Larrabee была отменена «как отдельный продукт с дискретной графикой». [3]

Отличия от современных графических процессоров [ править ]

Larrabee должен был отличаться от старых дискретных графических процессоров, таких как серии GeForce 200 и серии Radeon 4000, по трем основным признакам:

Ожидалось, что это сделает Larrabee более гибким, чем нынешние графические процессоры, и позволит больше различать внешний вид игр или других 3D-приложений. В документе Intel SIGGRAPH 2008 упоминалось несколько функций рендеринга, которых было трудно достичь на современных графических процессорах: чтение целевого объекта рендеринга, независимая от порядка прозрачность , неравномерное отображение теней и трассировка лучей в реальном времени . [14]

Более поздние графические процессоры, такие как ATI Radeon HD 5xxx Nvidia и серия GeForce 400, обладают все более широкими вычислительными возможностями общего назначения через DirectX11 DirectCompute и OpenCL, а также запатентованную технологию Nvidia CUDA , что дает им многие возможности Larrabee.

Различия с процессорами [ править ]

Ядра процессора x86 в Larrabee во многом отличались от ядер современных процессоров Intel, таких как Core 2 Duo или Core i7 :

  • Его ядра x86 были основаны на гораздо более простой P54C конструкции Pentium , которая до сих пор поддерживается для использования во встроенных приложениях. [15] Ядро, производное от P54C, является суперскалярным , но не включает выполнение вне очереди , хотя оно было обновлено современными функциями, такими как x86-64 , поддержка [14] аналогична микроархитектуре Bonnell, используемой в Atom . Выполнение по порядку означает более низкую производительность для отдельных ядер, но, поскольку они меньше, на одном кристалле может поместиться больше процессоров, что увеличивает общую пропускную способность. Выполнение также является более детерминированным, поэтому планирование инструкций и задач может выполняться компилятором.
  • Каждое ядро ​​содержало 512-битный векторный процессор , способный одновременно обрабатывать 16 чисел одинарной точности с плавающей запятой. Он аналогичен модулям SSE на большинстве процессоров x86, но в четыре раза больше, чем у модулей SSE на большинстве процессоров x86, с дополнительными функциями, такими как инструкции разброса/сбора и регистр маски, предназначенные для упрощения и повышения эффективности использования векторного модуля. Ларраби должен был получить большую часть своей вычислительной мощности от этих векторных единиц. [14]
  • Он включал в себя одну важную с фиксированной функцией аппаратную функцию графического оборудования : блоки выборки текстур . Они выполняют трилинейную и анизотропную фильтрацию и декомпрессию текстур . [14]
  • Он имел 1024-битную (512-битную в каждую сторону) кольцевую шину для связи между ядрами и памятью. [14] Эту шину можно настроить в двух режимах для поддержки продуктов Larrabee с 16 и более ядрами или менее 16 ядрами. [16]
  • Он включал явные инструкции по управлению кэшем, чтобы уменьшить перегрузку кэша во время потоковых операций, которые читают/записывают данные только один раз. [14] Также поддерживается явная предварительная выборка в кэш L2 или L1.
  • Каждое ядро ​​поддерживало четырехстороннюю чередующуюся многопоточность с четырьмя копиями каждого регистра процессора . [14]

Теоретически процессорные ядра Larrabee x86 могли бы работать на существующем программном обеспечении ПК или даже на операционных системах. Другая версия процессора может быть установлена ​​в разъемах ЦП материнской платы с использованием QuickPath . [17] но Intel никогда не объявляла о каких-либо планах на этот счет. Хотя собственный компилятор C/C++ Larrabee включал автоматическую векторизацию, и многие приложения могли корректно работать после перекомпиляции, ожидалось, что максимальная эффективность потребует оптимизации кода с использованием векторных встроенных функций C++ или встроенного ассемблерного кода Larrabee. [14] Однако, как и во всех GPGPU, не все программное обеспечение выиграет от использования векторного процессора. На одном сайте технической журналистики утверждается, что графические возможности Larrabee планировалось интегрировать в процессоры на базе микроархитектуры Haswell . [18]

с движком широкополосной Cell Сравнение связи

Философия Ларраби по использованию множества маленьких простых ядер была похожа на идеи, лежащие в основе процессора Cell . Есть и другие общие черты, такие как использование кольцевой шины с высокой пропускной способностью для связи между ядрами. [14] Однако в реализации было много существенных отличий, которые, как ожидалось, упростят программирование Ларраби.

  • Процессор Cell включает в себя один главный процессор, который управляет множеством меньших процессоров. Кроме того, на главном процессоре может работать операционная система. Напротив, все ядра Larrabee одинаковы, и не ожидалось, что Larrabee будет работать под управлением ОС.
  • Каждое компьютерное ядро ​​в ячейке ( SPE ) имеет локальное хранилище, для которого ( DMA используются явные операции ) для всех обращений к DRAM. Обычное чтение и запись в DRAM не разрешены. В Larrabee вся память на кристалле и вне кристалла находится в автоматически управляемой когерентной иерархии кэша , так что его ядра практически разделяют единое пространство памяти посредством стандартных инструкций копирования ( MOV ). Каждое ядро ​​Larrabee имело по 256 КБ локального кэша L2, а доступ к другому сегменту L2 требует больше времени. [14]
  • Из-за отмеченной выше когерентности кэша каждая программа, работающая в Ларраби, имела практически большую линейную память, как и в традиционном ЦП общего назначения; тогда как приложение для Cell должно быть запрограммировано с учетом ограниченного объема памяти локального хранилища, связанного с каждым SPE (подробнее см. в этой статье ), но с теоретически более высокой пропускной способностью. Однако, поскольку доступ к локальному L2 осуществляется быстрее, преимущество все же можно получить от использования методов программирования в стиле Cell. [ нужна ссылка ]
  • Cell использует DMA для передачи данных в локальную память кристалла и из нее, что позволяет явно поддерживать оверлеи, хранящиеся в локальной памяти, чтобы приблизить память к ядру и уменьшить задержки доступа, но требует дополнительных усилий для поддержания согласованности с основной памятью; тогда как Ларраби использовал когерентный кеш со специальными инструкциями для манипулирования кешем (в частности, подсказками по вытеснению из кеша и инструкциями по предварительной выборке), что смягчало штрафы за промахи и вытеснения, а также уменьшало загрязнение кеша (например, для конвейеров рендеринга и других потоковых вычислений) за счет дополнительный трафик и накладные расходы для поддержания согласованности кэша. [14]
  • Каждое вычислительное ядро ​​в ячейке одновременно выполняет только один поток по порядку. Ядро в Larrabee выполняло до четырех потоков, но только по одному. Гиперпоточность Ларраби помогла скрыть задержки, присущие упорядоченному выполнению. [ нужна ссылка ]

Сравнение с Intel GMA [ править ]

Intel начала интегрировать линейку графических процессоров в материнские платы под брендом Intel GMA в 2004 году. Будучи интегрированными в материнские платы (более новые версии, например, выпущенные с Sandy Bridge, встроены в тот же кристалл, что и ЦП), эти чипы не продавались отдельно. Хотя низкая стоимость и энергопотребление чипов Intel GMA сделали их подходящими для небольших ноутбуков и менее ресурсоемких задач, им не хватает мощности обработки 3D-графики, чтобы конкурировать с современными графическими процессорами Nvidia и AMD/ATI за долю рынка высокопроизводительных игровых компьютеров. , рынок HPC или место в популярных игровых консолях . Напротив, Larrabee должен был продаваться как отдельный графический процессор, отдельно от материнских плат, и ожидалось, что он будет работать достаточно хорошо, чтобы его можно было использовать в игровых консолях следующего поколения. [19] [20]

Команда, работавшая над Larrabee, была отделена от команды Intel GMA. Аппаратное обеспечение было разработано недавно сформированной командой Intel в Хиллсборо, штат Орегон, отдельно от тех, кто разрабатывал Nehalem . Программное обеспечение и драйверы были написаны недавно сформированной командой. Специально 3D-стек был написан разработчиками из RAD Game Tools (в том числе Майклом Абрашем ). [21]

Институт визуальных вычислений Intel будет исследовать базовые и прикладные технологии, которые можно будет применить к продуктам на базе Larrabee. [22]

данные Прогнозируемые о производительности

Результаты сравнительного анализа 2008 г. Документ SIGGRAPH, показывающий прогнозируемую производительность как приблизительную линейную функцию количества процессорных ядер.

В документе Intel SIGGRAPH 2008 описывается моделирование с точностью до цикла (включая ограничения памяти, кэшей и текстурных блоков) прогнозируемой производительности Larrabee. [14] На графиках показано, сколько ядер Larrabee с тактовой частотой 1 ГГц требуется для поддержания 60 кадров/с при разрешении 1600×1200 в нескольких популярных играх. Примерно 25 ядер требуется для Gears of War без сглаживания, 25 ядер для FEAR с 4-кратным сглаживанием и 10 ядер для Half-Life 2: Episode Two с 4-кратным сглаживанием. Intel заявила, что Larrabee, скорее всего, будет работать на частоте выше 1 ГГц, поэтому эти цифры отражают не реальные ядра, а скорее их виртуальные временные интервалы. Другой график показывает, что производительность в этих играх растет почти линейно с увеличением количества ядер до 32. При 48 ядрах производительность падает до 90% от того, что можно было бы ожидать, если бы линейная зависимость сохранялась. [23]

за июнь 2007 года В статье PC Watch говорилось, что первые чипы Larrabee будут иметь 32 процессорных ядра x86 и выйдут в конце 2009 года и будут изготовлены по 45-нанометровому техпроцессу . Чипы с несколькими дефектными ядрами из-за проблем с производительностью будут продаваться как 24-ядерные версии. Позже, в 2010 году, Larrabee будет сокращен до 32-нанометрового производственного процесса , чтобы создать 48-ядерную версию. [24]

Последнее утверждение о производительности можно рассчитать (теоретически это максимально возможная производительность) следующим образом: 32 ядра × 16 SIMD с плавающей точкой одинарной точности/ядро × 2 FLOP (слитое умножение-сложение) × 2 ГГц = 2 терафлопс теоретически.

Публичные демонстрации [ править ]

Публичная демонстрация возможностей трассировки лучей Larrabee состоялась на форуме разработчиков Intel в Сан-Франциско 22 сентября 2009 года. Экспериментальная версия Enemy Territory: Quake Wars под названием Quake Wars: Ray Traced была показана в режиме реального времени. Сцена содержала водную поверхность с трассировкой лучей, которая точно отражала окружающие объекты, такие как корабль и несколько летательных аппаратов. [25] [26] [27]

Вторая демонстрация была представлена ​​на конференции SC09 в Портленде 17 ноября 2009 года во время выступления технического директора Intel Джастина Раттнера . Карта Larrabee смогла достичь 1006 GFlops в расчете SGEMM 4Kx4K.

Технический образец карты Larrabee был приобретен и рассмотрен Линусом Себастьяном в видео, опубликованном 14 мая 2018 года. Однако ему не удалось заставить карту выдавать видеовыход, поскольку на материнской плате отображался код POST D6. [28] В 2022 году ютубер Роман «der8auer» Хартунг продемонстрировал еще одну карту, которая, как было показано, работает и выводит сигнал на дисплей, но не способна к 3D-ускорению из-за отсутствия драйверов. [29]

См. также [ править ]

Ссылки [ править ]

  1. ^ Форсайт, Том. «SMACNI–AVX512: жизненный цикл набора инструкций» (PDF) .
  2. ^ Форсайт, Том (22 декабря 2020 г.). «Том Форсайт о названии набора команд Ларраби» . Архивировано из оригинала 22 декабря 2020 г. Проверено 22 декабря 2020 г.
  3. ^ Jump up to: Перейти обратно: а б Кротерс, Брук (4 декабря 2009 г.). «Intel: выпуск первого графического чипа Larrabee отменен» . CNET . CBS Интерактив .
  4. ^ Чарли Демерджян (4 декабря 2009 г.). «Intel убивает потребителя Larrabee, фокусируется на будущих вариантах – SemiAccurate» . SemiAccurate.com . Проверено 9 апреля 2017 г.
  5. ^ Jump up to: Перейти обратно: а б Смит, Райан (25 мая 2010 г.). «Intel убивает графический процессор Larrabee и не выведет на рынок продукт с дискретной графикой» . АнандТех .
  6. ^ Смит, Райан (13 июня 2018 г.). «Первый (современный) набор дискретных графических процессоров Intel на 2020 год» . Анандтех . Проверено 4 ноября 2018 г.
  7. ^ Стоукс, Джон (5 декабря 2009 г.). «Графический процессор Intel Larrabee заморожен, в 2010 году появятся новые новости» . Арс Техника . Конде Наст .
  8. ^ Смит, Райан. «Intel отменяет розничную продажу продуктов Larrabee, проект Larrabee продолжает жить» . AnandTech.com . Проверено 9 апреля 2017 г.
  9. ^ «Блоги@Intel — Блоги Intel» . Intel.com . Проверено 9 апреля 2017 г.
  10. ^ Стоукс, Джон (17 сентября 2007 г.). «Intel выбирает игровой физический движок для будущего графического процессора» . Арс Техника . Проверено 17 сентября 2007 г.
  11. ^ Стоукс, Джон (27 апреля 2007 г.). «Разъяснение путаницы по поводу Intel Larrabee» . Арс Техника . Проверено 1 июня 2007 г.
  12. ^ «Представление Ларраби — за пределами звуковых фрагментов» . CNet.com . Проверено 9 апреля 2017 г.
  13. ^ «Larrabee от Intel на одном уровне с GeForce GTX 285» . TomsHardware.com . 2 июня 2009 года . Проверено 9 апреля 2017 г.
  14. ^ Jump up to: Перейти обратно: а б с д и ж г час я дж к л м н тот Зайлер, Л.; Кэвин, Д.; Эспаса, Э.; Гроховский, Т.; Хуан, М.; Ханрахан, П.; Кармин, С.; Спрэнгл, А.; Форсайт, Дж.; Абраш Р.; Дубей, Р.; Джанкинс, Э.; Лейк, Т.; Шугерман, П. (август 2008 г.). «Larrabee: многоядерная архитектура x86 для визуальных вычислений» (PDF) . Транзакции ACM с графикой . Труды ACM SIGGRAPH 2008. 27 (3): 18:11. дои : 10.1145/1360612.1360617 . ISSN   0730-0301 . S2CID   52799248 . Архивировано из оригинала (PDF) 7 марта 2021 г. Проверено 6 августа 2008 г.
  15. ^ «Графический процессор Intel Larrabee основан на секретной технологии Пентагона, вроде [Обновлено]» . Арс Техника . 9 июля 2008 года . Проверено 6 августа 2008 г.
  16. ^ Гласковский, Питер. «Ларраби Intel — больше и меньше, чем кажется на первый взгляд» . CNET . Проверено 20 августа 2008 г.
  17. ^ Стоукс, Джон (5 июня 2007 г.). «Разъяснение путаницы по поводу Intel Larrabee, часть II» . Арс Техника . Проверено 16 января 2008 г.
  18. ^ «Intel будет использовать графику Larrabee в процессорах — SemiAccurate» . SemiAccurate.com . 19 августа 2009 года . Проверено 9 апреля 2017 г.
  19. ^ Крис Лейтон (13 августа 2008 г.). «Intel Larrabee готовится для консолей следующего поколения?» . Архивировано из оригинала 17 августа 2008 года . Проверено 24 августа 2008 г.
  20. ^ Чарли Демерджян (5 февраля 2009 г.). «Intel разработает графический процессор для PlayStation 4» . Архивировано из оригинала 11 мая 2009 года . Проверено 28 августа 2009 г. {{cite web}}: CS1 maint: неподходящий URL ( ссылка )
  21. ^ Уилсон, Ананд Лал Шимпи и Дерек. «Раскрытие информации об архитектуре Intel Larrabee: продуманный первый шаг» . AnandTech.com . Проверено 9 апреля 2017 г.
  22. ^ Нг, Янсен (13 мая 2009 г.). «Открытие института визуальных вычислений Intel будет стимулировать развитие «Ларраби»» . ДейлиТех . Архивировано из оригинала 16 мая 2009 года . Проверено 13 мая 2009 г.
  23. ^ Стив Сеген (20 августа 2008 г.). «Intel 'Larrabee' для встряски [ sic ] AMD, Nvidia» . Аппаратное обеспечение Тома . Проверено 24 августа 2008 г.
  24. ^ «Intel продвигает 32-ядерный процессор Larrabee» ( на японском языке). pc.watch.impress.co.jp . Проверено 6 августа 2008 г. перевод
  25. ^ Geeks3D (12 июня 2008 г.), Ray Traced Quake Wars , заархивировано из оригинала 17 сентября 2021 г. , получено 7 марта 2022 г. {{citation}}: CS1 maint: числовые имена: список авторов ( ссылка )
  26. ^ «Зажгите! В Quake Wars* реализована трассировка лучей» (PDF) . Архивировано (PDF) из оригинала 15 февраля 2010 г. Проверено 7 марта 2022 г.
  27. ^ «Quake Wars: Трассировка лучей» . 18 августа 2008 г. Архивировано из оригинала 19 июля 2011 г.
  28. ^ Технические советы Линуса (14 мая 2018 г.), МЫ ПОЛУЧИЛИ ПРОТОТИП ВИДЕОКАРТЫ INTEL!! , заархивировано из оригинала 21 декабря 2021 г. , получено 10 мая 2019 г.
  29. ^ der8auer RU (24 декабря 2022 г.), HW-Legends # 13: Intel отменила этот проект — самая дорогая карта в моей коллекции (Ларраби) , заархивировано из оригинала 23 июля 2023 г. , получено 23 июля 2023 г. {{citation}}: CS1 maint: числовые имена: список авторов ( ссылка )

Внешние ссылки [ править ]

Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 5f0a1d586ea4a9b1d979fd07a424a8d3__1718919060
URL1:https://arc.ask3.ru/arc/aa/5f/d3/5f0a1d586ea4a9b1d979fd07a424a8d3.html
Заголовок, (Title) документа по адресу, URL1:
Larrabee (microarchitecture) - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)