Jump to content

Ячейка (процессор)

(Перенаправлено с процессора Cell )

КЛЕТКА БЫТЬ
Дизайнер STI ( Sony , Toshiba и IBM )
Биты 64-битная
Представлено март 2007 г .; 17 лет назад ( 2007-03 )
Версия PowerPC 2.02 [1]
Дизайн РИСК
Тип Загрузка-сохранение
Кодирование Фиксированный/переменный (книга E)
Ветвление Код состояния
Порядок байтов Большой/Би

Cell — это 64-битная микроархитектура многоядерного микропроцессора общего назначения ​​PowerPC , сочетающая в себе ядро со скромной производительностью и оптимизированные сопроцессора. элементы [2] которые значительно ускоряют приложения мультимедиа и векторной обработки , а также многие другие формы специализированных вычислений. [2]

Он был разработан Sony , Toshiba и IBM , альянсом, известным как «STI». Архитектурный проект и первая реализация были выполнены в Центре дизайна STI в Остине, штат Техас, в течение четырехлетнего периода, начиная с марта 2001 года, при бюджете, который, по сообщениям Sony, приближался к долларов США . 400 миллионам [3] Cell — это сокращение от Cell Broadband Engine Architecture , обычно сокращенно CBEA полностью или Cell BE частично .

Первое крупное коммерческое применение Cell было в Sony PlayStation 3 игровой консоли на базе Cell IBM Roadrunner , выпущенной в 2006 году. В мае 2008 года суперкомпьютер стал первой системой TOP500 LINPACK с производительностью 1,0 петафлопс. [4] [5] Mercury Computer Systems также разработала конструкции на основе Cell.

Архитектура Cell включает в себя архитектуру когерентности памяти , которая делает упор на энергоэффективность, отдает предпочтение пропускной способности над низкой задержкой и предпочитает пиковую вычислительную производительность простоте программного кода . По этим причинам Cell считается сложной средой для разработки программного обеспечения . [6] IBM предоставляет платформу разработки на базе Linux , которая помогает разработчикам программировать для чипов Cell. [7]

Cell BE, как она выглядит в PS3 на материнской плате
Питер Хофсти , один из главных архитекторов микропроцессора Cell.
Майкл Гшвинд, один из главных архитекторов микропроцессора Cell

В середине 2000 года Sony Computer Entertainment , Toshiba Corporation и IBM сформировали альянс, известный как «STI», для разработки и производства процессора. [8]

Центр дизайна STI открылся в марте 2001 года. [9] Cell разрабатывался в течение четырех лет с использованием усовершенствованных версий инструментов проектирования для процессора POWER4 . Более 400 инженеров из трех компаний работали вместе в Остине при важной поддержке со стороны одиннадцати проектных центров IBM. [9] За этот период IBM подала множество патентов, касающихся архитектуры Cell, производственного процесса и программной среды. Было показано, что ранняя патентная версия Broadband Engine представляет собой пакет микросхем, содержащий четыре «элемента обработки», что было описанием в патенте того, что теперь известно как элемент обработки мощности (PPE). Каждый элемент обработки будет содержать 8 «синергетических элементов обработки» ( SPE ) на чипе. Предполагалось, что этот пакет микросхем будет работать на тактовой частоте 4 ГГц, а с 32 SPE, обеспечивающими 32 гигафлопс каждый (четверть точности FP8), Broadband Engine теоретически должен был иметь 1 терафлопс чистой вычислительной мощности.

Проект с 4 СИЗ и 32 СИЗ так и не был реализован. Вместо этого Sony и IBM выпустили конструкцию только с одним СИЗ и 8 SPE. Эта меньшая конструкция, Cell Broadband Engine или Cell/BE, была изготовлена ​​с использованием 90-нм процесса SOI . [10]

В марте 2007 года IBM объявила, что 65-нм версия Cell/BE находится в производстве на ее заводе (в то время ныне GlobalFoundries) в Ист-Фишкилле, штат Нью-Йорк . [10] [11] с Bandai Namco Entertainment, использующей процессор Cell/BE для своей аркадной платы 357, а также для последующих 369.

В феврале 2008 года IBM объявила, что начнет производство процессоров Cell по 45-нм техпроцессу. [12]

В мае 2008 года IBM представила высокопроизводительную версию процессора Cell с плавающей запятой двойной точности — PowerXCell 8i . [13] при размере элемента 65 нм.

В мае 2008 года суперкомпьютер на базе Opteron и PowerXCell 8i, система IBM Roadrunner , стал первой в мире системой, достигшей одного петафлопс, и был самым быстрым компьютером в мире до третьего квартала 2009 года. Три самых энергоэффективных суперкомпьютера в мире , представленные в списке Green500 , также основаны на PowerXCell 8i.

В августе 2009 года 45-нм процессор Cell был представлен вместе с PlayStation 3 Slim от Sony . [14]

К ноябрю 2009 года IBM прекратила разработку процессора Cell с 32 APU. [15] [16] но продолжал разрабатывать другие продукты Cell. [17]

Коммерциализация

[ редактировать ]

17 мая 2005 года Sony Computer Entertainment подтвердила некоторые характеристики процессора Cell, который будет поставляться в будущей консоли PlayStation 3 . [18] [19] [20] Эта конфигурация ячейки имеет один PPE в ядре и восемь физических SPE в кремнии. [20] В PlayStation 3 один SPE блокируется во время процесса тестирования, что помогает повысить производительность производства, а другой зарезервирован для ОС, в результате чего код игры оставляет 6 свободных SPE. [21] Целевая тактовая частота при выпуске составляет 3,2 ГГц . [19] Начальная конструкция изготавливается по 90-нм техпроцессу SOI, а начальное серийное производство запланировано на завод IBM в Ист-Фишкилл, штат Нью-Йорк . [10]

Отношения между ядрами и потоками являются частым источником путаницы. Ядро PPE является двухпоточным и проявляется в программном обеспечении как два независимых потока выполнения, тогда как каждый активный SPE проявляется как один поток. В конфигурации PlayStation 3, описанной Sony, процессор Cell обеспечивает девять независимых потоков выполнения.

28 июня 2005 года IBM и Mercury Computer Systems объявили о соглашении о партнерстве по созданию компьютерных систем на базе ячеек для встраиваемых приложений, таких как медицинская визуализация , промышленный контроль , аэрокосмическая и оборонная промышленность , обработка сейсмических данных и телекоммуникации . [22] С тех пор Mercury выпустила блейд-серверы , обычные стоечные серверы и платы-ускорители PCI Express с процессорами Cell. [22]

Осенью 2006 года IBM выпустила блейд-модуль QS20 , в котором используются процессоры Double Cell BE, обеспечивающие потрясающую производительность в некоторых приложениях, достигнув пиковой производительности 410 гигафлопс при четверти точности FP8 на модуль. QS22 на базе процессора PowerXCell 8i использовался для суперкомпьютера IBM Roadrunner . Mercury и IBM используют полностью загруженный процессор Cell с восемью активными процессорами SPE. 8 апреля 2008 года корпорация Fixstars выпустила плату-ускоритель PCI Express на базе процессора PowerXCell 8i. [23]

Высокопроизводительный медиа-сервер ZEGO от Sony использует процессор Cell/BE с тактовой частотой 3,2 ГГц.

Cell Broadband Engine , или Cell , как его чаще называют, представляет собой микропроцессор, представляющий собой гибрид традиционных процессоров для настольных ПК (таких как семейства Athlon 64 и Core 2 ) и более специализированных высокопроизводительных процессоров, таких как NVIDIA и ATI Core 2. Графические процессоры ( GPU ). Более длинное название указывает на его предполагаемое использование, а именно в качестве компонента текущих и будущих онлайн-распространения систем ; как таковой он может использоваться в дисплеях высокой четкости и записывающем оборудовании, а также в системах HDTV . Кроме того, процессор может быть пригоден для цифрового изображения систем (медицинских, научных и т. д. ) и физического моделирования ( например , научного и структурно-инженерного моделирования). В PlayStation 3 он имеет 250 миллионов транзисторов. [24]

При простом анализе процессор Cell можно разделить на четыре компонента: внешние структуры ввода и вывода, главный процессор, называемый Power Processing Element с двусторонней одновременной многопоточной обработкой (PPE) (ядро PowerPC 2.02 ), [25] восемь полнофункциональных сопроцессоров, называемых элементами синергетической обработки , или SPE, и специализированная кольцевая шина данных с высокой пропускной способностью , соединяющая PPE, элементы ввода / вывода и SPE, называемая межсоединенной шиной элементов или EIB.

Чтобы достичь высокой производительности, необходимой для математически интенсивных задач, таких как декодирование/кодирование потоков MPEG , генерация или преобразование трехмерных данных или проведение анализа Фурье данных, процессор Cell объединяет SPE и PPE через EIB, чтобы предоставить доступ через полностью кэшированный когерентный DMA (прямой доступ к памяти) как к основной памяти, так и к другим внешним хранилищам данных. Чтобы максимально эффективно использовать возможности EIB и обеспечить дублирование вычислений и передачи данных, каждый из девяти обрабатывающих элементов (PPE и SPE) оснащен механизмом DMA . Поскольку инструкции загрузки/сохранения SPE могут обращаться только к своей собственной локальной памяти , каждый SPE полностью зависит от DMA для передачи данных в основную память и из локальной памяти других SPE и обратно. Операция DMA может передавать либо область одного блока размером до 16 КБ, либо список от 2 до 2048 таких блоков. Одним из основных проектных решений в архитектуре Cell является использование DMA в качестве центрального средства внутричиповой передачи данных с целью обеспечения максимальной асинхронности и параллелизма при обработке данных внутри чипа. [26]

PPE, способный работать с обычной операционной системой, контролирует SPE и может запускать, останавливать, прерывать и планировать процессы, выполняемые на SPE. Для этого в СИЗ имеются дополнительные инструкции, касающиеся контроля за ССН. В отличие от SPE, PPE может читать и записывать в основную и локальную память SPE с помощью стандартных инструкций загрузки/сохранения. Несмотря на полную архитектуру Тьюринга , SPE не являются полностью автономными и требуют, чтобы PPE запустил их, прежде чем они смогут выполнять какую-либо полезную работу. Поскольку большая часть «мощности» системы приходится на синергетические элементы обработки, использование DMA в качестве метода передачи данных и ограниченный объем локальной памяти каждого SPE представляют собой серьезную проблему для разработчиков программного обеспечения, которые хотят максимально эффективно использовать возможности системы. эта мощность требует тщательной ручной настройки программ для достижения максимальной производительности этого процессора.

Архитектура PPE и шины включает в себя различные режимы работы, обеспечивающие разные уровни защиты памяти , позволяя защищать области памяти от доступа определенных процессов, запущенных на SPE или PPE.

И PPE, и SPE представляют собой RISC- архитектуры с 32-битным форматом инструкций фиксированной ширины. PPE содержит 64-битный набор регистров общего назначения (GPR), 64-битный набор регистров с плавающей запятой (FPR) и 128-битный набор регистров Altivec . SPE содержит только 128-битные регистры. Их можно использовать для скалярных типов данных размером от 8 до 64 бит или для вычислений SIMD в различных целочисленных форматах и ​​форматах с плавающей запятой. Адреса системной памяти для PPE и SPE выражаются как 64-битные значения для теоретического диапазона адресов 2. 64 байт (16 эксабайт или 16 777 216 терабайт). На практике не все эти биты реализованы аппаратно. Адреса локального хранилища, внутренние для процессора SPU (синергетический процессорный модуль), выражаются в виде 32-битного слова. В документации, касающейся Cell, слово всегда означает 32 бита, двойное слово означает 64 бита, а четверное слово означает 128 бит.

В 2008 году IBM анонсировала обновленный вариант Cell под названием PowerXCell 8i . [27] который доступен в блейд-серверах QS22 от IBM. PowerXCell производится по 65-нм техпроцессу и добавляет поддержку до 32 ГБ слотовой памяти DDR2, а также значительно улучшает производительность операций с плавающей запятой двойной точности на процессорах SPE с пиковой производительности около 12,8 гигафлопс до общей суммы 102,4 гигафлопс. восемь SPE, что по совпадению соответствует пиковой производительности векторного процессора NEC SX-9, выпущенного примерно в то же время. Суперкомпьютер IBM Roadrunner , самый быстрый в мире в 2008–2009 годах, состоял из 12 240 процессоров PowerXCell 8i и 6 562 процессоров AMD Opteron . [28] Суперкомпьютеры PowerXCell 8i также доминировали во всех шести самых «зеленых» системах в списке Green500, имея самое высокое в мире соотношение MFLOPS/Ватт. [29] Помимо QS22 и суперкомпьютеров, процессор PowerXCell также доступен в качестве ускорителя на карте PCI Express и используется в качестве основного процессора в проекте QPACE .

Поскольку в PowerXCell 8i был удален интерфейс памяти RAMBUS и добавлены значительно более крупные интерфейсы DDR2 и улучшенные SPE, компоновку чипа пришлось переработать, что привело как к увеличению размера кристалла чипа, так и к его упаковке. [30]

Архитектура

[ редактировать ]

Хотя чип Cell может иметь несколько различных конфигураций, базовая конфигурация представляет собой многоядерный чип, состоящий из одного «Элемента силового процессора» («PPE») (иногда называемого «Элементом обработки» или «PE») и нескольких «Элементы синергетической обработки» («SPE»). [31] СИЗ и SPE связаны между собой внутренней высокоскоростной шиной, получившей название «Элементная межсетевая шина» («EIB»).

Элемент силового процессора (СИЗ)

[ редактировать ]

СИЗ [32] [33] [34] Это на базе PowerPC двойного назначения, двунаправленное, одновременное и многопоточное, ядро ​​ЦП , с 23-ступенчатым конвейером, действующим в качестве контроллера для восьми SPE, которые обрабатывают большую часть вычислительной нагрузки. PPE имеет ограниченные возможности выполнения внеочередного выполнения; он может выполнять загрузку вне очереди и имеет конвейеры с задержкой выполнения. PPE будет работать с обычными операционными системами из-за его сходства с другими 64-битными процессорами PowerPC, тогда как SPE предназначены для выполнения векторизованного кода с плавающей запятой. PPE содержит 32 КиБ инструкций уровня 1 объемом кэш , кэш данных уровня 1 объемом 32 КиБ и кэш уровня 2 объемом 512 КиБ. Размер строки кэша во всех кэшах составляет 128 байт. [27] : 136–137, 141  Кроме того, IBM включила устройство AltiVec (VMX). [35] который полностью конвейеризирован для операций с плавающей запятой одинарной точности (Altivec 1 не поддерживает двойной точности векторы с плавающей запятой ), 32-битный блок фиксированной точки (FXU) с 64-битным файлом регистров на поток, блок загрузки и хранения (LSU) , 64-битный модуль с плавающей запятой (FPU) , модуль ветвления (BRU) и модуль выполнения ветвления (BXU). [32] PPE состоит из трех основных блоков: блока инструкций (IU), блока выполнения (XU) и векторного/скалярного исполнительного блока (VSU). IU содержит кэш инструкций L1, аппаратное обеспечение прогнозирования ветвей, буферы инструкций и логику проверки зависимостей. XU содержит целочисленные исполнительные блоки (FXU) и блок загрузки-сохранения (LSU). VSU содержит все ресурсы выполнения для FPU и VMX. Каждый PPE может выполнять две операции двойной точности за такт, используя скалярную инструкцию плавного умножения-сложения, что соответствует 6,4 гигафлопс на частоте 3,2 ГГц; или восемь операций одинарной точности за такт с векторной инструкцией слияния-умножения-сложения, что соответствует 25,6 гигафлопс на частоте 3,2 ГГц. [36]

Ксенон в Xbox 360

[ редактировать ]

PPE был разработан специально для процессора Cell, но во время разработки Microsoft обратилась к IBM с просьбой о высокопроизводительном процессорном ядре для Xbox 360 . IBM подчинилась и создала трехъядерный процессор Xenon на основе слегка модифицированной версии PPE с добавленными расширениями VMX128. [37] [38]

Синергетический обрабатывающий элемент (SPE)

[ редактировать ]

Каждый SPE представляет собой двойную систему обработки заказов, состоящую из «синергетического процессора». [39] SPU и «контроллер потока памяти», MFC ( DMA , MMU и интерфейс шины ). У SPE нет аппаратного обеспечения для прогнозирования ветвей (следовательно, на компилятор ложится большая нагрузка). [40] Каждый SPE имеет 6 исполнительных блоков, разделенных на нечетные и четные конвейеры на каждом SPE: SPU запускает специально разработанный набор команд (ISA) с 128-битной SIMD . организацией [35] [2] [41] для инструкций одинарной и двойной точности. В текущем поколении ячейки каждый SPE содержит 256 КБ встроенную SRAM емкостью для инструкций и данных, называемую «Локальное хранилище» (не путать с «Локальной памятью» в документах Sony, где упоминается VRAM), которая видна для СИЗ и могут быть решены непосредственно с помощью программного обеспечения. Каждый SPE может поддерживать до 4 ГиБ локальной памяти хранилища. Локальное хранилище не работает как обычный кэш ЦП , поскольку оно не является прозрачным для программного обеспечения и не содержит аппаратных структур, которые предсказывают, какие данные следует загружать. SPE содержат 128-битный регистровый файл со 128 записями и имеют размер 14,5 мм. 2 по 90-нм техпроцессу. SPE может работать с шестнадцатью 8-битными целыми числами, восемью 16-битными целыми числами, четырьмя 32-битными целыми числами или четырьмя числами с плавающей запятой одинарной точности за один такт, а также с операциями с памятью. Обратите внимание, что SPU не может напрямую обращаться к системной памяти; 64-битные адреса виртуальной памяти, сформированные SPU, должны быть переданы из SPU в контроллер потока памяти (MFC) SPE для настройки операции DMA в адресном пространстве системы.

В одном типичном сценарии использования система загружает SPE небольшими программами (похожими на потоки ), объединяя SPE в цепочку для обработки каждого шага сложной операции. Например, телеприставка может загружать программы для чтения DVD, декодирования видео и аудио, а также отображения, и данные будут передаваться от SPE к SPE, пока, наконец, не окажутся на телевизоре. Другая возможность — разделить набор входных данных и заставить несколько SPE параллельно выполнять одни и те же операции. При частоте 3,2 ГГц каждый SPE обеспечивает теоретическую 25,6 гигафлопс производительность одинарной точности .

По сравнению с его современниками в области персональных компьютеров , относительно высокая общая производительность процессора Cell с плавающей запятой, по-видимому, затмевает возможности блока SIMD в таких процессорах, как Pentium 4 и Athlon 64 . Однако сравнение возможностей системы только с плавающей запятой является одномерным и специфичным для приложения показателем. В отличие от процессора Cell, такие настольные процессоры больше подходят для программного обеспечения общего назначения, обычно запускаемого на персональных компьютерах. Помимо выполнения нескольких инструкций за такт, процессоры Intel и AMD оснащены функцией прогнозирования ветвей . Cell предназначен для компенсации этого с помощью компилятора, в котором создаются инструкции по подготовке к переходу. Для операций с плавающей запятой двойной точности, которые иногда используются в персональных компьютерах и часто используются в научных вычислениях, производительность Cell падает на порядок, но все же достигает 20,8 GFLOPS (1,8 GFLOPS на SPE, 6,4 GFLOPS на PPE). Вариант PowerXCell 8i, специально разработанный для вычислений с двойной точностью, достигает 102,4 GFLOPS в вычислениях с двойной точностью. [42]

Испытания IBM показывают, что SPE могут достичь 98% своей теоретической пиковой производительности при использовании оптимизированного параллельного умножения матриц. [36]

Toshiba разработала сопроцессор с четырьмя SPE, но без PPE, под названием SpursEngine, предназначенный для ускорения 3D-эффектов и киноэффектов в бытовой электронике.

Каждый SPE имеет локальную память объемом 256 КБ. [43] Всего SPE имеют 2 МБ локальной памяти.

Межсетевая шина элемента (EIB)

[ редактировать ]

EIB — это внутренняя коммуникационная шина процессора Cell, которая соединяет различные внутрикристальные системные элементы: процессор PPE, контроллер памяти (MIC), восемь сопроцессоров SPE и два внешних интерфейса ввода-вывода. из 12 участников PS3 (количество SPU может меняться в зависимости от промышленного применения). В состав ЕИБ также входит арбитражное подразделение, выполняющее функции светофора. В некоторых документах IBM называет участников ЕИБ «единицами».

В настоящее время EIB реализован как кольцевое кольцо, состоящее из четырех однонаправленных каналов шириной 16 байт, которые попарно вращаются в противоположных направлениях. Если позволяет структура трафика, каждый канал может передавать до трех транзакций одновременно. Поскольку EIB работает на половине системной тактовой частоты, эффективная скорость канала составляет 16 байт каждые два системных такта. При максимальном параллелизме , с тремя активными транзакциями в каждом из четырех колец, пиковая мгновенная пропускная способность EIB составляет 96 байт за такт (12 одновременных транзакций × ширина 16 байт / 2 системных такта на передачу). Хотя эта цифра часто цитируется в литературе IBM, просто масштабировать это число по тактовой частоте процессора нереально. Арбитражный орган накладывает дополнительные ограничения .

Старший инженер IBM Дэвид Кролак , ведущий дизайнер ЕИБ, объясняет модель параллелизма:

Кольцо может начинать новую операцию каждые три цикла. Каждая передача всегда занимает восемь тактов. Это было одно из упрощений, которые мы сделали: оно оптимизировано для потоковой передачи большого количества данных. Если вы выполняете небольшие операции, это работает не так хорошо. Если вы думаете о восьмивагонных поездах, курсирующих по этому пути, то, пока поезда не сталкиваются друг с другом, они могут сосуществовать на пути. [44]

Каждый участник EIB имеет один 16-байтовый порт чтения и один 16-байтовый порт записи. Ограничением для одного участника является скорость чтения и записи 16 байт за такт EIB (для простоты часто считается 8 байт за такт системы). Каждый процессор SPU содержит выделенную очередь управления DMA, способную планировать длинные последовательности транзакций к различным конечным точкам, не мешая текущим вычислениям SPU; этими очередями DMA можно управлять локально или удаленно, что обеспечивает дополнительную гибкость модели управления.

Данные передаются по каналу EIB пошагово по кольцу. Поскольку участников двенадцать, общее количество шагов по каналу обратно к исходной точке равно двенадцати. Шесть шагов — это самое длинное расстояние между любой парой участников. Каналу EIB не разрешено передавать данные, требующие более шести шагов; такие данные должны идти по более короткому маршруту по кругу в другом направлении. Количество шагов, участвующих в отправке пакета, очень мало влияет на задержку передачи: тактовая частота, определяющая эти шаги, очень высока по сравнению с другими факторами. Однако более длинные расстояния связи вредны для общей производительности EIB, поскольку они уменьшают доступный параллелизм.

Несмотря на первоначальное желание IBM реализовать EIB как более мощную перекрестную панель, циклическая конфигурация, которую они приняли для экономии ресурсов, редко представляет собой ограничивающий фактор для производительности чипа Cell в целом. В худшем случае программист должен проявлять особую осторожность при планировании шаблонов связи, при которых EIB сможет функционировать на высоких уровнях параллелизма.

Дэвид Кролак объяснил:

Ну, вначале, на ранних этапах процесса разработки, несколько человек настаивали на перекрестном переключателе, и, учитывая конструкцию шины, вы могли бы фактически вытащить EIB и поставить перекрестный переключатель, если бы вы были готовы выделить больше кремния. место на чипе для проводки. Нам нужно было найти баланс между возможностью подключения и площадью, а места для установки полноценного перекрестного переключателя просто не хватило. Поэтому мы придумали кольцевую структуру, которая, на наш взгляд, очень интересна. Он вписывается в ограничения по площади и при этом имеет очень впечатляющую пропускную способность. [44]

Оценка пропускной способности

[ редактировать ]

При частоте 3,2 ГГц каждый канал передается со скоростью 25,6 ГБ/с. Если рассматривать EIB отдельно от элементов системы, которые он подключает, выполнение двенадцати одновременных транзакций при такой скорости потока дает абстрактную пропускную способность EIB 307,2 ГБ/с. Исходя из этой точки зрения, во многих публикациях IBM доступная пропускная способность EIB описывается как «более 300 ГБ/с». Это число отражает пиковую мгновенную пропускную способность EIB, масштабируемую по частоте процессора. [45]

Однако в механизме арбитража пакетов, принимаемых на шину, действуют и другие технические ограничения. Группа IBM Systems Performance объяснила:

Каждое устройство EIB может одновременно отправлять и получать 16 байт данных за каждый цикл шины. Максимальная полоса пропускания данных всего EIB ограничена максимальной скоростью, с которой отслеживаются адреса во всех устройствах системы, которая равна одному за цикл шины. Поскольку каждый запрос отслеживаемого адреса потенциально может передавать до 128 байтов, теоретическая пиковая пропускная способность данных на EIB на частоте 3,2 ГГц составляет 128Bx1,6 ГГц = 204,8 ГБ/с. [36]

Эта цитата, по-видимому, отражает полную степень публичного раскрытия IBM этого механизма и его воздействия. Арбитражный блок EIB, механизм отслеживания и генерация прерываний при ошибках трансляции сегмента или страницы недостаточно подробно описаны в наборе документации, который еще не опубликован IBM. [ нужна ссылка ]

На практике эффективная полоса пропускания EIB также может быть ограничена участвующими участниками кольца. Хотя каждое из девяти процессорных ядер может поддерживать скорость одновременного чтения и записи 25,6 ГБ/с, контроллер интерфейса памяти (MIC) привязан к паре каналов памяти XDR, обеспечивая максимальный поток 25,6 ГБ/с для операций чтения и записи вместе взятых, а также Задокументировано, что два контроллера ввода-вывода поддерживают максимальную комбинированную скорость ввода 25,6 ГБ/с и максимальную комбинированную скорость вывода 35 ГБ/с.

Чтобы еще больше запутать, в некоторых старых публикациях упоминается полоса пропускания EIB при условии, что системная тактовая частота составляет 4 ГГц. В результате этого эталонного кадра мгновенная пропускная способность EIB составляет 384 ГБ/с, а пропускная способность, ограниченная арбитражем, — 256 ГБ/с.

Учитывая все обстоятельства, лучше всего иметь в виду наиболее часто упоминаемое теоретическое значение 204,8 ГБ/с. Группа IBM Systems Performance продемонстрировала, что потоки данных, ориентированные на SPU, достигают скорости 197 ГБ/с на процессоре Cell, работающем на частоте 3,2 ГГц, так что это число также является справедливым отражением практики. [36]

Контроллеры памяти и ввода-вывода

[ редактировать ]

Cell содержит двухканальный макрос Rambus XIO, который взаимодействует с памятью Rambus XDR . Контроллер интерфейса памяти (MIC) отделен от макроса XIO и разработан IBM. Канал XIO-XDR работает со скоростью 3,2 Гбит/с на контакт. Два 32-битных канала могут обеспечить теоретический максимум 25,6 ГБ/с.

Интерфейс ввода-вывода, также разработанный Rambus, известен как FlexIO . Интерфейс FlexIO разделен на 12 полос, каждая из которых представляет собой однонаправленный канал «точка-точка» шириной 8 бит. Пять двухточечных маршрутов шириной 8 бит являются входящими полосами для Cell, а остальные семь — исходящими. Это обеспечивает теоретическую пиковую пропускную способность 62,4 ГБ/с (исходящая 36,4 ГБ/с, входящая 26 ГБ/с) на частоте 2,6 ГГц. Интерфейс FlexIO может синхронизироваться независимо, тип. на частоте 3,2 ГГц. 4 входящих + 4 исходящих канала поддерживают согласованность памяти.

Возможные применения

[ редактировать ]

Карта обработки видео

[ редактировать ]

Некоторые компании, такие как Leadtek , выпустили карты PCI-E на базе Cell, позволяющие перекодировать видео H.264 , MPEG-2 и MPEG-4 «быстрее, чем в реальном времени» . [46]

Блейд-сервер

[ редактировать ]

29 августа 2007 г. IBM анонсировала BladeCenter QS21. Производя 1,05 гигафлопс операций с плавающей запятой в секунду (гигафлопс) на ватт, с пиковой производительностью около 460 гигафлопс, она является одной из наиболее энергоэффективных вычислительных платформ на сегодняшний день. Одно шасси BladeCenter может выполнять 6,4 терафлопс операций с плавающей запятой в секунду (терафлопс) и более 25,8 терафлопс в стандартной стойке высотой 42U. [47]

13 мая 2008 г. IBM анонсировала BladeCenter QS22. QS22 оснащен процессором PowerXCell 8i, производительность которого в пять раз превышает производительность с плавающей запятой двойной точности по сравнению с QS21, а также емкостью до 32 ГБ встроенной памяти DDR2. [48]

IBM прекратила выпуск линейки Blade-серверов на базе процессоров Cell с 12 января 2012 года. [49]

плата PCI Express

[ редактировать ]

Несколько компаний предоставляют платы PCI-e, использующие IBM PowerXCell 8i. Производительность заявлена ​​как 179,2 GFlops (SP), 89,6 GFlops (DP) при 2,8 ГГц. [50] [51]

Консольные видеоигры

[ редактировать ]

Sony PlayStation 3 Игровая консоль была первым серийным приложением процессора Cell с тактовой частотой 3,2 ГГц и содержащим семь из восьми работающих SPE, что позволило Sony увеличить производительность производства процессоров. Только шесть из семи SPE доступны разработчикам, поскольку один зарезервирован ОС. [21]

Домашний кинотеатр

[ редактировать ]
Карты B-CAS в телеприставке Toshiba Cell Regza на основе Cell Broadband Engine

Toshiba производит телевизоры высокой четкости с использованием Cell. Они представили систему, позволяющую стандартной четкости MPEG-2 одновременно декодировать 48 потоков на экране с разрешением 1920×1080 . [52] [53] Это может позволить зрителю выбрать канал на основе десятков миниатюр видео, одновременно отображаемых на экране.

Суперкомпьютеры

[ редактировать ]

Суперкомпьютер IBM, IBM Roadrunner , представлял собой гибрид процессоров общего назначения x86-64 Opteron и процессоров Cell. Эта система заняла первое место в списке Top 500 за июнь 2008 года как первый суперкомпьютер, работающий на скорости петафлопс , достигнув устойчивой скорости 1,026 петафлопс с использованием стандартного теста LINPACK . IBM Roadrunner использовала версию процессора Cell PowerXCell 8i, изготовленную с использованием 65-нм технологии и улучшенных SPU, которые могут выполнять вычисления двойной точности в 128-битных регистрах, достигая 102 GFLOP двойной точности на чип. [54] [55]

Кластерные вычисления

[ редактировать ]

Кластеры консолей PlayStation 3 — привлекательная альтернатива высокопроизводительным системам на базе блейд-серверов Cell. Инновационная вычислительная лаборатория, группа под руководством Джека Донгарры на факультете компьютерных наук Университета Теннесси, тщательно исследовала такое применение. [56] Terrasoft Solutions продает 8-узловые и 32-узловые кластеры PS3 с системой Yellow Dog Linux предустановленной — результат исследования Донгарры.

Как впервые сообщил Wired 17 октября 2007 г., [57] Интересное применение использования PlayStation 3 в кластерной конфигурации было реализовано астрофизиком Гауравом Ханной с физического факультета Массачусетского университета в Дартмуте , который заменил время, используемое на суперкомпьютерах, кластером из восьми PlayStation 3. Впоследствии следующее поколение этой машины, теперь называемое PlayStation 3 Gravity Grid , использует сеть из 16 машин и использует процессор Cell для предполагаемого применения, а именно бинарных черных дыр объединения с использованием теории возмущений . В частности, кластер выполняет астрофизическое моделирование больших сверхмассивных черных дыр, захватывающих более мелкие компактные объекты, и генерирует числовые данные, которые неоднократно публиковались в соответствующей научно-исследовательской литературе. [58] Версия процессора Cell, используемая PlayStation 3, имеет основной процессор и 6 SPE, доступных пользователю, что дает машине Gravity Grid сеть из 16 процессоров общего назначения и 96 векторных процессоров. Единовременная стоимость создания машины составляет 9000 долларов, и она подходит для моделирования черных дыр, которое в противном случае стоило бы 6000 долларов за запуск на обычном суперкомпьютере. Расчеты черных дыр не требуют большого объема памяти и легко локализуются, поэтому хорошо подходят для этой архитектуры. Ханна утверждает, что производительность кластера превышает производительность традиционного Linux-кластера на базе Intel Xeon с более чем 100 ядрами, согласно его моделированиям. PS3 Gravity Grid привлекала значительное внимание средств массовой информации в течение 2007 года. [59] 2008, [60] [61] 2009, [62] [63] [64] и 2010. [65] [66]

Лаборатория вычислительной биохимии и биофизики Университета Помпеу Фабра в Барселоне в 2007 году внедрила систему BOINC под названием PS3GRID. [67] для совместных вычислений на базе программного обеспечения CellMD, первого разработанного специально для процессора Cell.

США Исследовательская лаборатория ВВС развернула кластер PlayStation 3, состоящий из более чем 1700 устройств, получивший название «Кластер Кондор», для анализа высокого разрешения спутниковых изображений . ВВС утверждают, что кластер Кондор станет 33-м по величине суперкомпьютером в мире по мощности. [68] Лаборатория открыла суперкомпьютер для использования университетами в исследовательских целях. [69]

Распределенные вычисления

[ редактировать ]

Благодаря вычислительной мощности более полумиллиона консолей PlayStation 3 проект распределенных вычислений Folding@home был признан Книгой рекордов Гиннеса самой мощной распределенной сетью в мире. Первый рекорд был достигнут 16 сентября 2007 года, когда проект превысил один петафлопс , который ранее никогда не достигался распределенной вычислительной сетью. Кроме того, совместные усилия позволили только PS3 достичь отметки в петафлопс 23 сентября 2007 года. Для сравнения, второй по мощности суперкомпьютер в мире на тот момент, IBM Blue Gene/L , работал со скоростью около 478,2 терафлопс, что означает производительность Folding@home вычислительная мощность примерно в два раза выше, чем у Blue Gene/L (хотя межсоединение ЦП в Blue Gene/L более чем в миллион раз быстрее, чем средняя скорость сети в Folding@home). По состоянию на 7 мая 2011 г. Folding@home работает со скоростью около 9,3 x86 петафлопс, при этом 1,6 петафлопс генерируются только 26 000 активными PS3.

Мейнфреймы

[ редактировать ]

25 апреля 2007 года IBM объявила, что начнет интеграцию своих микропроцессоров Cell Broadband Engine Architecture в System z компании. линейку мэйнфреймов [70] Это привело к геймфрейму .

Взлом пароля

[ редактировать ]

Архитектура процессора делает его более подходящим для аппаратных криптографических атак методом перебора, чем обычные процессоры. [71]

Программная инженерия

[ редактировать ]

Благодаря гибкой природе ячейки существует несколько возможностей использования ее ресурсов, не ограничивающихся разными вычислительными парадигмами: [72]

Очередь заданий

[ редактировать ]

PPE поддерживает очередь заданий, планирует задания в SPE и отслеживает ход выполнения. Каждый SPE запускает «мини-ядро», роль которого заключается в получении задания, его выполнении и синхронизации с PPE.

Самостоятельная многозадачность SPE

[ редактировать ]

Мини-ядро и планирование распределены по SPE. Задачи синхронизируются с помощью мьютексов или семафоров, как в обычной операционной системе . Готовые к выполнению задачи ждут в очереди, пока SPE выполнит их. SPE используют общую память для всех задач в этой конфигурации.

Потоковая обработка

[ редактировать ]

Каждый SPE реализует отдельную программу. Данные поступают из входного потока и отправляются в SPE. Когда SPE завершает обработку, выходные данные отправляются в выходной поток.

Это обеспечивает гибкую и мощную архитектуру для потоковой обработки и позволяет явно планировать каждый SPE отдельно. Другие процессоры также могут выполнять задачи потоковой передачи, но их возможности ограничены загруженным ядром.

Разработка программного обеспечения с открытым исходным кодом

[ редактировать ]

В 2005 году разработчики IBM представили для включения патчи, обеспечивающие поддержку Cell в ядре Linux. [73] Арнд Бергманн (один из разработчиков вышеупомянутых патчей) также описал архитектуру Cell на базе Linux на LinuxTag 2005. [74] Начиная с версии 2.6.16 (20 марта 2006 г.) ядро ​​Linux официально поддерживает процессор Cell. [75]

И PPE, и SPE можно программировать на C/C++ с использованием общего API, предоставляемого библиотеками.

Fixstars Solutions предоставляет Yellow Dog Linux для систем на базе IBM и Mercury Cell, а также для PlayStation 3. [76] Terra Soft вступила в стратегическое партнерство с Mercury, чтобы предоставить пакет поддержки плат Linux для Cell, а также поддержку и разработку программных приложений на различных других платформах Cell, включая IBM BladeCenter JS21 и Cell QS20, а также решения на базе Mercury Cell. [77] Terra Soft также поддерживает пакет построения и управления кластерами Y-HPC (High Performance Computing) и инструменты секвенирования генов Y-Bio. Y-Bio построен на стандарте RPM Linux для управления пакетами и предлагает инструменты, которые помогают исследователям биоинформатики выполнять свою работу с большей эффективностью. [78] IBM разработала псевдофайловую систему для Linux под названием «Spufs», которая упрощает доступ к ресурсам SPE и их использование. IBM в настоящее время поддерживает ядро ​​Linux и порты GDB , а Sony поддерживает набор инструментов GNU ( GCC , binutils ). [79]

В ноябре 2005 года IBM выпустила на своем веб-сайте «Комплект разработки программного обеспечения Cell Broadband Engine (CBE) версии 1.0», состоящий из симулятора и различных инструментов. Версии для разработки новейшего ядра и инструментов для Fedora Core 4 хранятся на веб-сайте Суперкомпьютерного центра Барселоны . [80]

В августе 2007 года Mercury Computer Systems выпустила комплект разработки программного обеспечения для PlayStation 3 для высокопроизводительных вычислений. [81]

В ноябре 2007 года корпорация Fixstars выпустила новый модуль «CVCell», призванный ускорить несколько важных API-интерфейсов OpenCV для Cell. В серии расчетных тестов программного обеспечения они зафиксировали время выполнения на процессоре Cell с частотой 3,2 ГГц, которое было в 6–27 раз быстрее по сравнению с тем же программным обеспечением на процессоре Intel Core 2 Duo с частотой 2,4 ГГц. [82]

В октябре 2009 года IBM выпустила драйвер OpenCL для POWER6 и CBE. Это позволяет легко запускать программы, написанные с использованием кроссплатформенного API, на Cell PSE. [83]

Иллюстрации процессоров Cell/BE разных поколений и PowerXCell 8i. Изображения не в масштабе; Все корпуса Cell/BE имеют размеры 42,5×42,5 мм, а PowerXCell 8i — 47,5×47,5 мм.

См. также

[ редактировать ]
  1. ^ «Книга по архитектуре PowerPC, версия 2.02» . ИБМ . 16 ноября 2005 г. Архивировано из оригинала 29 ноября 2020 г.
  2. ^ Jump up to: а б с Гшвинд, Майкл; Хофсти, Х. Питер; Флакс, Брайан; Хопкинс, Мартин; Ватанабэ, Юкио; Ямазаки, Такеши (март – апрель 2006 г.). «Синергетическая обработка в многоядерной архитектуре ячейки» (PDF) . IEEE микро . 26 (2). IEEE: 10–24. дои : 10.1109/MM.2006.41 . S2CID   17834015 .
  3. ^ «Cell Designer рассказывает о процессорах PS3 и IBM Cell» . Архивировано из оригинала 21 августа 2006 года . Проверено 22 марта 2007 г.
  4. ^ Годен, Шарон (9 июня 2008 г.). «Roadrunner от IBM преодолевает 4-минутную милю суперкомпьютеров» . Компьютерный мир . Архивировано из оригинала 24 декабря 2008 года . Проверено 10 июня 2008 г.
  5. ^ Филдс, Джонатан (9 июня 2008 г.). «Суперкомпьютер задает темп в петафлопе» . Новости Би-би-си . Проверено 9 июня 2008 г.
  6. ^ Шенкленд, Стивен (22 февраля 2006 г.). «Октопилер стремится вооружить программистов Cell» . CNET . Проверено 22 марта 2007 г.
  7. ^ «Комплект разработки программного обеспечения Cell Broadband Engine, версия 1.0» . ЛВН. 10 ноября 2005 года . Проверено 22 марта 2007 г.
  8. Кревелл, Кевин (14 февраля 2005 г.). «Клетка оказывается в центре внимания». Отчет микропроцессора .
  9. ^ Jump up to: а б «Введение в мультипроцессор Cell» . Журнал исследований и разработок IBM. 7 августа 2005 года. Архивировано из оригинала 28 февраля 2007 года . Проверено 22 марта 2007 г.
  10. ^ Jump up to: а б с «IBM производит клеточный процессор с использованием новой технологии производства» . X-битные лаборатории. Архивировано из оригинала 15 марта 2007 года . Проверено 12 марта 2007 г.
  11. ^ «Начато производство 65-нм процессоров CELL» . Вселенная PlayStation. 30 января 2007 года. Архивировано из оригинала 2 февраля 2007 года . Проверено 18 мая 2007 г.
  12. ^ Стоукс, Джон (7 февраля 2008 г.). «IBM сжимает Cell до 45 нм. За этим последуют более дешевые PS3» . Arstechnica.com . Проверено 19 сентября 2012 г.
  13. ^ «IBM предлагает более высокопроизводительные вычисления за пределами лаборатории» . ИБМ . Проверено 15 мая 2008 г.
  14. ^ «Sony отвечает на наши вопросы о новой PlayStation 3» . Арс Техника . 18 августа 2009 года . Проверено 19 августа 2009 г.
  15. ^ «Будет ли Roadrunner последним ура ячейки?» . 27 октября 2009 г. Архивировано из оригинала 31 октября 2009 г.
  16. ^ «SC09: IBM прекращает выпуск процессора Cell» . HeiseOnline . 20 ноября 2009 года . Проверено 21 ноября 2009 г.
  17. ^ «IBM не остановила разработку процессоров Cell» . DriverHeaven.net. 23 ноября 2009 года. Архивировано из оригинала 25 ноября 2009 года . Проверено 24 ноября 2009 г.
  18. ^ Беккер, Дэвид (7 февраля 2005 г.). «Чип PlayStation 3 имеет раздвоение личности» . CNET . Проверено 18 мая 2007 г.
  19. ^ Jump up to: а б Терротт, Пол (17 мая 2005 г.). «Sony повышает ставку с PlayStation 3» . WindowsITPro. Архивировано из оригинала 30 сентября 2007 года . Проверено 22 марта 2007 г.
  20. ^ Jump up to: а б Ропер, Крис (17 мая 2005 г.). «E3 2005: Демонстрации технологий клеточных процессоров» . ИГН . Проверено 22 марта 2007 г.
  21. ^ Jump up to: а б Мартин Линклейтер. «Оптимизация клеточного ядра». Журнал Game Developer Magazine, апрель 2007 г. стр. 15–18. Чтобы увеличить производительность производства, Sony поставляет процессоры PlayStation 3 Cell только с семью работающими процессорами SPE. И из этих семи один SPE будет использоваться операционной системой для различных задач. Таким образом, остается шесть SPE и 1 PPE для использования программистами игр.
  22. ^ Jump up to: а б «Mercury выигрывает награду IBM PartnerWorld Beacon» . Суперкомпьютеры онлайн. 12 апреля 2007 года . Проверено 18 мая 2007 г. [ мертвая ссылка ]
  23. ^ «Fixstars выпускает плату-ускоритель с PowerXCell 8i» . Корпорация Фиксстарс. 8 апреля 2008 года. Архивировано из оригинала 5 января 2009 года . Проверено 18 августа 2008 г.
  24. ^ «Взгляд внутрь клеточного процессора» . Гамасутра . 13 июля 2006 года . Проверено 19 июня 2019 г.
  25. ^ Коранн, Сандип (15 июля 2009 г.). «Глава 2. Элемент силовой обработки (СИЗ)» . Практические вычисления на платформе сотовой широкополосной связи . Springer Science+Business Media . п. 17. дои : 10.1007/978-1-4419-0308-2_2 . ISBN  978-1-4419-0307-5 .
  26. ^ Гшвинд, Майкл (2006). «Многопроцессорная обработка микросхем и механизм сотовой широкополосной связи» . Материалы 3-й конференции по передовым технологиям вычислений - CF '06 . АКМ. стр. 1–8. дои : 10.1145/1128022.1128023 . ISBN  1595933026 . S2CID   14226551 . Проверено 29 июня 2008 г.
  27. ^ Jump up to: а б Руководство по программированию Cell Broadband Engine, включая процессор PowerXCell 8i (PDF) . Версия 1.11. ИБМ . 12 мая 2008 г. Архивировано из оригинала (PDF) 11 марта 2018 г. . Проверено 10 марта 2018 г.
  28. ^ «IBM анонсирует PowerXCell 8i, блейд-сервер QS22» . За пределами 3D. Май 2008. Архивировано из оригинала 16 июня 2008 года . Проверено 10 июня 2008 г.
  29. ^ «Список Green500 – ноябрь 2009 г.» . Архивировано из оригинала 23 февраля 2011 года.
  30. ^ «Упаковка микропроцессора Cell Broadband Engine для суперкомпьютерных приложений» (PDF) . Архивировано из оригинала (PDF) 4 января 2014 года . Проверено 4 января 2014 г.
  31. ^ «Брифинг по клеточному микропроцессору» . IBM, Sony Computer Entertainment Inc., Toshiba Corp., 7 февраля 2005 г.
  32. ^ Jump up to: а б Ким, Хесон (весна 2011 г.). «CS4803DGC Проектирование и программирование игровой консоли» (PDF) .
  33. ^ Коранн, Сандип (2009). Практические вычисления на платформе сотовой широкополосной связи . Springer Science+Business Media. п. 19. ISBN  9781441903082 .
  34. ^ Хофсти, Х. Питер (2005). «Все о клеточном процессоре» (PDF) . Архивировано из оригинала (PDF) 6 сентября 2011 года.
  35. ^ Jump up to: а б «Энергоэффективный процессор и клеточный процессор» (PDF) . ИБМ. 16 февраля 2005 г. Архивировано из оригинала (PDF) 26 апреля 2005 г. . Проверено 12 июня 2005 г.
  36. ^ Jump up to: а б с д Чен, Томас; Рагхаван, Рам; Дейл, Джейсон; Ивата, Эйдзи (29 ноября 2005 г.). «Архитектура Cell Broadband Engine и ее первая реализация» . IBM DeveloperWorks . Архивировано из оригинала 27 октября 2012 года . Проверено 9 сентября 2012 г.
  37. ^ Александр, Ли (16 января 2009 г.). «Обработка истины: интервью с Дэвидом Шиппи]» . Гамасутра .
  38. ^ Последний, Джонатан В. (30 декабря 2008 г.). «Игра в дурака» . Уолл Стрит Джорнал .
  39. ^ Спецификация двоичного интерфейса приложения SPU (PDF) . 18 июля 2008 г. Архивировано из оригинала (PDF) 18 ноября 2014 г. . Проверено 24 января 2015 г.
  40. ^ «IBM Research – Cell» . ИБМ . Архивировано из оригинала 14 июня 2005 года . Проверено 11 июня 2005 г.
  41. ^ «Новая архитектура SIMD для гетерогенного мультипроцессора Cell» (PDF) . Hot Chips 17. 15 августа 2005 г. Архивировано из оригинала (PDF) 9 июля 2008 г. Проверено 1 января 2006 г.
  42. ^ «Преемник ячейки с турборежимом — PowerXCell 8i» . ППЦНукс. Ноябрь 2007. Архивировано из оригинала 10 января 2009 года . Проверено 10 июня 2008 г.
  43. ^ «Поддержка OpenMP в ячейке» (PDF) . IBM TJ Watson Research . Архивировано из оригинала (PDF) 8 января 2019 года.
  44. ^ Jump up to: а б «Знакомьтесь с экспертами: Дэвид Кролак на шине EIB Cell Broadband Engine» . ИБМ. 6 декабря 2005 года . Проверено 18 марта 2007 г.
  45. ^ «Ячеистая многопроцессорная сеть связи: создана для скорости» (PDF) . IEEE. Архивировано из оригинала (PDF) 7 января 2007 года . Проверено 22 марта 2007 г.
  46. ^ «Карта транскодирования Leadtek PxVC1100 MPEG-2/H.264» . 12 ноября 2009 г.
  47. ^ «IBM удваивает ставку на Cell Blade» (пресс-релиз). Армонк, Нью-Йорк: IBM . 29 августа 2007 года . Проверено 19 июля 2017 г.
  48. ^ «IBM предлагает высокопроизводительные вычисления вне лаборатории» (пресс-релиз). Армонк, Нью-Йорк: IBM . 13 мая 2008 года . Проверено 19 июля 2017 г.
  49. ^ Морган, Тимоти Прикетт (28 июня 2011 г.). «IBM уничтожит последний блейд-сервер Cell» . Регистр . Проверено 19 июля 2017 г.
  50. ^ «Пресс-релиз Fixstars» . Архивировано из оригинала 5 января 2009 года . Проверено 18 августа 2008 г.
  51. ^ «Карта сотового сопроцессора работает под управлением Linux» . Архивировано из оригинала 2 мая 2009 года.
  52. ^ «Toshiba демонстрирует сотовый микропроцессор, одновременно декодирующий 48 потоков MPEG-2» . Тех-он!. 25 апреля 2005 г.
  53. ^ «Победитель: Мультимедийный монстр» . IEEE-спектр . 1 января 2006 года. Архивировано из оригинала 18 января 2006 года . Проверено 22 января 2006 г.
  54. ^ «За пределами одной клетки» (PDF) . Лос-Аламосская национальная лаборатория. Архивировано из оригинала (PDF) 8 июля 2009 г. Проверено 6 апреля 2017 г.
  55. ^ Уильямс, Сэмюэл; Шальф, Джон; Оликер, Леонид; Мужья, Парри; Камил, Шоаиб; Йелик, Кэтрин (2005). «Потенциал клеточного процессора для научных вычислений» . Передовые рубежи вычислений ACM . Проверено 6 апреля 2017 г.
  56. ^ «SCOP3: Примерное руководство по научным вычислениям на PlayStation 3» (PDF) . Факультет компьютерных наук Университета Теннесси. Архивировано из оригинала (PDF) 15 октября 2008 г. Проверено 8 мая 2007 г.
  57. ^ Гардинер, Брайан (17 октября 2007 г.). «Астрофизик заменяет суперкомпьютер восемью PlayStation 3» . Проводной . Проверено 17 октября 2007 г.
  58. ^ «Гравитационная решетка PS3» . Гаурав Ханна, доцент Инженерного колледжа Массачусетского университета в Дартмуте.
  59. ^ «Кластер PS3 создает самодельный, более дешевый суперкомпьютер» . 24 октября 2007 г.
  60. ^ Хайфилд, Роджер (17 февраля 2008 г.). «Почему учёные любят игровые консоли» . «Дейли телеграф» . Лондон. Архивировано из оригинала 6 сентября 2009 года.
  61. ^ Пекхэм, Мэтт (23 декабря 2008 г.). «Ничто не ускользнет от притяжения PlayStation 3, даже черная дыра» . Вашингтон Пост .
  62. ^ Малик, Тарик (28 января 2009 г.). «Консоли PlayStation 3 борются с вибрациями черных дыр» . Space.com .
  63. ^ Лайден, Джеки (21 февраля 2009 г.). «Playstation 3: суперкомпьютер со скидкой?» . ЭНЕРГЕТИЧЕСКИЙ ЯДЕРНЫЙ РЕАКТОР .
  64. ^ Валлич, Пол (1 апреля 2009 г.). «Суперкомпьютер становится персональным» . IEEE-спектр .
  65. ^ «Суперкомпьютер на базе PlayStation» . Новости Би-би-си . 4 сентября 2010 г.
  66. ^ Фаррелл, Джон (12 ноября 2010 г.). «Черные дыры и квантовые петли: больше, чем просто игра» . Форбс .
  67. ^ «PS3GRID.net» .
  68. ^ «Министерство обороны обсуждает новый суперкомпьютер Sony PlayStation» . 30 ноября 2010 г.
  69. ^ «Кластеры PlayStation 3 обеспечивают университетам недорогие суперкомпьютеры» . Архивировано из оригинала 14 мая 2013 года.
  70. ^ «Мэйнфреймы IBM становятся 3-D» . электронная неделя . 26 апреля 2007 года . Проверено 18 мая 2007 г.
  71. ^ «PlayStation ускоряет проверку пароля» . Новости Би-би-си . 30 ноября 2007 года . Проверено 17 января 2011 г.
  72. ^ «CELL: новая платформа для цифровых развлечений» . Sony Computer Entertainment Inc., 9 марта 2005 г. Архивировано из оригинала 28 октября 2005 г.
  73. ^ Бергманн, Арнд (21 июня 2005 г.). «ppc64: Представляем платформу Cell/BPA, v3» . Проверено 22 марта 2007 г.
  74. ^ «Модель программирования клеточного процессора» . ЛинуксТаг 2005 . Архивировано из оригинала 18 ноября 2005 года . Проверено 11 июня 2005 г.
  75. ^ Шенкленд, Стивен (21 марта 2006 г.). «Linux получает встроенную поддержку процессоров Cell» . CNET . Проверено 22 марта 2007 г.
  76. ^ «Terra Soft предоставит Linux для PLAYSTATION3» . Архивировано из оригинала 30 марта 2009 года.
  77. ^ Terra Soft — Linux для Cell, PlayStation PS3, QS20, QS21, QS22, IBM System p, Mercury Cell и Apple PowerPC. Архивировано 23 февраля 2007 г. на Wayback Machine.
  78. ^ «Ю-Био» . 31 августа 2007 г. Архивировано из оригинала 2 сентября 2007 г.
  79. ^ «Арнд Бергманн на мобильном» . IBM DeveloperWorks. 25 июня 2005 г.
  80. ^ «Linux в системах на базе Cell BE» . Суперкомпьютерный центр Барселоны. Архивировано из оригинала 8 марта 2007 года . Проверено 22 марта 2007 г.
  81. ^ «Mercury Computer Systems выпускает комплект разработки программного обеспечения для PLAYSTATION(R)3 для высокопроизводительных вычислений» (пресс-релиз). Компьютерные системы Меркурий . 3 августа 2007 г. Архивировано из оригинала 18 августа 2007 г.
  82. ^ « CVCell» — модуль, разработанный Fixstars, который ускоряет библиотеку OpenCV для процессора Cell/BE» . Корпорация Фиксстарс. 28 ноября 2007. Архивировано из оригинала 17 июля 2010 года . Проверено 12 декабря 2008 г.
  83. ^ «IBM выпускает драйверы OpenCL для POWER6 и Cell/BE» The Khronos Group . 2 сентября 2023 г.
[ редактировать ]
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 1f79230e82c26ba91a49ccb13ff03515__1722384960
URL1:https://arc.ask3.ru/arc/aa/1f/15/1f79230e82c26ba91a49ccb13ff03515.html
Заголовок, (Title) документа по адресу, URL1:
Cell (processor) - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)