МОЩНОСТЬ1
![]() | Эта статья включает список общих ссылок , но в ней отсутствуют достаточные соответствующие встроенные цитаты . ( сентябрь 2017 г. ) |
Общая информация | |
---|---|
Запущен | 1990 |
Разработано | ИБМ |
Архитектура и классификация | |
Набор инструкций | СИЛА ОДИН |
История | |
Преемник | МОЩНОСТЬ2 |
POWER , PowerPC и Power ISA. Архитектуры |
---|
NXP (ранее Freescale и Motorola) |
ИБМ |
|
IBM/Нинтендо |
Другой |
Ссылки по теме |
Отменено выделено серым цветом , историческое — курсивом |
POWER1 разработанный — это многокристальный процессор, и изготовленный IBM , в котором реализована POWER архитектура набора команд (ISA). Первоначально он был известен как ЦП RISC System/6000 или, в сокращенной форме, ЦП RS/6000 , до появления преемников требовалось заменить исходное имя на имя, которое использовало ту же схему именования (POWER n ), что и его преемников, чтобы отличить его от более новых моделей.
История
[ редактировать ]POWER1 был представлен в 1990 году с появлением IBM RS/6000 POWERserver серверов и рабочих станций POWERstation , которые имели POWER1 с тактовой частотой 20, 25 или 30 МГц . POWER1 получил два обновления: одно в 1991 году с появлением POWER1+ и в 1992 году с появлением POWER1++. Эти обновленные версии имели тактовую частоту, превышающую исходную POWER1, что стало возможным благодаря улучшенным полупроводниковым процессам . POWER1+ имел тактовую частоту немного выше, чем исходный POWER1, на частотах 25, 33 и 41 МГц, тогда как POWER1++ вывел микроархитектуру на самые высокие частоты — 25, 33, 41,6, 45, 50 и 62,5 МГц. В сентябре 1993 года на смену POWER1 и его вариантам пришел POWER2 (кратко известный как «RIOS2»), представлявший собой развитие микроархитектуры POWER1.
Прямыми производными POWER1 являются RISC Single Chip (RSC), однокристальный вариант с уменьшенными функциональными возможностями для систем RS/6000 начального уровня, и RAD6000 , радиационно-стойкий вариант RSC для космических приложений. Косвенным производным от POWER1 является PowerPC 601 , вариант RSC с ограниченными возможностями, предназначенный для потребительских приложений.
POWER1 примечателен тем, что он представлял собой ряд новинок для IBM и вычислительной техники в целом. процессор IBM, Это был первый RISC- предназначенный для высокопроизводительных приложений ( ROMP считался коммерческим провалом и не использовался в высокопроизводительных рабочих станциях), он был первым, реализовавшим новую на тот момент архитектуру набора команд POWER, и это был первый успешный процессор IBM. RISC-процессор. Что касается вычислений, POWER1 будет известен как первый процессор, реализовавший ту или иную форму переименования регистров и выполнения вне очереди — метод, который повышает производительность суперскалярных процессоров, но ранее был зарезервирован для мэйнфреймов .
POWER1 также стал источником следующих за ним весьма успешных семейств процессоров POWER , PowerPC и Power ISA , имеющих сотни различных реализаций.
с открытым исходным кодом Компилятор GCC удалил поддержку POWER1 (RIOS) и POWER2 (RIOS2) в версии 4.5. [1]
Микроархитектура
[ редактировать ]POWER1 — это 32-битный двусторонний суперскалярный процессор. Он содержит три основных исполнительных блока: блок с фиксированной запятой (FXU), блок ветвления (BPU) и блок с плавающей запятой (FPU). Хотя POWER1 представляет собой 32-битный процессор с 32-битным физическим адресом , его виртуальный адрес имеет длину 52 бита. Было выбрано большее виртуальное адресное пространство, поскольку оно повышало производительность приложений, позволяя каждому из них иметь большой диапазон адресов в 4 ГБ .
POWER1 — это процессор с прямым порядком байтов , который использует Гарвардского типа иерархию кэша с отдельными кэшами инструкций и данных. Кэш инструкций, называемый IBM «I-cache», имеет размер 8 КБ и является двунаправленным ассоциативным набором с размером строки 64 байта. I-кэш расположен на чипе ICU. Кэш данных, называемый IBM «D-кэшем», имеет размер 32 КБ для конфигураций RIOS.9 и 64 КБ для конфигураций RIOS-1. D-кэш является четырехсторонним ассоциативным набором с размером строки 128 байт. В D-кэше используется схема обратного хранения, при которой данные, которые должны быть сохранены, записываются в кэш, а не в память, чтобы уменьшить количество операций записи, предназначенных для памяти. Схема обратного хранения используется для предотвращения монополизации процессором доступа к памяти.
Хотя POWER1 был высокопроизводительной конструкцией, он не был способен к многопроцессорной обработке и, как таковой, находился в невыгодном положении, поскольку единственный способ улучшить производительность - это повысить тактовую частоту ЦП, что было трудно сделать с таким большим многочиповым процессором. дизайн. IBM использовала кластеризацию, чтобы преодолеть этот недостаток в системах POWER1, позволяя им эффективно функционировать, как если бы они были многопроцессорными системами. Эта концепция подтверждается популярностью суперкомпьютеров SP1 на базе POWER1. Поскольку POWER1 был основой микропроцессоров POWER2 и P2SC , отсутствие многопроцессорности перешло и на эти более поздние процессоры POWER. Многопроцессорность не поддерживалась до появления POWER3 в 1998 году.
Физическое описание
[ редактировать ]


POWER1 — это многокристальный процессор, построенный из отдельных чипов, соединенных друг с другом шинами. POWER1 состоит из блока кэша инструкций (ICU), блока с фиксированной запятой (FXU), блока с плавающей запятой (FPU), нескольких блоков кэша данных (DCU), блока управления памятью (SCU) и блока управления памятью (SCU). блок ввода-вывода . Благодаря своей модульной конструкции IBM смогла создать две конфигурации, просто варьируя количество DCU: RIOS-1 и RIOS.9 . Конфигурация RIOS-1 имеет запланированное количество четырех DCU и работает с тактовой частотой до 40 МГц, тогда как ЦП RIOS.9 имел два DCU и работал на более низких частотах.
Чипы монтируются на «планарном процессоре», печатной плате (PCB), с использованием технологии сквозных отверстий. Из-за большого количества микросхем с широкими шинами печатная плата имеет восемь плоскостей для разводки проводов, четыре для питания и земли и четыре для сигналов. На каждой стороне платы имеется две сигнальные плоскости, а четыре плоскости питания и земли находятся в центре.
Чипы, составляющие POWER1, изготавливаются по КМОП- технологии 1,0 мкм с тремя слоями межсоединений. Чипы упакованы в корпуса с керамической решеткой выводов (CPGA), которые могут иметь до 300 выводов и рассеивать максимум 4 Вт тепла каждый. Общее количество транзисторов, используемых в POWER1, если предположить, что это конфигурация RIOS-1, составляет 6,9 миллиона, из которых 2,04 миллиона используются для логики и 4,86 миллиона используются для памяти. Площадь кристалла всех чипов вместе взятая составляет 1284 мм. 2 . Общее количество сигнальных контактов — 1464.
Чипсы
[ редактировать ]Блок кэша инструкций (ICU)
[ редактировать ]ICU содержит кэш инструкций, называемый IBM «I-кэшем», и блок обработки ветвей (BPU). BPU содержит счетчик программ , регистр кода состояния и регистр цикла. ICU содержит 0,75 миллиона транзисторов, из которых 0,2 миллиона используются для логики и 0,55 миллиона используются для SRAM . ICU Размер матрицы составляет около 160 мм. 2 (12,7×12,7 мм).
BPU был способен отправлять несколько инструкций в очереди инструкций с фиксированной и плавающей запятой во время выполнения инструкции управления потоком программы (до четырех одновременно и не по порядку). Спекулятивные ветвления также поддерживались за счет использования бита предсказания в инструкциях ветвления, при этом результаты отбрасывались перед сохранением, если ветвь не была выбрана. Альтернативная инструкция будет помещена в буфер и отброшена, если ветвь будет выбрана. Следовательно, вызовы подпрограмм и прерывания обрабатываются без штрафов за ветвление.
Регистр кодов условий имеет восемь наборов полей, первые два зарезервированы для инструкций с фиксированной и плавающей запятой, а седьмой — для векторных инструкций . Остальные поля могут использоваться другими инструкциями. Регистр цикла представляет собой счетчик циклов «уменьшение и ветвление по нулю» без штрафа за ветвление, функция, аналогичная функциям некоторых DSP, таких как TMS320C30.
Блок фиксированной точки (FXU)
[ редактировать ]FXU отвечает за декодирование и выполнение всех инструкций с фиксированной запятой, а также инструкций загрузки и сохранения с плавающей запятой. Для выполнения FXU содержит файл регистров с фиксированной точкой POWER1, арифметико-логическое устройство (АЛУ) для общих инструкций и специальный блок умножения и деления с фиксированной точкой. Он также содержит буферы инструкций, которые получают инструкции как с фиксированной, так и с плавающей запятой из ICU, передавая инструкции с плавающей запятой в FPU, и двусторонний набор-ассоциативный D- TLB на 128 записей для трансляции адресов. FXU содержит около 0,5 миллиона транзисторов, из которых 0,25 миллиона используются для логики и 0,25 миллиона используются для памяти, на кристалле размером примерно 160 мм. 2 .
Модуль с плавающей запятой (FPU)
[ редактировать ]Модуль с плавающей запятой POWER1 выполняет инструкции с плавающей запятой, выданные ICU. FPU является конвейерным и может выполнять инструкции одинарной (32-битной) и двойной точности (64-битной). Он способен выполнять инструкции умножения-сложения , что способствовало высокой производительности POWER1 с плавающей запятой. В большинстве процессоров операции умножения и сложения, которые распространены в техническом и научном коде с плавающей запятой, не могут быть выполнены за один цикл, как в POWER1. Использование объединенного умножения-сложения также означает, что данные округляются только один раз, что немного повышает точность результата.
Файл регистров с плавающей запятой также находится на микросхеме FPU. Он содержит 32 64-битных регистра с плавающей запятой, шесть регистров переименования и два регистра, которые используются инструкциями деления.
Блок кэширования данных (DCU)
[ редактировать ]POWER1 имеет кэш данных объемом 64 КБ , реализованный с помощью четырех идентичных блоков кэша данных (DCU), каждый из которых содержит 16 КБ кэша данных. Кэш и шины, соединяющие DCU с другими чипами, защищены ECC. DCU также обеспечивают интерфейс с памятью. Если присутствуют два DCU (конфигурация RIOS.9), ширина шины памяти составляет 64 бита, а если присутствуют четыре DCU (конфигурация RIOS-1), ширина шины памяти составляет 128 бит. Часть интерфейса памяти модулей DCU обеспечивает три функции, которые повышают надежность и доступность памяти: очистка памяти , ECC и управление битами . Каждый DCU содержит около 1,125 миллиона транзисторов, из которых 0,175 миллиона используются для логики и 0,95 миллиона используются для SRAM, на кристалле размером примерно 130 мм² (11,3 × 11,3 мм).
Блок управления хранилищем (БКУ)
[ редактировать ]POWER1 управляется микросхемой SCU. Все коммуникации между микросхемами ICU, FXU и DCU, а также памятью и устройствами ввода-вывода контролируются SCU. Хотя DCU предоставляют средства для очистки памяти, именно SCU управляет этим процессом. SCU содержит около 0,23 миллиона транзисторов, все логические, на кристалле размером примерно 130 мм. 2 .
Блок ввода-вывода
[ редактировать ]Интерфейсы ввода-вывода POWER1 реализованы блоком ввода-вывода, который содержит контроллер канала ввода-вывода (IOCC) и два адаптера последовательного канала (SLA). IOCC реализует интерфейс Micro Channel и управляет транзакциями ввода-вывода и DMA между адаптерами Micro Channel и системной памятью. Каждое из двух соглашений об уровне обслуживания реализует последовательный оптоволоконный канал, предназначенный для соединения систем RS/6000. Оптические каналы связи не поддерживались на момент выпуска RS/6000. Блок ввода-вывода содержит около 0,5 миллиона транзисторов, из которых 0,3 миллиона используются для логики и 0,2 миллиона для памяти, на кристалле размером примерно 160 мм. 2 .
См. также
[ редактировать ]- Архитектуры набора инструкций: Архитектура набора инструкций IBM POWER , PowerPC , Power ISA.
- Процессоры: Однокристальные RISC , RAD6000 , POWER2 , POWER3 , POWER4 , POWER5 , POWER6 , POWER7 , POWER8 , POWER9 , Power10
- Компьютерные системы: RS/6000 , масштабируемая POWERparallel
- Сопутствующая технология: PowerPC 601 , RS64.
Ссылки
[ редактировать ]- Великие микропроцессоры прошлого и настоящего (V 13.4.0)
- Монтойе, РК; Хокенек, Э.; Руньон, СЛ (январь 1990 г.). «Проектирование исполнительного блока IBM RISC System/6000 с плавающей запятой». Журнал исследований и разработок IBM . 34 (1): 59–70. дои : 10.1147/rd.341.0059 .
- Олер, Р.Р.; Гроувс, Р.Д. (январь 1990 г.). «Архитектура процессора IBM RISC System/6000». Журнал исследований и разработок IBM . 34 (1): 23–36. дои : 10.1147/rd.341.0023 .
- Грохоски, Г. Ф. (январь 1990 г.). «Машинная организация процессора IBM RISC System/6000». Журнал исследований и разработок IBM . 34 (1): 37–58. дои : 10.1147/rd.341.0037 .
- Бакоглу, Х.Б.; Грохоски, Г.Ф.; Монтойе, РК (январь 1990 г.). «Процессор IBM RISC System/6000: обзор оборудования». Журнал исследований и разработок IBM . 34 (1): 12–22. дои : 10.1147/rd.341.0012 .
Дальнейшее чтение
[ редактировать ]- Вайс, Шломо; Смит, Джеймс Эдвард (1994). МОЩНОСТЬ и PowerPC . Морган Кауфманн. ISBN 1558602798 . — Соответствующие части: Глава 3 (как должна быть реализована архитектура POWER), Главы 4 и 5 (описывает POWER1).