Jump to content

Вычислительная оперативная память

(Перенаправлено с «Процессор в памяти »)

Вычислительная оперативная память ( C-RAM ) — это оперативная память с вычислительными элементами, интегрированными на одном кристалле. Это позволяет использовать C-RAM в качестве SIMD- компьютера. Его также можно использовать для более эффективного использования пропускной способности памяти внутри чипа памяти. Общий метод выполнения вычислений в памяти называется «Обработка в памяти» (PIM).

Наиболее влиятельные реализации вычислительной оперативной памяти пришли из проекта Berkeley IRAM . Vector IRAM (V-IRAM) сочетает в себе DRAM и векторный процессор, встроенный в один чип. [1]

DRAM с реконфигурируемой архитектурой (RADram) — это DRAM с реконфигурируемыми вычислительными логическими элементами FPGA, интегрированными на одном кристалле. [2] Моделирование SimpleScalar показывает, что RADram (в системе с обычным процессором) может обеспечить на несколько порядков лучшую производительность при решении некоторых задач, чем традиционная DRAM (в системе с тем же процессором).

Некоторые досадно параллельные вычислительные задачи уже ограничены узким местом фон Неймана между ЦП и DRAM. Некоторые исследователи ожидают, что при той же общей стоимости машина, построенная на базе вычислительной оперативной памяти, будет работать на порядки быстрее, чем традиционный компьютер общего назначения при решении подобных задач. [3]

По состоянию на 2011 год «процесс DRAM» (несколько слоев; оптимизирован для высокой емкости) и «процесс ЦП» (оптимизирован для высокой частоты; обычно в два раза больше слоев BEOL , чем DRAM; поскольку каждый дополнительный слой снижает производительность и увеличивает производственные затраты, такие чипы относительно дороги на квадратный миллиметр по сравнению с DRAM) настолько различны, что существует три подхода к вычислительной оперативной памяти:

  • начиная с процесса, оптимизированного для ЦП, и устройства, которое использует много встроенной SRAM, добавьте дополнительный этап процесса (что делает его еще более дорогим на квадратный миллиметр), чтобы позволить заменить встроенную SRAM на встроенную DRAM ( eDRAM ), что дает ≈3-кратную экономию площади на области SRAM (и, таким образом, снижение чистой стоимости чипа).
  • начиная с системы с отдельной микросхемой ЦП и микросхемами DRAM, добавляйте небольшие объемы вычислительных возможностей «сопроцессора» к DRAM, работая в пределах процесса DRAM и добавляя лишь небольшие объемы области к DRAM, чтобы сделать вещи, которые в противном случае были бы замедлены из-за узкого узкого места между ЦП и DRAM: заполнение нулями выбранных областей памяти, копирование больших блоков данных из одного места в другое, поиск места (если где-либо) данного байта в некотором блоке данных. и т. д. Полученная система — неизмененный чип ЦП и чип(ы) «умной DRAM» — будет, по крайней мере, такой же быстрой, как и исходная система, и потенциально немного дешевле. Ожидается, что стоимость небольшого объема дополнительной области с лихвой окупится за счет экономии дорогостоящего времени тестирования, поскольку теперь имеется достаточно вычислительных возможностей «умной DRAM» для пластины, полной DRAM, для выполнения большей части внутреннего тестирования параллельно. , а не традиционный подход полного тестирования одного чипа DRAM за раз с помощью дорогого внешнего автоматическое испытательное оборудование . [1]
  • начиная с процесса, оптимизированного для DRAM, настройте его, чтобы сделать его немного более похожим на «процесс ЦП», и создайте (относительно низкочастотный, но с низким энергопотреблением и очень высокой пропускной способностью) ЦП общего назначения в пределах этого процесс.

Некоторые процессоры, созданные на основе технологии DRAM (а не технологии «ЦП» или «логической» технологии, специально оптимизированной для ЦП), включают в себя: Проект IRAM в Беркли , TOMI Technology [4] [5] и AT&T DSP1 .

Поскольку емкость шины памяти, ведущей к внешней памяти, во много раз превышает емкость шины памяти на кристалле, система с отдельными микросхемами DRAM и ЦП может потреблять в несколько раз больше энергии, чем система IRAM при той же производительности компьютера . [1]

Поскольку ожидается, что вычислительная DRAM будет работать сильнее, чем традиционная DRAM, а повышенная температура чипа приводит к более быстрой утечке заряда из ячеек памяти DRAM, Ожидается, что вычислительная DRAM потребует более частого обновления DRAM . [2]

Процессор в/около памяти

[ редактировать ]

Процессор в/около памяти (PINM) относится к компьютерному процессору (ЦП), тесно связанному с памятью , обычно на одном и том же кремниевом чипе .

Основная цель такого объединения компонентов обработки и памяти — уменьшить задержку памяти и увеличить пропускную способность . В качестве альтернативы уменьшение расстояния, на которое необходимо переместить данные, снижает требования к питанию системы. [6] Большая часть сложности (и, следовательно, энергопотребления ) современных процессоров связана со стратегиями предотвращения зависаний памяти.

В 1980-х годах крошечный процессор, выполнявший FORTH, был преобразован в чип DRAM для улучшения PUSH и POP. FORTH — это стек-ориентированный язык программирования , и это повысило его эффективность.

Транспьютер также имел большой объем встроенной памяти , учитывая, что он был создан в начале 1980-х годов, что делало его по сути процессором в памяти.

Известные проекты PIM включают проект Berkeley IRAM (IRAM) в Калифорнийском университете в Беркли. [7] проект и Университет Нотр-Дам PIM [8] усилие.

Таксономия PIM на основе DRAM

[ редактировать ]

Конструкции с ближней и внутренней памятью на основе DRAM можно разделить на четыре группы:

  • Подходы на уровне DIMM размещают процессорные блоки рядом с микросхемами памяти. Эти подходы требуют минимальных изменений или отсутствия изменений в структуре данных (например, Chameleon, [9] и РекНМП [10] ).
  • Подходы на уровне логического уровня включают процессоры в логический уровень памяти трехмерного стека и могут извлечь выгоду из высокой пропускной способности памяти трехмерного стека (например, TOP_PIM [11] )
  • Подходы на уровне банков размещают процессоры внутри слоев памяти, рядом с каждым банком. UPMEM и PIM от Samsung [12] примеры таких подходов
  • Подходы на уровне подмассива обрабатывают данные внутри каждого подмассива. Подходы на уровне подмассива обеспечивают наивысший параллелизм доступа, но часто выполняют только простые операции, такие как побитовые операции со всей строкой памяти (например, DRISA [13] ) или последовательная обработка строки памяти с использованием единого АЛУ (например, Fulcrum [14] )

См. также

[ редактировать ]
  1. ^ Jump up to: а б с Христофорос Э. Козиракис, Стилианос Периссакис, Дэвид Паттерсон, Томас Андерсон и др. «Масштабируемые процессоры в эпоху миллиардов транзисторов: IRAM» . IEEE Computer (журнал) . 1997. говорит "Вектор ИРАМ... может работать как параллельный встроенный механизм самотестирования для массив памяти, значительно уменьшая DRAM время тестирования и связанные с этим затраты».
  2. ^ Jump up to: а б Марк Оскин, Фредерик Т. Чонг и Тимоти Шервуд. «Активные страницы: вычислительная модель для интеллектуальной памяти». Архивировано 22 сентября 2017 г. на Wayback Machine . 1998.
  3. ^ Дэниел Дж. Бернштейн . «Исторические заметки о ячеистой маршрутизации в NFS» . 2002. «программирование вычислительной оперативной памяти»
  4. ^ "TOMI - милливаттный микропроцессор" [ постоянная мертвая ссылка ]
  5. ^ Ён-Бин Ким и Том В. Чен. «Оценка объединенной технологии DRAM/логики». 1998. «Архивная копия» (PDF) . Архивировано из оригинала (PDF) 25 июля 2011 г. Проверено 27 ноября 2011 г. {{cite web}}: CS1 maint: архивная копия в заголовке ( ссылка ) [1]
  6. ^ «GYRFALCON НАЧИНАЕТ ПОСТАВКУ ИИ-ЧИПА» . лаборатория электроники . 10.10.2018 . Проверено 5 декабря 2018 г.
  7. ^ ИРАМ
  8. ^ «ПИМ» . Архивировано из оригинала 09.11.2015 . Проверено 26 мая 2015 г.
  9. ^ Хади Асгари-Могаддам и др., «Хамелеон: универсальная и практичная архитектура ускорения, близкая к DRAM, для больших систем памяти».
  10. ^ Лю Кэ и др., «RecNMP: ускорение персонализированных рекомендаций с помощью обработки в памяти».
  11. ^ Дунпин, Чжан и др., «TOP-PIM: программируемая обработка в памяти, ориентированная на пропускную способность».
  12. ^ Сухан Ли и др., «Аппаратная архитектура и стек программного обеспечения для PIM на основе коммерческой технологии DRAM: промышленный продукт».
  13. ^ Шуангчен Ли и др., «DRISA: реконфигурируемый ускоритель на месте на базе драма».
  14. ^ Марзи Ленжани и др., «Опора: упрощенный механизм контроля и доступа». к гибким и практичным ускорителям на месте».

Библиография

[ редактировать ]
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 3fea7c0c6d041a6641a4a6c577101170__1722361140
URL1:https://arc.ask3.ru/arc/aa/3f/70/3fea7c0c6d041a6641a4a6c577101170.html
Заголовок, (Title) документа по адресу, URL1:
Computational RAM - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)