~~~~~~~~~~~~~~~~~~~~ Arc.Ask3.Ru ~~~~~~~~~~~~~~~~~~~~~ 
Номер скриншота №:
✰ D6465C6C6D8B794247AE333ADDF3D6E6__1710186780 ✰
Заголовок документа оригинал.:
✰ Simultaneous and heterogeneous multithreading - Wikipedia ✰
Заголовок документа перевод.:
✰ Одновременная и гетерогенная многопоточность — Википедия ✰
Снимок документа находящегося по адресу (URL):
✰ https://en.wikipedia.org/wiki/Simultaneous_and_heterogeneous_multithreading ✰
Адрес хранения снимка оригинал (URL):
✰ https://arc.ask3.ru/arc/aa/d6/e6/d6465c6c6d8b794247ae333addf3d6e6.html ✰
Адрес хранения снимка перевод (URL):
✰ https://arc.ask3.ru/arc/aa/d6/e6/d6465c6c6d8b794247ae333addf3d6e6__translat.html ✰
Дата и время сохранения документа:
✰ 20.06.2024 18:27:34 (GMT+3, MSK) ✰
Дата и время изменения документа (по данным источника):
✰ 11 March 2024, at 22:53 (UTC). ✰ 

~~~~~~~~~~~~~~~~~~~~~~ Ask3.Ru ~~~~~~~~~~~~~~~~~~~~~~ 
Сервисы Ask3.ru: 
 Архив документов (Снимки документов, в формате HTML, PDF, PNG - подписанные ЭЦП, доказывающие существование документа в момент подписи. Перевод сохраненных документов на русский язык.)https://arc.ask3.ruОтветы на вопросы (Сервис ответов на вопросы, в основном, научной направленности)https://ask3.ru/answer2questionТоварный сопоставитель (Сервис сравнения и выбора товаров) ✰✰
✰ https://ask3.ru/product2collationПартнерыhttps://comrades.ask3.ru


Совет. Чтобы искать на странице, нажмите Ctrl+F или ⌘-F (для MacOS) и введите запрос в поле поиска.
Arc.Ask3.ru: далее начало оригинального документа

Одновременная и гетерогенная многопоточность — Википедия Jump to content

Одновременная и гетерогенная многопоточность

Из Википедии, бесплатной энциклопедии

Одновременная и гетерогенная многопоточность ( SHMT ) — это программная среда , которая использует преимущества гетерогенных вычислительных систем, содержащих смесь центральных процессоров (ЦП), графических процессоров (ГП) и специального оборудования для машинного обучения , например, тензорных процессоров ( ТПУ). [1] [2]

Каждый компонент обрабатывает информацию по-своему. Часто данным приходится перемещаться между процессорами, что может создавать узкие места, когда один процессор не работает, ожидая завершения работы другого. [1]

Архитектура [ править ]

Система определяет виртуальные процессоры и виртуальные операции (VOP). VOP разбиваются на одну или несколько операций высокого уровня (HLOP). Затем он распределяет операции между процессорами. Затем система выполнения динамически сопоставляет виртуальные процессоры с физическими процессорами, оценивая доступность ресурсов, чтобы все процессоры были заняты. Планировщик использует упрощенную политику кражи работы с учетом качества (QAWS). [1]

Обычные среды выполнения назначают один процессор (набор) для каждой подзадачи, оставляя другие типы процессоров простаивающими. Другими словами, процессор(ы) работают (возможно, параллельно), а затем, когда эта подзадача завершается, следующая подзадача передается на графический процессор(ы). Когда они завершат следующую подзадачу, она передается ТПУ. [2]

Добавление программной конвейерной обработки позволяет запускать вторую подзадачу с использованием частичных результатов первой подзадачи, что улучшает использование ресурсов. [2]

SHMT делает еще один шаг вперед, определяя подзадачи, которые могут выполняться независимо от других на соответствующем типе процессора, что обеспечивает еще лучший параллелизм. Некоторые подзадачи могут выполняться на процессорах нескольких типов. SHMT может разделить одну подзадачу на такие типы процессоров. Таким образом, фундаментальный прорыв заключается в том, чтобы обеспечить одновременную работу большего количества процессоров, сокращая затраты времени и энергии. [2]

Тест [ править ]

Исследователи протестировали эту концепцию, используя типичную конфигурацию смартфона, измененную так, чтобы она напоминала сервер центра обработки данных. [1]

Аппаратное обеспечение представляло собой модуль Jetson Nano от Nvidia, содержащий четырехъядерный процессор ARM Cortex-A57 (ЦП) и 128 ядер графического процессора архитектуры Maxwell . Google Edge TPU был подключен через слот M.2 Key E. Процессоры обменивались данными через встроенный интерфейс PCI Express (PCIe). Общие данные размещались на 64-битном диске LPDDR4 объемом 4 ГБ . Edge TPU добавляет 8 МБ памяти устройства. Ubuntu Linux 18.04. Операционной системой была [1]

По сравнению с обычной системой производительность увеличилась в 1,95 раза, а энергопотребление снизилось на 51 % по ряду тестов, включая Блэка–Шоулза , DCT8X8, DWT, FFT , гистограмму, горячую точку, лапласиан , MF, Sobel, SRAD, и ГМЕАН. [1]

См. также [ править ]

Ссылки [ править ]

  1. ^ Перейти обратно: а б с д Это ж МакКлюр, Пол (22 февраля 2024 г.). «Настройка программного обеспечения удваивает скорость обработки компьютера и вдвое снижает энергопотребление» . Новый Атлас . Проверено 25 февраля 2024 г.
  2. ^ Перейти обратно: а б с д Сюй, Куан-Чье; Ценг, Хун-Вэй (08 декабря 2023 г.). «Одновременная и гетерогенная многопоточность» . Материалы 56-го ежегодного международного симпозиума IEEE/ACM по микроархитектуре . МИКРО '23. Нью-Йорк, штат Нью-Йорк, США: Ассоциация вычислительной техники: 137–152. дои : 10.1145/3613424.3614285 . ISBN  979-8-4007-0329-4 .
Arc.Ask3.Ru: конец оригинального документа.
Arc.Ask3.Ru
Номер скриншота №: D6465C6C6D8B794247AE333ADDF3D6E6__1710186780
URL1:https://en.wikipedia.org/wiki/Simultaneous_and_heterogeneous_multithreading
Заголовок, (Title) документа по адресу, URL1:
Simultaneous and heterogeneous multithreading - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть, любые претензии не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, денежную единицу можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)