Параллелизм задач
Эта статья включает список общих ссылок , но в ней отсутствуют достаточные соответствующие встроенные цитаты . ( Май 2011 г. ) |
Параллелизм задач (также известный как параллелизм функций и параллелизм управления ) — это форма распараллеливания компьютерного кода на нескольких процессорах в параллельных вычислительных средах. Параллелизм задач фокусируется на распределении задач , одновременно выполняемых процессами или потоками , между разными процессорами. В отличие от параллелизма данных , который предполагает выполнение одной и той же задачи над разными компонентами данных, параллелизм задач отличается одновременным выполнением множества разных задач над одними и теми же данными. [1] Распространенным типом параллелизма задач является конвейеризация , которая заключается в перемещении одного набора данных через серию отдельных задач, где каждая задача может выполняться независимо от других.
Описание
[ редактировать ]В многопроцессорной системе параллелизм задач достигается, когда каждый процессор выполняет отдельный поток (или процесс) с одинаковыми или разными данными. Потоки могут выполнять один и тот же или разный код. В общем случае разные потоки выполнения взаимодействуют друг с другом во время работы, но это не является обязательным требованием. Общение обычно происходит путем передачи данных из одного потока в другой в рамках рабочего процесса . [2]
В качестве простого примера: если система выполняет код на двухпроцессорной системе ( процессоры «a» и «b») в параллельной среде, и мы хотим выполнить задачи «A» и «B», можно сказать ЦП «a» для выполнения задачи «А» и ЦП «b» для одновременного выполнения задачи «Б», тем самым сокращая время выполнения . Задачи можно назначать с помощью условных операторов , как описано ниже.
Параллелизм задач подчеркивает распределенный (параллельный) характер обработки (т. е. потоков), в отличие от данных ( параллелизм данных ). Большинство реальных программ находятся где-то на континууме между параллелизмом задач и параллелизмом данных. [3]
Параллелизм на уровне потоков ( TLP ) — это параллелизм, присущий приложению, которое запускает несколько потоков одновременно . Этот тип параллелизма встречается в основном в приложениях, написанных для коммерческих серверов, таких как базы данных. Запуская множество потоков одновременно, эти приложения способны выдерживать большие задержки ввода-вывода и системы памяти, которые могут возникнуть при их рабочих нагрузках — пока один поток задерживается в ожидании доступа к памяти или диску, другие потоки могут выполнять полезную работу.
Использование параллелизма на уровне потоков также начало проникать на рынок настольных компьютеров с появлением многоядерных микропроцессоров. Это произошло потому, что по разным причинам становится все более непрактичным увеличивать тактовую частоту или количество команд за такт одного ядра. Если эта тенденция сохранится, новые приложения должны будут разрабатываться с учетом использования нескольких потоков, чтобы получить выгоду от увеличения потенциальной вычислительной мощности. Это контрастирует с предыдущими инновациями в области микропроцессоров, в которых существующий код автоматически ускорялся за счет его запуска на более новом/более быстром компьютере.
Пример
[ редактировать ]Псевдокод ниже иллюстрирует параллелизм задач:
program:...if CPU = "a" then do task "A"else if CPU="b" then do task "B"end if...end program
Цель программы — выполнить некоторую общую задачу («A+B»). Если мы напишем код, как указано выше, и запустим его в двухпроцессорной системе, то среда выполнения выполнит его следующим образом.
- В системе SPMD (одна программа, несколько данных) оба процессора будут выполнять код.
- В параллельной среде оба будут иметь доступ к одним и тем же данным.
- Предложение «if» различает процессоры. ЦП «a» будет читать истину в «if», а ЦП «b» будет читать истину в «иначе, если», таким образом, имея свою собственную задачу.
- Теперь оба процессора одновременно выполняют отдельные блоки кода, одновременно выполняя разные задачи.
Код, выполняемый процессором «a»:
program:...do task "A"...end program
Код, выполняемый процессором «b»:
program:...do task "B"...end program
Теперь эту концепцию можно обобщить на любое количество процессоров.
Языковая поддержка
[ редактировать ]Параллелизм задач может поддерживаться в языках общего назначения либо встроенными средствами, либо библиотеками. Яркие примеры включают:
- Ада: Задачи (встроенные)
- C++ (Intel): строительные блоки многопоточности
- C++ (Intel): Cilk Plus
- C++ (открытый исходный код/Apache 2.0): RaftLib
- C, C++, Objective-C, Swift (Apple): Grand Central Dispatch
- D: задачи и волокна
- Delphi (System.Threading.TParallel)
- Перейти: горутины
- Java: параллелизм Java
- .NET: библиотека параллельных задач
Примеры детальных языков параллельного выполнения задач можно найти в области языков описания оборудования, таких как Verilog и VHDL .
См. также
[ редактировать ]- Алгоритмический скелет
- Параллелизм данных
- Модель разветвления-объединения
- Модель параллельного программирования
Ссылки
[ редактировать ]- ^ Рейндерс, Джеймс (10 сентября 2007 г.). «Понимание параллелизма задач и данных» . ЗДНет . Проверено 8 мая 2017 г.
- ^ Куинн, Майкл Дж. (2007). Параллельное программирование на C с использованием MPI и openMP (изд. Таты МакГроу-Хилл). Нью-Дели: паб Tata McGraw-Hill. ISBN 978-0070582019 .
- ^ Хикс, Майкл. «Основы параллелизма» (PDF) . Университет Мэриленда: факультет компьютерных наук . Проверено 8 мая 2017 г.