~~~~~~~~~~~~~~~~~~~~ Arc.Ask3.Ru ~~~~~~~~~~~~~~~~~~~~~ 
Номер скриншота №:
✰ E86B360ECAA0B8089B97FF86945E848B__1712156040 ✰
Заголовок документа оригинал.:
✰ Analysis of parallel algorithms - Wikipedia ✰
Заголовок документа перевод.:
✰ Анализ параллельных алгоритмов — Википедия ✰
Снимок документа находящегося по адресу (URL):
✰ https://en.wikipedia.org/wiki/Analysis_of_parallel_algorithms ✰
Адрес хранения снимка оригинал (URL):
✰ https://arc.ask3.ru/arc/aa/e8/8b/e86b360ecaa0b8089b97ff86945e848b.html ✰
Адрес хранения снимка перевод (URL):
✰ https://arc.ask3.ru/arc/aa/e8/8b/e86b360ecaa0b8089b97ff86945e848b__translat.html ✰
Дата и время сохранения документа:
✰ 21.06.2024 18:41:07 (GMT+3, MSK) ✰
Дата и время изменения документа (по данным источника):
✰ 3 April 2024, at 17:54 (UTC). ✰ 

~~~~~~~~~~~~~~~~~~~~~~ Ask3.Ru ~~~~~~~~~~~~~~~~~~~~~~ 
Сервисы Ask3.ru: 
 Архив документов (Снимки документов, в формате HTML, PDF, PNG - подписанные ЭЦП, доказывающие существование документа в момент подписи. Перевод сохраненных документов на русский язык.)https://arc.ask3.ruОтветы на вопросы (Сервис ответов на вопросы, в основном, научной направленности)https://ask3.ru/answer2questionТоварный сопоставитель (Сервис сравнения и выбора товаров) ✰✰
✰ https://ask3.ru/product2collationПартнерыhttps://comrades.ask3.ru


Совет. Чтобы искать на странице, нажмите Ctrl+F или ⌘-F (для MacOS) и введите запрос в поле поиска.
Arc.Ask3.ru: далее начало оригинального документа

Анализ параллельных алгоритмов — Википедия Jump to content

Анализ параллельных алгоритмов

Из Википедии, бесплатной энциклопедии

В информатике анализ параллельных алгоритмов — это процесс определения вычислительной сложности алгоритмов, выполняемых параллельно, — количества времени, памяти или других ресурсов, необходимых для их выполнения. Во многих отношениях анализ параллельных алгоритмов аналогичен анализу последовательных алгоритмов , но, как правило, он более сложен, поскольку необходимо учитывать поведение нескольких взаимодействующих потоков выполнения. Одна из основных целей параллельного анализа — понять, как меняется использование ресурсов параллельным алгоритмом (скорость, пространство и т. д.) при изменении количества процессоров.

Предыстория [ править ]

Так называемая структура рабочего времени (WT) (иногда называемая глубиной работы или продолжительностью работы) была первоначально представлена ​​Шилоахом и Вишкиным. [1] для концептуализации и описания параллельных алгоритмов. В рамках WT параллельный алгоритм сначала описывается в терминах параллельных раундов. Для каждого раунда описываются операции, которые необходимо выполнить, но некоторые проблемы можно скрыть. Например, не обязательно указывать количество операций в каждом раунде, не нужно упоминать процессоры и не нужно учитывать любую информацию, которая может помочь при назначении процессоров для заданий. Во-вторых, предоставляется скрытая информация. Включение скрытой информации основано на доказательстве теоремы планирования Брента: [2] что объясняется далее в этой статье. Структура WT полезна, поскольку, хотя она может значительно упростить первоначальное описание параллельного алгоритма, вставка деталей, скрытых в этом первоначальном описании, часто не очень сложна. Например, структура WT была принята в качестве базовой структуры представления в книгах по параллельным алгоритмам (для модели PRAM параллельной машины с произвольным доступом ). [3] и, [4] а также в конспектах занятий . [5] В приведенном ниже обзоре объясняется, как структуру WT можно использовать для анализа более общих параллельных алгоритмов, даже если их описание недоступно в структуре WT.

Определения [ править ]

Предположим, вычисления выполняются на машине с p процессорами. Обозначим Tp через время, которое истекает между началом вычисления и его окончанием. вычислений Анализ времени выполнения фокусируется на следующих понятиях:

  • Работа процессорами , вычисления, выполняемая p равна общему числу примитивных операций, выполняемых процессорами. [6] Если не учитывать издержки связи, возникающие при синхронизации процессоров, это время равно времени, используемому для выполнения вычислений на одном процессоре, обозначенному T 1 .
  • Глубина зависимостей или диапазон — это длина самой длинной серии операций, которые необходимо выполнять последовательно из-за данных ( критический путь ). Глубину также можно назвать длиной критического пути вычислений. [7] Минимизация глубины/диапазона важна при разработке параллельных алгоритмов, поскольку глубина/диапазон определяет кратчайшее возможное время выполнения. [8] Альтернативно, интервал можно определить как время T ∞, потраченное на вычисления на идеализированной машине с бесконечным числом процессоров. [9]
  • Стоимость величине вычислений равна pT p . Это выражает общее время, затраченное всеми процессорами как на вычисления, так и на ожидание. [6]

Из определений работы, продолжительности и стоимости следует несколько полезных результатов:

  • Закон о труде . Стоимость всегда равна как минимум работе: pT p T 1 . Это следует из того, что p процессоров могут выполнять не более p операций параллельно. [6] [9]
  • Спанское право . Конечное число p процессоров не может превзойти бесконечное число, так что T p T . [9]

Используя эти определения и законы, можно определить следующие показатели эффективности:

  • Ускорение — это прирост скорости при параллельном выполнении по сравнению с последовательным выполнением Sp : = T 1 / T p . Когда ускорение равно Ω( p ) для p процессоров (с использованием обозначения большого O ), ускорение является линейным, что является оптимальным в простых моделях вычислений, поскольку закон работы подразумевает, что T 1 / T p p ( суперлинейное ускорение может происходят на практике из-за эффектов иерархии памяти ). Ситуация T 1 / T p = p называется идеальным линейным ускорением. [9] Алгоритм, демонстрирующий линейное ускорение, называется масштабируемым . [6]
  • Эффективность — это ускорение каждого процессора, S p / p . [6]
  • Параллельностью называется отношение T 1 / T . Он представляет собой максимально возможное ускорение на любом количестве процессоров. По закону размаха параллелизм ограничивает ускорение: если p > T 1 / T , то: [9]
  • Расслабленность равна T ( 1 / pT ) . Медленность меньше единицы означает (по закону диапазона), что идеальное линейное ускорение невозможно на p процессорах. [9]

Выполнение на ограниченном количестве процессоров [ править ]

Анализ параллельных алгоритмов обычно проводится в предположении, что имеется неограниченное количество процессоров. Это нереально, но не проблема, поскольку любые вычисления, которые могут выполняться параллельно на N процессорах, могут выполняться на p < N процессорах, позволяя каждому процессору выполнять несколько единиц работы. Результат, называемый законом Брента, гласит, что такое «моделирование» можно выполнить за время T p , ограниченное [10]

или, менее точно, [6]

Альтернативная формулировка закона ограничивает T p сверху и снизу величиной

.

показывая, что диапазон (глубина) T и работа T 1 вместе обеспечивают разумные ограничения на время вычислений. [2]

Ссылки [ править ]

  1. ^ Шилоах, Йоси; Вишкин, Узи (1982). «Ан О ( н 2 log n ) параллельный алгоритм максимального потока». Журнал алгоритмов . 3 (2): 128–146. doi : 10.1016/0196-6774(82)90013-X .
  2. ^ Перейти обратно: а б Брент, Ричард П. (1 апреля 1974 г.). «Параллельное вычисление общих арифметических выражений». Журнал АКМ . 21 (2): 201–206. CiteSeerX   10.1.1.100.9361 . дои : 10.1145/321812.321815 . ISSN   0004-5411 . S2CID   16416106 .
  3. ^ ДжаДжа, Джозеф (1992). Введение в параллельные алгоритмы . Аддисон-Уэсли. ISBN  978-0-201-54856-3 .
  4. ^ Келлер, Йорг; Кесслер, Кристоф В.; Траефф, Джеспер Л. (2001). Практическое программирование PRAM . Уайли-Интерсайенс. ISBN  978-0-471-35351-5 .
  5. ^ Вишкин, Узи (2009). Параллельное мышление: некоторые базовые алгоритмы и методы параллельного анализа данных, 104 страницы (PDF) . Конспекты курсов по параллельным алгоритмам, преподаваемых с 1992 года в Университете Мэриленда, Колледж-Парке, Тель-Авивском университете и Технионе.
  6. ^ Перейти обратно: а б с д Это ж Казанова, Анри; Легран, Арно; Роберт, Ив (2008). Параллельные алгоритмы . ЦРК Пресс. п. 10. CiteSeerX   10.1.1.466.8142 .
  7. ^ Беллох, Гай (1996). «Программирование параллельных алгоритмов» (PDF) . Коммуникации АКМ . 39 (3): 85–97. CiteSeerX   10.1.1.141.5884 . дои : 10.1145/227234.227246 . S2CID   12118850 .
  8. ^ Майкл МакКул; Джеймс Рейндерс; Арч Робисон (2013). Структурированное параллельное программирование: шаблоны для эффективных вычислений . Эльзевир. стр. 4–5.
  9. ^ Перейти обратно: а б с д Это ж Кормен, Томас Х .; Лейзерсон, Чарльз Э .; Ривест, Рональд Л .; Штейн, Клиффорд (2009) [1990]. Введение в алгоритмы (3-е изд.). MIT Press и McGraw-Hill. стр. 779–784. ISBN  0-262-03384-4 .
  10. ^ Густафсон, Джон Л. (2011). «Теорема Брента». Энциклопедия параллельных вычислений . стр. 182–185. дои : 10.1007/978-0-387-09766-4_80 . ISBN  978-0-387-09765-7 .
Arc.Ask3.Ru: конец оригинального документа.
Arc.Ask3.Ru
Номер скриншота №: E86B360ECAA0B8089B97FF86945E848B__1712156040
URL1:https://en.wikipedia.org/wiki/Analysis_of_parallel_algorithms
Заголовок, (Title) документа по адресу, URL1:
Analysis of parallel algorithms - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть, любые претензии не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, денежную единицу можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)