Тест HPC Challenge

Тест HPC Challenge
Оригинальный автор(ы)	Инновационная вычислительная лаборатория Университета Теннесси
Первоначальный выпуск	2003
Стабильная версия	1.5.0 / 18 марта 2016 г .; 8 лет назад
Платформа	Кросс-платформенный
Лицензия	БСД
Веб-сайт	ICL .cs .для .edu /hpcc /

HPC Challenge Benchmark объединяет несколько тестов для проверки ряда независимых показателей производительности высокопроизводительных компьютерных (HPC) систем. Спонсорами проекта выступили программа DARPA High Productivity Computing Systems , Министерство энергетики США и Национальный научный фонд . ^[2]

Контекст

Производительность сложных приложений в системах HPC может зависеть от множества независимых характеристик производительности оборудования. HPC Challenge Benchmark — это попытка улучшить прозрачность этого многомерного пространства путем объединения измерений нескольких из этих атрибутов в единую программу.

Хотя интересующие характеристики производительности не являются специфичными для какой-либо конкретной компьютерной архитектуры, эталонная реализация HPC Challenge Benchmark на C и MPI предполагает, что тестируемая система представляет собой кластер многопроцессорных систем с общей памятью, соединенных сетью . Из-за этого предположения об иерархической структуре системы большинство тестов выполняются в нескольких различных режимах работы. В соответствии с обозначениями, используемыми в отчетах о тестировании, результаты, помеченные как «одиночные», означают, что тест был запущен на одном случайно выбранном процессоре в системе, а результаты, помеченные «звездочкой», означают, что независимая копия теста была запущена одновременно на каждом процессоре в системе. системы, а результаты, помеченные как «глобальные», означают, что все процессоры работали согласованно для решения одной проблемы (с данными, распределенными по узлам системы).

Компоненты

Бенчмарк на данный момент состоит из 7 тестов (для каждого указаны режимы работы):

HPL ^[3] (High Performance LINPACK ) – измеряет производительность решателя плотной системы линейных уравнений (глобально).
DGEMM – измеряет производительность умножения матрицы на матрицу (одинарная, звезда).
ТРАНСЛИРОВАТЬ ^[4] – измеряет устойчивую пропускную способность памяти в/из памяти (одинарная, звезда).
PTRANS – измеряет скорость, с которой система может транспонировать большой массив (глобальный).
RandomAccess – измеряет скорость 64-битных обновлений случайно выбранных элементов большой таблицы (одиночной, звездообразной, глобальной).
БПФ – выполняет быстрое преобразование Фурье для большого одномерного вектора, используя обобщенный алгоритм Кули – Тьюки (одиночный, звездчатый, глобальный).
Пропускная способность и задержка связи — измерения производительности, ориентированные на MPI, на основе b_eff. ^[5] тест полосы пропускания/задержки.

Атрибуты производительности

На высоком уровне тесты призваны обеспечить охват четырех важных атрибутов производительности: арифметики двойной точности с плавающей запятой (DGEMM и HPL), пропускной способности локальной памяти (STREAM), пропускной способности сети для «больших» сообщений (PTRANS, RandomAccess). , FFT, b_eff) и пропускную способность сети для «маленьких» сообщений (RandomAccess, b_eff). Некоторые коды более сложны, чем другие, и могут иметь дополнительную чувствительность к производительности. Например, в некоторых системах производительность HPL может быть ограничена пропускной способностью сети и/или задержкой сети.

Соревнование

Ежегодный конкурс HPC Challenge на конференции по суперкомпьютингу фокусируется на четырех наиболее сложных тестах пакета:

Глобальный HPL
Глобальный произвольный доступ (или тест произвольного доступа BSS )
EP STREAM (Триада) на систему
Глобальное БПФ

Существует две степени наград:

Класс 1 : Лучшая производительность при базовом или оптимизированном запуске, представленном на веб-сайте HPC Challenge. ^[6]
Класс 2 : Наиболее «элегантная» реализация четырех или пяти вычислительных ядер, включая три или более тестов HPC Challenge. ^[7]

См. также

Местоположение ссылки

Ссылки

^ «Релизы · icl-utk-edu/hpcc» . github.com . Проверено 12 апреля 2021 г.
^ «Суперкомпьютер Cray X1 показал самые высокие результаты в спонсируемых государством тестах HPC Challenge» . 14 июня 2004 г. Архивировано из оригинала 30 марта 2009 г. Проверено 22 января 2010 г.
^ «HPL — портативная реализация высокопроизводительного теста Linpack для компьютеров с распределенной памятью» . Инновационная вычислительная лаборатория Университета Теннесси в Ноксвилле . Проверено 10 июня 2015 г.
^ «STREAM: Устойчивая пропускная способность памяти в высокопроизводительных компьютерах» . Проверено 10 июня 2015 г.
^ «Эффективная пропускная способность (b_eff)» . Центр высокопроизводительных вычислений Штутгарт . Проверено 10 июня 2015 г.
^ Тест предназначен для замены ограниченного набора функций более оптимизированными версиями, оставаясь при этом «базовым» запуском. Дополнительные (но все же ограниченные) модификации разрешены в категории «оптимизированных» запусков.
^ «Конкурс на премию HPC Challenge» . Программа DARPA HPCS . Проверено 23 января 2010 г.

Внешние ссылки

Официальный сайт HPC Challenge Benchmark
Официальный сайт конкурса HPC Challenge Award
Оценка производительности произвольного доступа BSS и оптимизация произвольного доступа к памяти на многоядерных процессорах с высокой производительностью (награда за лучшую статью) на выставке ACM/IEEE HiPC 2010

[1] «Релизы · icl-utk-edu/hpcc» . github.com . Проверено 12 апреля 2021 г.

[2] «Суперкомпьютер Cray X1 показал самые высокие результаты в спонсируемых государством тестах HPC Challenge» . 14 июня 2004 г. Архивировано из оригинала 30 марта 2009 г. Проверено 22 января 2010 г.

[3] «HPL — портативная реализация высокопроизводительного теста Linpack для компьютеров с распределенной памятью» . Инновационная вычислительная лаборатория Университета Теннесси в Ноксвилле . Проверено 10 июня 2015 г.

[4] «STREAM: Устойчивая пропускная способность памяти в высокопроизводительных компьютерах» . Проверено 10 июня 2015 г.

[5] «Эффективная пропускная способность (b_eff)» . Центр высокопроизводительных вычислений Штутгарт . Проверено 10 июня 2015 г.

[6] Тест предназначен для замены ограниченного набора функций более оптимизированными версиями, оставаясь при этом «базовым» запуском. Дополнительные (но все же ограниченные) модификации разрешены в категории «оптимизированных» запусков.

[7] «Конкурс на премию HPC Challenge» . Программа DARPA HPCS . Проверено 23 января 2010 г.

[1]

[2]

[3]

[4]

[5]

[6]

[7]