Тест HPC Challenge
Оригинальный автор(ы) | Инновационная вычислительная лаборатория Университета Теннесси |
---|---|
Первоначальный выпуск | 2003 |
Стабильная версия | 1.5.0 / 18 марта 2016 г [1] |
Платформа | Кросс-платформенный |
Лицензия | БСД |
Веб-сайт | ICL |
HPC Challenge Benchmark объединяет несколько тестов для проверки ряда независимых показателей производительности высокопроизводительных компьютерных (HPC) систем. Спонсорами проекта выступили программа DARPA High Productivity Computing Systems , Министерство энергетики США и Национальный научный фонд . [2]
Контекст
[ редактировать ]Производительность сложных приложений в системах HPC может зависеть от множества независимых характеристик производительности оборудования. HPC Challenge Benchmark — это попытка улучшить прозрачность этого многомерного пространства путем объединения измерений нескольких из этих атрибутов в единую программу.
Хотя интересующие характеристики производительности не являются специфичными для какой-либо конкретной компьютерной архитектуры, эталонная реализация HPC Challenge Benchmark на C и MPI предполагает, что тестируемая система представляет собой кластер многопроцессорных систем с общей памятью, соединенных сетью . Из-за этого предположения об иерархической структуре системы большинство тестов выполняются в нескольких различных режимах работы. В соответствии с обозначениями, используемыми в отчетах о тестировании, результаты, помеченные как «одиночные», означают, что тест был запущен на одном случайно выбранном процессоре в системе, а результаты, помеченные «звездочкой», означают, что независимая копия теста была запущена одновременно на каждом процессоре в системе. системы, а результаты, помеченные как «глобальные», означают, что все процессоры работали согласованно для решения одной проблемы (с данными, распределенными по узлам системы).
Компоненты
[ редактировать ]Бенчмарк на данный момент состоит из 7 тестов (для каждого указаны режимы работы):
- HPL [3] (High Performance LINPACK ) – измеряет производительность решателя плотной системы линейных уравнений (глобально).
- DGEMM – измеряет производительность умножения матрицы на матрицу (одинарная, звезда).
- ТРАНСЛИРОВАТЬ [4] – измеряет устойчивую пропускную способность памяти в/из памяти (одинарная, звезда).
- PTRANS – измеряет скорость, с которой система может транспонировать большой массив (глобальный).
- RandomAccess – измеряет скорость 64-битных обновлений случайно выбранных элементов большой таблицы (одиночной, звездообразной, глобальной).
- БПФ – выполняет быстрое преобразование Фурье для большого одномерного вектора, используя обобщенный алгоритм Кули – Тьюки (одиночный, звездчатый, глобальный).
- Пропускная способность и задержка связи — измерения производительности, ориентированные на MPI, на основе b_eff. [5] тест полосы пропускания/задержки.
Атрибуты производительности
[ редактировать ]На высоком уровне тесты призваны обеспечить охват четырех важных атрибутов производительности: арифметики двойной точности с плавающей запятой (DGEMM и HPL), пропускной способности локальной памяти (STREAM), пропускной способности сети для «больших» сообщений (PTRANS, RandomAccess). , FFT, b_eff) и пропускную способность сети для «маленьких» сообщений (RandomAccess, b_eff). Некоторые коды более сложны, чем другие, и могут иметь дополнительную чувствительность к производительности. Например, в некоторых системах производительность HPL может быть ограничена пропускной способностью сети и/или задержкой сети.
Соревнование
[ редактировать ]Ежегодный конкурс HPC Challenge на конференции по суперкомпьютингу фокусируется на четырех наиболее сложных тестах пакета:
- Глобальный HPL
- Глобальный произвольный доступ (или тест произвольного доступа BSS )
- EP STREAM (Триада) на систему
- Глобальное БПФ
Существует две степени наград:
- Класс 1 : Лучшая производительность при базовом или оптимизированном запуске, представленном на веб-сайте HPC Challenge. [6]
- Класс 2 : Наиболее «элегантная» реализация четырех или пяти вычислительных ядер, включая три или более тестов HPC Challenge. [7]
См. также
[ редактировать ]Ссылки
[ редактировать ]- ^ «Релизы · icl-utk-edu/hpcc» . github.com . Проверено 12 апреля 2021 г.
- ^ «Суперкомпьютер Cray X1 показал самые высокие результаты в спонсируемых государством тестах HPC Challenge» . 14 июня 2004 г. Архивировано из оригинала 30 марта 2009 г. Проверено 22 января 2010 г.
- ^ «HPL — портативная реализация высокопроизводительного теста Linpack для компьютеров с распределенной памятью» . Инновационная вычислительная лаборатория Университета Теннесси в Ноксвилле . Проверено 10 июня 2015 г.
- ^ «STREAM: Устойчивая пропускная способность памяти в высокопроизводительных компьютерах» . Проверено 10 июня 2015 г.
- ^ «Эффективная пропускная способность (b_eff)» . Центр высокопроизводительных вычислений Штутгарт . Проверено 10 июня 2015 г.
- ^ Тест предназначен для замены ограниченного набора функций более оптимизированными версиями, оставаясь при этом «базовым» запуском. Дополнительные (но все же ограниченные) модификации разрешены в категории «оптимизированных» запусков.
- ^ «Конкурс на премию HPC Challenge» . Программа DARPA HPCS . Проверено 23 января 2010 г.
Внешние ссылки
[ редактировать ]- Официальный сайт HPC Challenge Benchmark
- Официальный сайт конкурса HPC Challenge Award
- Оценка производительности произвольного доступа BSS и оптимизация произвольного доступа к памяти на многоядерных процессорах с высокой производительностью (награда за лучшую статью) на выставке ACM/IEEE HiPC 2010