Параллельные тесты NAS
Оригинальный автор(ы) | Программа численного аэродинамического моделирования НАСА |
---|---|
Разработчик(и) | Отдел передовых суперкомпьютеров НАСА |
Первоначальный выпуск | 1991 |
Стабильная версия | 3.4
|
Веб-сайт | в |
NAS Parallel Benchmarks ( NPB ) представляет собой набор тестов, предназначенных для оценки производительности с высокой степенью параллелизма суперкомпьютеров . Они разрабатываются и поддерживаются Отделом передовых суперкомпьютеров НАСА (NAS) (ранее Программа численного аэродинамического моделирования НАСА), базирующимся в Исследовательском центре НАСА Эймса . NAS запрашивает результаты деятельности NPB из всех источников. [1]
История
[ редактировать ]Мотивация
[ редактировать ]Традиционные тесты, существовавшие до NPB, такие как Ливерморские циклы , LINPACK Benchmark и NAS Kernel Benchmark Program , обычно были специализированы для векторных компьютеров. Они, как правило, страдали от недостатков, в том числе от ограничений настройки, препятствующих параллелизму, и недостаточного размера задач, что делало их непригодными для систем с высокой степенью параллелизма. В равной степени неприемлемыми оказались полномасштабные тесты приложений из-за высокой стоимости портирования и отсутствия инструментов автоматического распараллеливания программного обеспечения. [2] В результате в 1991 году были разработаны НПБ. [3] и выпущен в 1992 году [4] чтобы решить возникшую проблему отсутствия тестов, применимых к машинам с высокой степенью параллелизма.
НПБ 1
[ редактировать ]Первая спецификация NPB признавала, что тесты должны включать
- новые алгоритмические и программные методы, поддерживающие параллелизм,
- универсальность и нейтральность архитектуры,
- легкая проверка правильности результатов и показателей производительности,
- возможность размещения новых систем повышенной мощности,
- и готовая к распространению.
В свете этих рекомендаций считалось, что единственным жизнеспособным подходом является использование набора тестов «на бумаге и карандаше», которые определяют набор проблем только алгоритмически и оставляют большинство деталей реализации на усмотрение разработчика при определенных необходимых ограничениях.
NPB 1 определил восемь тестов, каждый из которых относится к двум размерам задач, получившим название «Класс A» и «Класс B» . примеры кода, написанные на Фортране 77 Были предоставлены . Они использовали задачу класса S небольшого размера и не предназначались для целей сравнительного анализа. [2]
НПБ 2
[ редактировать ]С момента своего выпуска NPB 1 обнаружил два основных недостатка. Во-первых, из-за его «бумажной» спецификации поставщики компьютеров обычно тщательно настраивали свои реализации, так что их производительность становилась труднодоступной для научных программистов. Во-вторых, многие из этих реализаций были проприетарными и не были общедоступными, что эффективно скрывало методы оптимизации. Во-вторых, размеры задач NPB 1 отставали от развития суперкомпьютеров, поскольку последние продолжали развиваться. [3]
НПБ 2, выпущенный в 1996 году, [5] [6] поставлялся с реализациями исходного кода для пяти из восьми тестов, определенных в NPB 1, чтобы дополнить, но не заменить NPB 1. Он расширил тесты современным размером проблемы класса C. Также были внесены изменения в правила предоставления результатов бенчмаркинга. Новые правила включали явные запросы на выходные файлы, а также измененные исходные файлы и сценарии сборки, чтобы обеспечить публичную доступность изменений и воспроизводимость результатов. [3]
NPB 2.2 содержал реализации еще двух тестов. [5] NPB 2.3 1997 года была первой полной реализацией MPI . [4] Он поставлялся с последовательными версиями тестов, соответствующими параллельным версиям, и определял класс размера проблемы W для систем с небольшим объемом памяти. [7] В NPB 2.4 2002 года была предложена новая реализация MPI и введен еще один класс D , еще большего размера проблемы . [6] Он также дополнил один тест подтипами с интенсивным вводом-выводом . [4]
НПБ 3
[ редактировать ]NPB 3 сохранил реализацию MPI из NPB 2 и имел больше разновидностей, а именно OpenMP , [8] Ява [9] и высокопроизводительный Фортран . [10] Эти новые параллельные реализации были созданы на основе последовательных кодов NPB 2.3 с дополнительными оптимизациями. [7] В NPB 3.1 и NPB 3.2 добавлены еще три теста: [11] [12] которые, однако, были доступны не во всех реализациях; В NPB 3.3 введен класса E. размер проблемы [7] На основе однозонного NPB 3 был выпущен набор многозонных тестов, использующих преимущества гибридной модели программирования MPI/OpenMP под названием NPB-Multi-Zone ( NPB-MZ ) для «тестирования эффективности многоуровневого программирования». и парадигмы и инструменты гибридного распараллеливания». [1] [13]
Ориентиры
[ редактировать ]Начиная с NPB 3.3, определены одиннадцать контрольных показателей, которые обобщены в следующей таблице.
Контрольный показатель | Имя получено от [2] | Доступно с | Описание [2] | Примечания |
---|---|---|---|---|
МГ | Мультисетка | НПБ 1 [2] | Аппроксимация решения трехмерного дискретного уравнения Пуассона V-цикла . с использованием многосеточного метода | |
компьютерная графика | Конъюгат G радиент | Оцените наименьшее собственное значение большой разреженной симметричной положительно определенной матрицы, используя обратную итерацию с методом сопряженных градиентов в качестве подпрограммы для решения систем линейных уравнений. | ||
ФТ | Быстрое Фурье преобразование | Решите трехмерное уравнение в частных производных (УЧП), используя быстрое преобразование Фурье (БПФ). | ||
ЯВЛЯЕТСЯ | сортировка Целочисленная | Сортировка небольших целых чисел с помощью сортировки по кольцу [5] | ||
EP | Смущающе параллельно | Сгенерируйте независимые гауссовские случайные переменные, используя полярный метод Марсальи. | ||
БТ | Блокировка трехдиагональная | Решите синтетическую систему нелинейных УЧП, используя три различных алгоритма, включающих блочные трехдиагональные , скалярные пятидиагональные и симметричные последовательного перерелаксации ядра решателя (SSOR) соответственно. | ||
СП | S каляр пятидиагональный - [6] | |||
ЛУ | Нижняя- Верхняя симметричная Гаусса Зейделя - [6] | |||
UA | Неструктурированный Адаптивный [11] | НПБ 3.1 [7] | Решите уравнение теплопроводности с учетом конвекции и диффузии от движущегося шара. Сетка адаптивна и пересчитывается на каждом пятом шаге. | |
округ Колумбия | данных куба Оператор [12] | |||
ДТ | данных Трафик [7] | НПБ 3.2 [7] |
Ссылки
[ редактировать ]- ^ Перейти обратно: а б «Изменения в тестах параллельного тестирования NAS» . Отдел передовых суперкомпьютеров НАСА . Проверено 23 февраля 2009 г.
- ^ Перейти обратно: а б с д и Бейли, Д.; Барщ, Э.; Бартон, Дж.; Браунинг, Д.; Картер, Р.; Игла, Л.; Фатухи, Р.; Файнберг, С.; Фредериксон, П.; Виратунга, С. (март 1994 г.), «Параллельные тесты NAS» (PDF) , Технический отчет NAS RNR-94-007 , Исследовательский центр Эймса НАСА, Моффетт Филд, Калифорния.
- ^ Перейти обратно: а б с Бейли, Д.; Харрис, Т.; Сапфир, В.; ван дер Вейнгаарт, Р.; Ву, А.; Ярроу, М. (декабрь 1995 г.), «Параллельные тесты NAS 2.0» (PDF) , Технический отчет NAS-95-020 NAS-95 , Исследовательский центр Эймса НАСА, Моффетт Филд, Калифорния.
- ^ Перейти обратно: а б с д Вонг, П.; ван дер Вейнгаарт, Р. (январь 2003 г.), «Проверки параллельного ввода-вывода NAS, версия 2.4» (PDF) , Технический отчет NAS NAS-03-002 , Исследовательский центр Эймса НАСА, Моффетт Филд, Калифорния
- ^ Перейти обратно: а б с Сапфир, В.; ван дер Вейнгаарт, Р.; Ву, А.; Ярроу, М., Новые реализации и результаты для параллельных тестов NAS 2 (PDF) , Исследовательский центр Эймса НАСА, Моффет Филд, Калифорния
- ^ Перейти обратно: а б с д ван дер Вейнгаарт, Р. (октябрь 2002 г.), «Параллельные тесты NAS, версия 2.4» (PDF) , Технический отчет NAS NAS-02-007 , Исследовательский центр Эймса НАСА, Моффетт Филд, Калифорния
- ^ Перейти обратно: а б с д и ж «Изменения в тестах параллельного тестирования NAS» . Отдел передовых суперкомпьютеров НАСА . Проверено 17 марта 2009 г.
- ^ Джин, Х.; Фрумкин, М.; Ян, Дж. (октябрь 1999 г.), «Реализация OpenMP параллельных тестов NAS и ее производительность» (PDF) , Технический отчет NAS NAS-99-011 , Исследовательский центр Эймса НАСА, Моффетт Филд, Калифорния
- ^ Фрумкин, М.; Шульц, М.; Джин, Х.; Ян, Дж., «Реализация параллельных тестов NAS на Java» (PDF) , Технический отчет NAS NAS-02-009 , Исследовательский центр Эймса НАСА, Моффетт Филд, Калифорния
- ^ Фрумкин, М.; Джин, Х.; Ян, Дж. (сентябрь 1998 г.), «Реализация параллельных тестов NAS в высокопроизводительном Фортране» (PDF) , Технический отчет NAS NAS-98-009 , Исследовательский центр Эймса НАСА, Моффетт Филд, Калифорния
- ^ Перейти обратно: а б Фэн, Х.; ван дер Вейнгаарт, Ф.; Бисвас, Р.; Мавриплис, К. (июль 2004 г.), «Неструктурированный адаптивный (UA) параллельный тест NAS, версия 1.0» (PDF) , Технический отчет NAS NAS-04-006 , Исследовательский центр Эймса НАСА, Моффетт Филд, Калифорния
- ^ Перейти обратно: а б Фрумкин, М.; Шабанов, Л. (сентябрь 2004 г.), «Сравнительный анализ производительности памяти с помощью оператора куба данных» (PDF) , Технический отчет NAS NAS-04-013 , Исследовательский центр Эймса НАСА, Моффетт Филд, Калифорния.
- ^ Перейти обратно: а б ван дер Вейнгаарт, Р.; Джин, Х. (июль 2003 г.), «Параллельные тесты NAS, многозонные версии» (PDF) , Технический отчет NAS NAS-03-010 , Исследовательский центр Эймса НАСА, Моффетт Филд, Калифорния
Внешние ссылки
[ редактировать ]- Изменения в параллельных тестах NAS (официальный сайт)