Jump to content

OpenBLAS

OpenBLAS
Оригинальный автор(ы) Кадзусигэ Гото
Разработчик(и) Чжан Сяньи, Ван Цянь, Вернер Саар
Первоначальный выпуск 22 марта 2011 г .; 13 лет назад ( 22 марта 2011 )
Стабильная версия
0.3.27 [1] / 4 апреля 2024 г .; 3 месяца назад ( 4 апреля 2024 г. )
Репозиторий
Написано в C, современный Фортран
Операционная система
Платформа
Тип библиотека линейной алгебры; внедрение БЛАС
Лицензия Лицензия БСД
Веб-сайт www .openblas .сеть  Edit this on Wikidata

OpenBLAS — это с открытым исходным кодом реализация BLAS (базовые подпрограммы линейной алгебры) и LAPACK API-интерфейсов со множеством оптимизаций, созданных вручную для конкретных типов процессоров . Он разработан в Лаборатории параллельного программного обеспечения и вычислительной техники ISCAS .

OpenBLAS добавляет оптимизированные реализации ядер линейной алгебры для нескольких процессорных архитектур, включая Intel Sandy Bridge. [3] и Лунгсон . [4] Он утверждает, что достиг производительности, сравнимой с Intel MKL : в основном это справедливо для части BLAS, тогда как часть LAPACK отстает. [ нужна ссылка ] На машинах, поддерживающих набор инструкций AVX2, OpenBLAS может достичь производительности, аналогичной MKL, но в настоящее время почти нет библиотек с открытым исходным кодом, сравнимых с MKL, на процессорах с набором инструкций AVX512.

OpenBLAS — это форк GotoBLAS 2, созданный Кадзусигэ Гото в Техасском центре перспективных вычислений .

История и настоящее

[ редактировать ]

OpenBLAS был разработан группой параллельного программного обеспечения под руководством профессора Юньцюань Чжана из Китайской академии наук.

OpenBLAS изначально предназначался только для платформы ЦП Loongson. Доктор Сяньи Чжан внес большой вклад. Поскольку от GotoBLAS отказались, преемник OpenBLAS теперь разрабатывается как библиотека BLAS с открытым исходным кодом для нескольких платформ, включая платформы x86 , ARMv8, MIPS и RISC-V , и пользуется уважением за свою превосходную переносимость.

Группа параллельного программного обеспечения модернизирует OpenBLAS для удовлетворения текущих вычислительных потребностей. Например, вычисления OpenBLAS уровня 3 в основном были оптимизированы для больших и квадратных матриц (часто рассматриваемых как матрицы правильной формы). Теперь также поддерживается умножение матриц неправильной формы, например, умножение высоких и тощих матриц (TSMM), [5] который поддерживает более быстрые вычисления глубокого обучения на процессоре. TSMM — это один из основных вычислений в операциях глубокого обучения. Помимо этого, OpenBLAS также будет поддерживать компактную функцию и небольшой GEMM.

См. также

[ редактировать ]
  1. ^ «Версия OpenBLAS 0.3.27» . 4 апреля 2024 г. Проверено 4 апреля 2024 г.
  2. ^ «ОпенБЛАС» . 25 октября 2021 г.
  3. ^ Ван Цянь; Чжан Сяньи; Чжан Юньцюань; Цин И (2013). AUGEM: автоматическое создание высокопроизводительных ядер плотной линейной алгебры на процессорах x86 (PDF) . Международная конференция. по высокопроизводительным вычислениям, сетям, хранению и анализу.
  4. ^ Чжан Сяньи; Ван Цянь; Чжан Юньцюань (2012). Оптимизация производительности BLAS уровня 3 на основе модели на процессоре Loongson 3A . 18-я Международная конференция IEEE. по параллельным и распределенным системам (ICPADS).
  5. ^ Ченди Ли; Хайпэн Цзя; Ханг Цао; Цзяньюй Яо; Боцянь Ши; Чуньян Сян; Джинбо Сан; Пэнци Лу; Юньцюань Чжан (2021). AutoTSMM: платформа автоматической настройки для создания высокопроизводительной системы умножения матриц для высоких и тощих матриц на процессорах (PDF) . Международный симпозиум IEEE по параллельной и распределенной обработке приложений.
[ редактировать ]
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 606da59dc741ac3e0384a5183660a5e3__1706970120
URL1:https://arc.ask3.ru/arc/aa/60/e3/606da59dc741ac3e0384a5183660a5e3.html
Заголовок, (Title) документа по адресу, URL1:
OpenBLAS - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)