Jump to content

ГотоБЛАС

ГотоБЛАС
Оригинальный автор(ы) Кадзусигэ Гото
Финальный выпуск
2-1.13 / 5 февраля 2010 г .; 14 лет назад ( 05.02.2010 )
Тип библиотека линейной алгебры; внедрение БЛАС
Лицензия Лицензия БСД

В сфере вычислений научных GotoBLAS и GotoBLAS2 представляют собой с открытым исходным кодом реализации BLAS (базовые подпрограммы линейной алгебры) API и множеством оптимизаций, созданных вручную для конкретных типов процессоров . GotoBLAS был разработан Кадзусигэ Гото в Техасском центре перспективных вычислений . По состоянию на 2003 год , он использовался в семи из десяти самых быстрых суперкомпьютеров мира. [1]

GotoBLAS по-прежнему доступен, но разработка прекратилась с выходом финальной версии, обеспечивающей оптимальную производительность на архитектуре Intel Nehalem (современной в 2008 году). [2] OpenBLAS — это активно поддерживаемая версия GotoBLAS, разработанная в Лаборатории параллельного программного обеспечения и вычислительной техники ISCAS .

GotoBLAS был написан Гото во время его творческого отпуска в Патентном ведомстве Японии в 2002 году. Первоначально он был оптимизирован для процессора Pentium 4 и сумел сразу повысить производительность суперкомпьютера на его базе с 1,5 терафлопс до 2 терафлопс. [1] По состоянию на 2005 год , библиотека была доступна бесплатно для некоммерческого использования. [1] Более поздняя версия с открытым исходным кодом была выпущена на условиях лицензии BSD .

GotoBLAS Процедура умножения матриц , называемая GEMM в терминах BLAS, тщательно настроена для процессорных архитектур x86 и AMD64 с помощью созданного вручную ассемблерного кода . [3] Это следует за аналогичной декомпозицией на более мелкие подпрограммы «ядра», которые используют другие реализации BLAS, но там, где более ранние реализации передавали потоковые данные из кэша процессора L1 , GotoBLAS использует кэш L2 . [3] Ядро, используемое для GEMM, представляет собой процедуру под названием GEBP, что означает «Общее умножение блока на панель». [4] экспериментально было установлено, что оно «по своей сути превосходит» несколько других ядер, которые учитывались при разработке. [3]

Некоторые другие процедуры BLAS, как это принято в библиотеках BLAS, реализованы на основе GEMM. [4]

По состоянию на январь 2022 года Техасского центра перспективных вычислений веб-сайт [5] заявляет, что Goto BLAS больше не поддерживается, и предлагает использовать BLIS или MKL .

См. также

[ редактировать ]
  1. ^ Перейти обратно: а б с Маркофф, Джон Грегори (28 ноября 2005 г.). «Написание самого быстрого кода вручную для развлечения: человеческий компьютер продолжает ускорять работу чипов» . Нью-Йорк Таймс . Сиэтл, Вашингтон, США. Архивировано из оригинала 23 марта 2020 г. Проверено 4 марта 2010 г. [1]
  2. ^ Милфельд, Кент. «ГотоБЛАС2» . Техасский центр перспективных вычислений . Архивировано из оригинала 23 марта 2020 г. Проверено 28 августа 2013 г.
  3. ^ Перейти обратно: а б с Гото, Казусигэ ; ван де Гейн, Роберт А. (2008). «Анатомия высокопроизводительного умножения матриц». Транзакции ACM в математическом программном обеспечении . 34 (3): 12:1–12:25. CiteSeerX   10.1.1.111.3873 . дои : 10.1145/1356052.1356053 . ISSN   0098-3500 . (25 страниц) [2]
  4. ^ Перейти обратно: а б Гото, Казусигэ ; ван де Гейн, Роберт А. (2008). «Высокопроизводительная реализация BLAS уровня 3» (PDF) . Транзакции ACM в математическом программном обеспечении . 35 (1): 1–14. дои : 10.1145/1377603.1377607 .
  5. ^ «БЛАС-ЛАПАК в ТАСС» . Техасский центр перспективных вычислений . {{cite journal}}: Для цитирования журнала требуется |journal= ( помощь )
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 1dce28910a709886258a77e95876b23d__1693390920
URL1:https://arc.ask3.ru/arc/aa/1d/3d/1dce28910a709886258a77e95876b23d.html
Заголовок, (Title) документа по адресу, URL1:
GotoBLAS - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)