Jump to content

ФЛОПС

(Перенаправлено с Петафлопа )

Операций с плавающей запятой в секунду ( FLOPS , flops или flop/s ) — это мера производительности компьютера при вычислениях , полезная в областях научных вычислений, требующих вычислений с плавающей запятой . [ 1 ]

В таких случаях это более точная мера, чем измерение количества инструкций в секунду . [ нужна ссылка ]

Арифметика с плавающей запятой

[ редактировать ]
Множители для флопов
Имя Единица Ценить
килофлопс кфлопс 10 3
мега ФЛОПС МФЛОПС 10 6
гигафлопс ГФЛОПС 10 9
береговые шлепки терафлопс 10 12
пета- флопс ПФЛОПС 10 15
экза ФЛОПС ЭФЛОПС 10 18
Зетта ФЛОПС Зфлопс 10 21
йотта ФЛОПС ЙФЛОПС 10 24
Ронна ФЛОПС RFLOPS 10 27
кветта ФЛОПС КФЛОПС 10 30

Арифметика с плавающей запятой необходима для очень больших или очень маленьких действительных чисел или вычислений, требующих большого динамического диапазона. Представление с плавающей запятой похоже на экспоненциальную запись, за исключением того, что все выполняется по второй, а не по десятичной системе счисления. Схема кодирования хранит знак, показатель степени (по основанию два для Cray и VAX , по основанию два или десять для форматов с плавающей запятой IEEE и по основанию 16 для архитектуры IBM с плавающей запятой ) и мантиссу (число после запятой ). Хотя используется несколько подобных форматов, наиболее распространенным является ANSI/IEEE Std. 754-1985 . Этот стандарт определяет формат для 32-битных чисел, называемых одинарной точностью , а также 64-битных чисел, называемых двойной точностью , и более длинных чисел, называемых расширенной точностью (используемых для промежуточных результатов). Представления с плавающей запятой могут поддерживать гораздо более широкий диапазон значений, чем с фиксированной запятой, с возможностью представления как очень маленьких, так и очень больших чисел. [ 2 ]

Динамический диапазон и точность

[ редактировать ]

Возведение в степень, свойственное вычислениям с плавающей запятой, обеспечивает гораздо больший динамический диапазон – самые большие и наименьшие числа, которые могут быть представлены – что особенно важно при обработке наборов данных, где некоторые данные могут иметь чрезвычайно широкий диапазон числовых значений или где диапазон может быть непредсказуемым. Таким образом, процессоры с плавающей запятой идеально подходят для приложений с интенсивными вычислениями. [ 3 ]

Вычислительная производительность

[ редактировать ]

FLOPS и MIPS — это единицы измерения вычислительной производительности компьютера. Операции с плавающей запятой обычно используются в таких областях, как научные вычислительные исследования, а также в машинном обучении . Однако до конца 1980-х годов аппаратное обеспечение для операций с плавающей запятой (возможно реализовать арифметику FP в программном обеспечении на любом целочисленном оборудовании) обычно было необязательной функцией, а компьютеры, на которых она была, назывались «научными компьютерами» или осуществляющими « научные вычисления ». "возможность. Таким образом, единица MIPS была полезна для измерения целочисленной производительности любого компьютера, в том числе без такой возможности, а также для учета различий в архитектуре. Аналогичный MOPS (миллион операций в секунду) использовался еще в 1970 году. [ 4 ] также. Обратите внимание, что помимо целочисленной арифметики (или арифметики с фиксированной запятой), примеры целочисленных операций включают перемещение данных (от A к B) или проверку значений (если A = B, то C). Вот почему MIPS в качестве показателя производительности подходит, когда компьютер используется для запросов к базе данных, обработки текстов, электронных таблиц или для запуска нескольких виртуальных операционных систем. [ 5 ] [ 6 ] В 1974 году Дэвид Как ввел термины «флопс» и «мегафлопс» для описания производительности суперкомпьютеров того времени по количеству вычислений с плавающей запятой, которые они выполняли в секунду. [ 7 ] Это было намного лучше, чем использование распространенного MIPS для сравнения компьютеров, поскольку эта статистика обычно мало влияла на арифметические возможности машины при выполнении научных задач.

ФЛОПС крупнейшего суперкомпьютера за все время

FLOPS в системе HPC можно рассчитать с помощью этого уравнения: [ 8 ]

Это можно упростить до наиболее распространенного случая: компьютер, имеющий ровно 1 процессор:

FLOPS могут быть записаны с разными показателями точности, например, список суперкомпьютеров TOP500 ранжирует компьютеры по 64-битным ( формат с плавающей запятой двойной точности ) операциям в секунду, сокращенно FP64 . [ 9 ] Аналогичные меры доступны для 32-битных ( FP32 ) и 16-битных ( FP16 ) операций.

Операции с плавающей запятой за такт для различных процессоров

[ редактировать ]
Операции с плавающей запятой за такт на ядро [ 10 ]
Микроархитектура Архитектура набора команд ФП64 ФП32 РП16
Процессор Intel
Интел 80486 x87 (32-разрядная версия) ? 0.128 [ 11 ] ?
x87 (32-разрядная версия) ? 0.5 [ 11 ] ?
ММХ (64-разрядная версия) ? 1 [ 12 ] ?
Intel P6 Пентиум III ССЕ (64-разрядная версия) ? 2 [ 12 ] ?
Intel NetBurst Pentium 4 (Уилламетт, Нортвуд) SSE2 (64-разрядная версия) 2 4 ?
Intel P6 Пентиум М SSE2 (64-разрядная версия) 1 2 ?
SSE3 (64-разрядная версия) 2 4 ?
4 8 ?
Intel Atom ( Боннелл , Солтвелл , Сильвермонт и Голдмонт ) SSE3 (128-бит) 2 4 ?
Intel Sandy Bridge ( Сэнди Бридж , Айви Бридж ) AVX (256-бит) 8 16 0
AVX2 и FMA (256-бит) 16 32 0
Intel Xeon Phi ( Рыцарский уголок ) IMCI (512-битный) 16 32 0
AVX-512 и FMA (512-бит) 32 64 0
Процессор AMD
AMD Бобкэт AMD64 (64-разрядная версия) 2 4 0
4 8 0
АМД К10 SSE4/4a (128-бит) 4 8 0
АМД Бульдозер [ 13 ] ( Сваедрайвер , Паровой каток , Экскаватор )
  • AVX (128-бит) (Бульдозер, Паровой каток)
  • AVX2 (128-бит) (Экскаватор)
  • ФМА3 (Бульдозер) [ 14 ]
  • FMA3/4 (Сваебойщик, Экскаватор)
4 8 0
AVX2 и FMA (128-битное, 256-битное декодирование) [ 18 ] 8 16 0
AVX2 и FMA (256-бит) 16 32 0
ARM-процессор
ARM Cortex-A7, A9, A15 ARMv7 1 8 0
ARM Кортекс-А32, А35 ARMv8 2 8 0
ARM Cortex-A53 , A55 , A57 , [ 13 ] А72 , А73 , А75 ARMv8 4 8 0
ARM Cortex-A76 , A77 , A78 ARMv8 8 16 0
ARM Кортекс-X1 ARMv8 16 32 ?
Qualcomm Крайт ARMv8 1 8 0
Qualcomm Крио (1xx - 3xx) ARMv8 2 8 0
Qualcomm Крио (4xx - 5xx) ARMv8 8 16 0
Samsung Exynos M1 и M2 ARMv8 2 8 0
Samsung Exynos M3 и M4 ARMv8 3 12 0
IBM PowerPC A2 (Blue Gene/Q) ? 8 8 (как FP64) 0
Хитачи СХ-4 [ 20 ] [ 21 ] Ш-4 1 7 0
графический процессор NVIDIA
Nvidia Curie ( серия GeForce 6 и серия GeForce 7 ) ПТХ ? 8 ?
Nvidia Tesla 2.0 (GeForce GTX 260–295) ПТХ ? 2 ?
Nvidia Fermi (только GeForce GTX 465–480, 560Ti, 570–590) ПТХ 1/4 (заблокировано драйвером, 1 аппаратно) 2 0
Nvidia Fermi (только Quadro 600–2000) ПТХ 1/8 2 0
Nvidia Fermi (только Quadro 4000–7000, Tesla) ПТХ 1 2 0
Nvidia Kepler (GeForce (кроме Titan и Titan Black), Quadro (кроме K6000), Tesla K10) ПТХ 1/12 (для GK110 : блокируется драйвером, 2/3 аппаратно) 2 0
Nvidia Kepler (GeForce GTX Titan и Titan Black, Quadro K6000, Tesla (кроме K10)) ПТХ 2/3 2 0
ПТХ 1/16 2 1/32
Nvidia Pascal (только Quadro GP100 и Tesla P100) ПТХ 1 2 4
Нвидиа Вольта [ 22 ] ПТХ 1 2 ( ФП32 ) + 2 ( INT32 ) 16
Nvidia Turing (только GeForce 16XX ) ПТХ 1/16 2 (ФП32) + 2 (ИНТ32) 4
Nvidia Turing (все, кроме GeForce 16XX ) ПТХ 1/16 2 (ФП32) + 2 (ИНТ32) 16
Нвидиа Ампер [ 23 ] [ 24 ] (только Тесла А100/А30) ПТХ 2 2 (ФП32) + 2 (ИНТ32) 32
Nvidia Ampere (все GeForce и Quadro, Tesla A40/A10) ПТХ 1/32 2 (FP32) + 0 (INT32) или 1 (FP32) + 1 (INT32) 8
AMD графический процессор
AMD TeraScale 1 ( серия Radeon HD 4000 ) ТераСкейл 1 0.4 2 ?
AMD TeraScale 2 ( серия Radeon HD 5000 ) ТераСкейл 2 1 2 ?
AMD TeraScale 3 ( серия Radeon HD 6000 ) ТераСкейл 3 1 4 ?
AMD GCN (только Radeon Pro W 8100–9100) GCN 1 2 ?
AMD GCN (все, кроме Radeon Pro W 8100–9100, Vega 10–20) GCN 1/8 2 4
AMD GCN Вега 10 GCN 1/8 2 4
AMD GCN Vega 20 (только Radeon VII) GCN 1/2 (заблокировано драйвером, 1 аппаратно) 2 4
AMD GCN Vega 20 (только Radeon Instinct MI50/MI60 и Radeon Pro VII) GCN 1 2 4
РДНА 1/8 2 4
AMD RDNA3 РДНА 1/8? 4 8?
AMD CDNA CDNA 1 4 (Тензор) [ 27 ] 16
AMD CDNA 2 CDNA 2 4 (Тензор) 4 (Тензор) 16
графический процессор Intel
Intel Xe-LP (Iris Xe MAX) [ 28 ] Машина 1/2? 2 4
Intel Xe-HPG (Дуговой алхимик) [ 28 ] Машина 0 2 16
Intel Xe-HPC (Понте Веккьо) [ 29 ] Машина 2 2 32
графический процессор Qualcomm
Qualcomm Адрено 5x0 Адрено 5xx 1 2 4
Qualcomm Адрено 6x0 Адрено 6xx 1 2 4
Графкор
Графкор Колосс GC2 [ 30 ] [ 31 ] ? 0 16 64
  • Graphcore Colossus GC200 Mk2 [ 32 ]
  • Графкор Лук-2000 [ 33 ]
? 0 32 128
Суперкомпьютер
ЭНИАК @ 100 кГц в 1945 году. 0.004 [ 34 ] (~0,00000003 ФЛОПС/ Вт )
48-битный процессор с частотой 208 кГц в CDC 1604 в 1960 году.
60-битный процессор с частотой 10 МГц в CDC 6600 в 1964 году. 0,3 (ФП60)
60-битный процессор с частотой 10 МГц в CDC 7600 в 1967 году. 1,0 (ФП60)
Cray-1 @ 80 МГц в 1976 году. 2 (700 ФЛОПС/Вт)
CDC Cyber ​​205 @ 50 МГц в 1981 году

ФОРТРАН компилятор (ANSI 77 с векторными расширениями)

8 16
Транспьютер IMS T800-20 @ 20 МГц 1987 г. 0.08 [ 35 ]
Параллельный E16 @ 1000 МГц в 2012 г. 2 [ 36 ] (5,0 ГФЛОПС/Вт) [ 37 ]
Параллельный E64 @ 800 МГц в 2012 г. 2 [ 38 ] (50,0 ГФЛОПС/Вт) [ 37 ]
Микроархитектура Архитектура набора команд ФП64 ФП32 РП16

Рекорды производительности

[ редактировать ]

Записи одного компьютера

[ редактировать ]

В июне 1997 года Intel ASCI Red стал первым в мире компьютером, достигшим производительности в один терафлопс и выше. Директор Sandia Билл Кэмп заявил, что ASCI Red обладает лучшей надежностью из всех когда-либо созданных суперкомпьютеров и «является высшим достижением суперкомпьютеров по долговечности, цене и производительности». [ 39 ]

Суперкомпьютер NEC производительность которого SX-9 стал первым в мире векторным процессором, превысила 100 гигафлопс на одно ядро.

анонсировал новый компьютер В июне 2006 года японский исследовательский институт RIKEN MDGRAPE-3 . Максимальная производительность компьютера составляет один петафлопс, что почти в два раза выше, чем у Blue Gene/L, но MDGRAPE-3 не является компьютером общего назначения, поэтому он не фигурирует в списке Top500.org . Он имеет специальные конвейеры для моделирования молекулярной динамики.

К 2007 году корпорация Intel представила экспериментальный многоядерный чип POLARIS , производительность которого достигает 1 терафлопс на частоте 3,13 ГГц. 80-ядерный чип способен поднять этот результат до 2 терафлопс на частоте 6,26 ГГц, хотя тепловыделение на этой частоте превышает 190 Вт. [ 40 ]

В июне 2007 года сайт Top500.org сообщил, что самым быстрым компьютером в мире является суперкомпьютер IBM Blue Gene/L с пиковой производительностью 596 терафлопс. [ 41 ] Cray XT4 занял второе место с производительностью 101,7 терафлопс.

26 июня 2007 года IBM анонсировала второе поколение своего лучшего суперкомпьютера, получившего название Blue Gene/P и предназначенного для непрерывной работы на скоростях, превышающих один петафлопс, что быстрее, чем Blue Gene/L. При такой настройке он может достигать скорости, превышающей три петафлопс. [ 42 ]

25 октября 2007 года NEC японская корпорация выпустила пресс-релиз, анонсирующий модель SX-9 серии SX . [ 43 ] утверждая, что это самый быстрый векторный суперкомпьютер в мире. SX -9 оснащен первым процессором, способным обеспечить пиковую векторную производительность 102,4 гигафлопс на одно ядро.

4 февраля 2008 года Национальный научный фонд и Техасский университет в Остине открыли полномасштабные исследования суперкомпьютера AMD и Sun под названием Ranger . [ 44 ] самая мощная в мире суперкомпьютерная система для открытых научных исследований, работающая с постоянной скоростью 0,5 петафлопс.

25 мая 2008 года американский суперкомпьютер построенный IBM , Roadrunner , достиг вычислительной вехи в один петафлопс. Он возглавил список TOP500 самых мощных суперкомпьютеров за июнь 2008 г. и ноябрь 2008 г. (исключая грид-компьютеры ). [ 45 ] [ 46 ] Компьютер расположен в Национальной лаборатории Лос-Аламоса в Нью-Мексико. Название компьютера отсылает к птице штата Нью-Мексико , большому дорожному бегуну ( Geococcyx Californianus ). [ 47 ]

В июне 2008 года AMD выпустила серию ATI Radeon HD 4800, которые, как сообщается, стали первыми графическими процессорами, достигающими производительности в один терафлопс. 12 августа 2008 года AMD выпустила видеокарту ATI Radeon HD 4870X2 с двумя графическими процессорами Radeon R770 общей производительностью 2,4 терафлопс.

В ноябре 2008 года модернизация суперкомпьютера Cray Jaguar в Окриджской национальной лаборатории (ORNL) Министерства энергетики (DOE) увеличила вычислительную мощность системы до пиковых 1,64 петафлопс, что сделало Jaguar первой в мире петафлопс-системой, предназначенной для открытых исследований . В начале 2009 года суперкомпьютер был назван в честь мифического существа Кракена . Kraken был объявлен самым быстрым в мире суперкомпьютером, управляемым университетом, и шестым по скорости в списке TOP500 2009 года. В 2010 году Kraken был модернизирован и теперь может работать быстрее и мощнее.

В 2009 году Cray Jaguar показал производительность 1,75 петафлопс, опередив IBM Roadrunner и заняв первое место в списке TOP500 . [ 48 ]

В октябре 2010 года Китай представил Tianhe-1 , суперкомпьютер, который работает с пиковой вычислительной скоростью 2,5 петафлопс. [ 49 ] [ 50 ]

По состоянию на 2010 год самый быстрый процессор ПК достиг 109 гигафлопс ( Intel Core i7 980 XE ) [ 51 ] в вычислениях двойной точности. Графические процессоры значительно мощнее. Например, вычислительные процессоры Nvidia Tesla C2050 GPU имеют производительность около 515 гигафлопс. [ 52 ] в вычислениях двойной точности, а максимальная производительность AMD FireStream 9270 составляет 240 гигафлопс. [ 53 ]

В ноябре 2011 года было объявлено, что Япония достигла производительности 10,51 петафлопс с помощью своего компьютера K. [ 54 ] Он имеет 88 128 SPARC64 VIIIfx процессоров в 864 стойках с теоретической производительностью 11,28 петафлопс. Он назван в честь японского слова « кей », что означает 10 квадриллионов . [ 55 ] что соответствует целевой скорости 10 петафлопс.

15 ноября 2011 года Intel продемонстрировала один процессор на базе x86 под кодовым названием Knights Corner, обеспечивающий производительность более терафлопс в широком диапазоне операций DGEMM . Во время демонстрации Intel подчеркнула, что это устойчивая производительность в терафлопс (а не «необработанные терафлопс», используемые другими для получения более высоких, но менее значимых чисел), и что это был первый процессор общего назначения, когда-либо преодолевший терафлопс. [ 56 ] [ 57 ]

18 июня 2012 года суперкомпьютерная система Sequoia компании IBM , базирующаяся в Ливерморской национальной лаборатории им. Лоуренса (LLNL), достигла производительности 16 петафлопс, установив мировой рекорд и заняв первое место в последнем списке TOP500. [ 58 ]

12 ноября 2012 года список TOP500 признал Titan самым быстрым суперкомпьютером в мире согласно тесту LINPACK с производительностью 17,59 петафлопс. [ 59 ] [ 60 ] Он был разработан компанией Cray Inc. в Национальной лаборатории Ок-Ридж и сочетает в себе процессоры AMD Opteron и технологии графических процессоров (GPU) NVIDIA Tesla «Kepler». [ 61 ] [ 62 ]

10 июня 2013 года китайский Tianhe-2 был признан самым быстрым в мире с производительностью 33,86 петафлопс. [ 63 ]

20 июня 2016 года китайский Sunway TaihuLight был признан самым быстрым в мире с 93 петафлопсами по тесту LINPACK (из 125 пиковых петафлопс). Система была установлена ​​в Национальном суперкомпьютерном центре в Уси и обеспечивала более высокую производительность, чем пять следующих самых мощных систем в списке TOP500 вместе взятых. [ 64 ]

В июне 2019 года суперкомпьютер Summit , построенный IBM и сейчас работающий в Окриджской национальной лаборатории (ORNL) Министерства энергетики (DOE), занял первое место с производительностью 148,6 петафлопс в тесте High Performance Linpack (HPL), эталонном тесте. используется для ранжирования списка TOP500. Summit имеет 4356 узлов, каждый из которых оснащен двумя 22-ядерными процессорами Power9 и шестью графическими процессорами NVIDIA Tesla V100. [ 65 ]

В июне 2022 года американский суперкомпьютер Frontier стал самым мощным суперкомпьютером в рейтинге TOP500, его производительность достигла 1102 петафлопс (1,102 эксафлопс) по тестам LINPACK. [ 66 ]

Записи распределенных вычислений

[ редактировать ]

Распределенные вычисления используют Интернет для связи персональных компьютеров для достижения большего количества FLOPS:

  • По состоянию на апрель 2020 г. Общая вычислительная мощность сети Folding @home превышает 2,3 экзафлопс. [ 67 ] [ 68 ] [ 69 ] [ 70 ] Это самая мощная распределенная компьютерная сеть, первая в истории, преодолевшая 1 экзафлопс общей вычислительной мощности. Такой уровень производительности в первую очередь обеспечивается совокупными усилиями огромного количества мощных блоков графического процессора и процессора . [ 71 ]

Стоимость вычислений

[ редактировать ]

Стоимость оборудования

[ редактировать ]
Дата Приблизительная цена в долларах США за гигафлопс Платформа, обеспечивающая самую низкую стоимость за гигафлопс Комментарии
Нескорректированный 2023 [ 77 ]
1945 130 триллионов долларов 2 квадриллиона долларов ЭНИАК : 487 000 долларов в 1945 году и 7 916 000 долларов в 2022 году. 487 000 долларов США / 0,000 000 385   ГФЛОПС . Электронно-цифровой компьютер первого поколения ( на основе электронных ламп ).
1961 20 миллиардов долларов 204 миллиарда долларов базовой установки IBM 7030 Stretch Стоимость на тот момент составляла 7,78 миллиона долларов США каждая. IBM 7030 Stretch выполняет одно умножение чисел с плавающей запятой каждые 2,4 микросекунды . [ 78 ] Компьютер второго поколения ( на транзисторах ).
1984 $20,000,000 $100,000,000 Крей X-MP /48 15 000 000 долларов США / 0,8 ГФЛОПС . Компьютер третьего поколения ( на базе интегральной схемы ).
1997 $30,000 $57,000 Два 16-процессорных кластера Beowulf с Pentium Pro микропроцессорами [ 79 ]
апрель 2000 г. $1,000 $2,000 Скопление Буньип Беовульф Bunyip была первой вычислительной технологией стоимостью менее доллара США 1 за MFLOPS . В 2000 году он получил премию Гордона Белла.
май 2000 г. $640 $1,000 CLAT2 KLAT2 была первой вычислительной технологией, которая масштабировалась для больших приложений, сохраняя при этом стоимость менее 1 доллара США за MFLOPS . [ 80 ]
август 2003 г. $90 $100 КАСЫ0 KASY0 была первой вычислительной технологией стоимостью менее 100 долларов США за гигафлопс . [ 81 ]
август 2007 г. $50 $70 Микровульф По состоянию на август 2007 года этот «персональный» кластер Beowulf производительностью 26 гигафлопс можно построить за 1256 долларов. [ 82 ]
март 2011 г. $1.80 $2 HPU4Наука Этот кластер стоимостью 30 000 долларов был построен с использованием только коммерчески доступного оборудования «геймерского» уровня. [ 83 ]
август 2012 г. $0.75 $1 Четырехъядерная AMD Radeon 7970 система Настольный компьютер с четырехъядерным процессором AMD Radeon 7970, обеспечивающий вычислительную производительность 16 терафлопс одинарной точности и 4 терафлопс двойной точности. Общая стоимость системы составила 3000 долларов; построен с использованием только коммерчески доступного оборудования. [ 84 ]
июнь 2013 г. $0.22 $0.3 Сони PlayStation 4 Sony PlayStation 4 имеет пиковую производительность 1,84 терафлопс по цене 400 долларов. [ 85 ]
ноябрь 2013 г. $0.16 $0.21 AMD Sempron 145 и GeForce GTX 760 Система Построенная с использованием имеющихся в продаже комплектующих, система с использованием одного AMD Sempron 145 и трех Nvidia GeForce GTX 760 достигает общей производительности 6,771 терафлопс при общей стоимости 1090,66 долларов США . [ 86 ]
декабрь 2013 г. $0.12 $0.16 Pentium G550 и Radeon R9 290 Система Построен с использованием имеющихся в продаже деталей. Intel Pentium G550 и AMD Radeon R9 290 имеют максимальную производительность 4,848 терафлопс на общую сумму 681,84 доллара США . [ 87 ]
Январь 2015 г. $0.08 $0.1 Celeron G1830 и Radeon R9 295X2 Система Построен с использованием имеющихся в продаже деталей. Intel Celeron G1830 и AMD Radeon R9 295X2 имеют максимальную производительность более 11,5 терафлопс при общей сумме 902,57 долларов США . [ 88 ] [ 89 ]
июнь 2017 г. $0.06 $0.07 AMD Ryzen 7 1700 и AMD Radeon Vega Frontier Edition Система Построен с использованием имеющихся в продаже деталей. Процессор AMD Ryzen 7 1700 в сочетании с картами AMD Radeon Vega FE в режиме CrossFire обеспечивает максимальную производительность более 50 терафлопс при цене чуть менее 3000 долларов США за всю систему. [ 90 ]
Октябрь 2017 г. $0.03 $0.04 Intel Celeron G3930 и AMD RX Vega 64 Система Построен с использованием имеющихся в продаже деталей. Три AMD RX Vega 64 обеспечивают производительность чуть более 75 терафлопс с половинной точностью (38 терафлопс SP или 2,6 терафлопс DP в сочетании с ЦП) при цене ~ 2050 долларов за всю систему. видеокарты [ 91 ]
ноябрь 2020 г. $0.03 $0.03 AMD Ryzen 3600 и 3 × NVIDIA RTX 3080 Система AMD Ryzen 3600 @ 484 гигафлопс и 199,99 долларов США

3 × NVIDIA RTX 3080 с производительностью 29 770 гигафлопс каждая и 699,99 долларов США.

Общий объем системы GFLOPS = 89 794 / TFLOPS = 89,2794

Общая стоимость системы, вкл. реалистичные, но недорогие детали; соответствует другому примеру = $2839 [ 92 ]

Доллар США /ГФЛОП = 0,0314 доллара США

ноябрь 2020 г. $0.04 $0.04 PlayStation 5 Sony PlayStation 5 Digital Edition имеет пиковую производительность 10,28 терафлопс (20,58 терафлопс при половинной точности) при розничной цене 399 долларов. [ 93 ]
ноябрь 2020 г. $0.04 $0.04 Xbox серии X от Microsoft Xbox Series X имеет максимальную производительность 12,15 терафлопс (24,30 терафлопс при половинной точности) при розничной цене 499 долларов. [ 94 ]
сентябрь 2022 г. $0.02 $0.02 РТХ 4090 У Nvidia RTX 4090 заявлена ​​пиковая производительность 82,6 терафлопс (1,32 терафлопс при 8-битной точности) при розничной цене 1599 долларов. [ 95 ]
май 2023 г. $0.01 $0.01 Радеон РХ 7600 AMD RX 7600 имеет пиковую производительность 21,5 терафлопс при розничной цене 269 долларов. [ 96 ]


См. также

[ редактировать ]
  1. ^ «Понимание показателей производительности суперкомпьютера и емкости системы хранения» . kb.iu.edu . Проверено 23 марта 2024 г.
  2. ^ Плавающая точка Получено 25 декабря 2009 г.
  3. Краткое описание: Фиксированная точка (целое число) и плавающая точка. Архивировано 31 декабря 2009 г. на Wayback Machine. Проверено 25 декабря 2009 г.
  4. ^ Техническое примечание НАСА . Национальное управление по аэронавтике и исследованию космического пространства. 1970.
  5. ^ Фиксированная и плавающая точка. Проверено 25 декабря 2009 г.
  6. ^ Манипулирование данными и математические расчеты. Проверено 25 декабря 2009 г.
  7. ^ Кук, диджей (1974). Основы производительности компьютерной системы . Министерство торговли США, Национальное бюро стандартов.
  8. ^ « Узлы, сокеты, ядра и флопсы, о боже» доктора Марка Р. Фернандеса, доктора философии». Архивировано из оригинала 13 февраля 2019 года . Проверено 12 февраля 2019 г.
  9. ^ «ЧАСТО ЗАДАВАЕМЫЕ ВОПРОСЫ» . top500.org . Проверено 23 июня 2020 г.
  10. ^ «Операций с плавающей запятой в секунду (флопс)» .
  11. ^ Перейти обратно: а б «home.iae.nl» .
  12. ^ Перейти обратно: а б «Вычислительная мощность на протяжении всей истории» . Альтернативные войны.com . Проверено 13 февраля 2021 г.
  13. ^ Перейти обратно: а б с д и Дольбо, Ромен (2017). «Теоретический пик FLOPS на набор инструкций: учебное пособие». Журнал суперкомпьютеров . 74 (3): 1341–1377. дои : 10.1007/s11227-017-2177-5 . S2CID   3540951 .
  14. ^ «Поддержка новых инструкций для Bulldozer (FMA3) и Piledriver (FMA3+4 и CVT, BMI, TBM)» (PDF) .
  15. ^ «Блог Агнера о процессорах — результаты тестов AMD Ryzen» .
  16. ^ https://arstechnica.com/gadgets/2017/03/amds-moment-of-zen-finally-an-architecture-that-can-compete/2/ «каждое ядро ​​теперь имеет пару 128-битных блоков FMA. свой собственный»
  17. ^ Майк Кларк (23 августа 2016 г.). Новая базовая архитектура x86 для вычислений следующего поколения (PDF) . ХотЧипс 28. AMD. Архивировано из оригинала (PDF) 31 июля 2020 г. Проверено 8 октября 2017 г. страница 7
  18. ^ «Микроархитектура процессоров Intel и AMD» (PDF) .
  19. ^ «Выступление генерального директора AMD Лизы Су на выставке COMPUTEX 2019» . youtube.com . 27 мая 2019 г. Архивировано из оригинала 11 декабря 2021 г.
  20. ^ «Развлекательные системы и высокопроизводительный процессор SH-4» (PDF) . Обзор Хитачи . 48 (2). Хитачи : 58–63. 1999 . Проверено 21 июня 2019 г.
  21. ^ «Архитектура DSP нового поколения SH-4 для VoIP» (PDF) . Хитачи . 2000 . Проверено 21 июня 2019 г.
  22. ^ «Внутри Volta: самый продвинутый в мире графический процессор для центров обработки данных» . 10 мая 2017 г.
  23. ^ «Подробное описание архитектуры NVIDIA Ampere» . 14 мая 2020 г.
  24. ^ «Графические процессоры NVIDIA A100 обеспечивают работу современного центра обработки данных» . NVIDIA .
  25. ^ Шиллинг, Андреас (10 июня 2019 г.). «Архитектура RDNA — страница 2» . Аппаратное обеспечениеluxx .
  26. ^ «Характеристики AMD Radeon RX 5700 XT» . TechPowerUp .
  27. ^ «Ускоритель AMD Instinct MI100» .
  28. ^ Перейти обратно: а б «Введение в архитектуру Xe-HPG» .
  29. ^ «Intel Data Center GPU Max» . 9 ноября 2022 г.
  30. ^ «250 Тфлопс/с для двух чипов со смешанной точностью FP16» . youtube.com . 26 октября 2018 г.
  31. ^ Архивировано в Ghostarchive и Wayback Machine : «Оценка по энергопотреблению: FP32 составляет 1/4 от FP16, а тактовая частота ниже 1,5 ГГц» . youtube.com . 25 октября 2017 г.
  32. ^ Архивировано в Ghostarchive и Wayback Machine : «Представляем системы Graphcore Mk2 IPU» . youtube.com . 15 июля 2020 г.
  33. ^ «Лук-2000 ИПУ-Машина» . docs.graphcore.ai/ .
  34. ^ ENIAC]] @ 100 кГц с 385 флопами «Компьютеры прошлого» . Clear.rice.edu . Проверено 26 февраля 2021 г.
  35. ^ «Архитектура IMS T800» . Transputer.net . Проверено 28 декабря 2023 г.
  36. ^ 16-ядерный 65-нм микропроцессор Epiphany-III (E16G301) // администратор (19 августа 2012 г.)
  37. ^ Перейти обратно: а б Фельдман, Майкл (22 августа 2012 г.). «Adapteva представляет 64-ядерный чип» . HPCWire . Проверено 3 сентября 2014 г.
  38. ^ 64-ядерный 28-нм микропроцессор Epiphany-IV (E64G401) // администратор (19 августа 2012 г.)
  39. ^ «ASCI Red компании Sandia, первый в мире суперкомпьютер с терафлопной производительностью, выведен из эксплуатации» (PDF) . Архивировано из оригинала (PDF) 5 ноября 2010 г. Проверено 17 ноября 2011 г.
  40. ^ Ричард Суинберн (30 апреля 2007 г.). «Прибытие компьютеров TeraFLOP» . bit-tech.net . Проверено 9 февраля 2012 г.
  41. ^ «Выпущен 29-й список TOP500 самых быстрых суперкомпьютеров в мире» . Top500.org . 23 июня 2007. Архивировано из оригинала 9 мая 2008 года . Проверено 8 июля 2008 г.
  42. ^ «Июнь 2008 года» . ТОП500 . Проверено 8 июля 2008 г.
  43. ^ «NEC представляет самый быстрый в мире векторный суперкомпьютер SX-9» . НЭК. 25 октября 2007 года . Проверено 8 июля 2008 г.
  44. ^ «Техасский университет в Остине, Техасский центр передовых вычислений» . Архивировано из оригинала 1 августа 2009 года . Проверено 13 сентября 2010 г. Любой исследователь в институте США может подать заявку на распределение циклов в системе.
  45. ^ Шэрон Годен (9 июня 2008 г.). «Roadrunner от IBM преодолевает 4-минутную милю суперкомпьютеров» . Компьютерный мир. Архивировано из оригинала 24 декабря 2008 года . Проверено 10 июня 2008 г.
  46. ^ «Остин ISC08» . Топ500.org. 14 ноября 2008 года. Архивировано из оригинала 22 февраля 2012 года . Проверено 9 февраля 2012 г.
  47. ^ Филдс, Джонатан (9 июня 2008 г.). «Суперкомпьютер задает темп в петафлопе» . Новости Би-би-си . Проверено 8 июля 2008 г.
  48. ^ Гринберг, Энди (16 ноября 2009 г.). «Крей свергает IBM с трона в области суперкомпьютеров» . Форбс .
  49. ^ «Китай претендует на корону суперкомпьютера» . Новости Би-би-си. 28 октября 2010 г.
  50. ^ Диллоу, Клей (28 октября 2010 г.). «Китай представляет суперкомпьютер мощностью 2507 петафлопс, самый быстрый в мире» . Popsci.com . Проверено 9 февраля 2012 г.
  51. ^ «Intel Core i7-980X Extreme Edition — готовы к плохим результатам?: Математика: Сандра Арифметика, криптография, Microsoft Excel» . Техгейдж . 10 марта 2010 года . Проверено 9 февраля 2012 г.
  52. ^ «Персональный суперкомпьютер NVIDIA Tesla» . Nvidia.com . Проверено 9 февраля 2012 г.
  53. ^ «Вычислительный ускоритель графического процессора AMD FireStream 9270» . Amd.com . Проверено 9 февраля 2012 г.
  54. ^ « Компьютер K достиг цели в 10 петафлопс» . Fujitsu.com . Проверено 9 февраля 2012 г.
  55. ^ См. японские цифры .
  56. ^ «Уголок рыцарей Intel: 50+ ядерный 22-нм сопроцессор» . 16 ноября 2011 года . Проверено 16 ноября 2011 г.
  57. ^ «Intel представляет Knight's Corner с производительностью 1 терафлопс/с» . Проверено 16 ноября 2011 г.
  58. ^ Кларк, Дон (18 июня 2012 г.). «Компьютер IBM устанавливает рекорд скорости» . Уолл Стрит Джорнал . Проверено 18 июня 2012 г.
  59. ^ «Американский суперкомпьютер Titan оказался самым быстрым в мире» . Би-би-си. 12 ноября 2012 года . Проверено 28 февраля 2013 г.
  60. ^ «Ок-Ридж претендует на первое место в последнем списке TOP500 с Titan | TOP500 суперкомпьютерных сайтов» . Топ500.org. 12 ноября 2012 года . Проверено 28 февраля 2013 г.
  61. ^ Монтальбано, Элизабет (11 октября 2011 г.). «Лаборатория Ок-Ридж создает самый быстрый суперкомпьютер» . Информационная неделя . Проверено 9 февраля 2012 г.
  62. ^ Тибкен, Шара (29 октября 2012 г.). «Суперкомпьютер Titan дебютирует для открытых научных исследований | Cutting Edge» . Новости.CNet.com . Проверено 28 февраля 2013 г.
  63. ^ «Китайский суперкомпьютер теперь самый быстрый в мире – с большим отрывом» . Журнал Форбс . 17 июня 2013 года . Проверено 17 июня 2013 г.
  64. ^ Фельдман, Майкл. «Китай лидирует в списке ТОП-500 суперкомпьютеров, положив конец превосходству США» . Top500.org . Проверено 31 декабря 2016 г.
  65. ^ «Июнь 2018» . Top500.org . Проверено 17 июля 2018 г.
  66. ^ https://en.wikipedia.org/wiki/TOP500 [ только URL ]
  67. ^ «Активные процессоры и графические процессоры Folding@Home в зависимости от ОС» . Foldingathome.org . Проверено 8 апреля 2020 г.
  68. ^ Folding@home (25 марта 2020 г.). «Благодаря нашему УДИВИТЕЛЬНОму сообществу мы преодолели барьер exaFLOP! Это более 1 000 000 000 000 000 000 операций в секунду, что делает нас примерно в 10 раз быстрее, чем IBM Summit! pic.twitter.com/mPMnb4xdH3» . @foldingathome . Проверено 4 апреля 2020 г.
  69. ^ «Folding@Home преодолевает экзафлопсный барьер, теперь быстрее, чем десятки суперкомпьютеров — ExtremeTech» . ExtremeTech.com . Проверено 4 апреля 2020 г.
  70. ^ «Folding@Home превышает 1,5 ExaFLOPS в борьбе с Covid-19» . ТехСпот . 26 марта 2020 г. Проверено 4 апреля 2020 г.
  71. ^ «Поддержка Sony Computer Entertainment проекта Folding@home на PlayStation™3 получила в этом году золотую награду за хороший дизайн» ( пресс-релиз). Sony Computer Entertainment Inc., 6 ноября 2008 г. Архивировано из оригинала 31 января 2009 г. Проверено 11 декабря 2008 г.
  72. ^ «Вычислительная мощность BOINC» . БОИНК . Проверено 28 декабря 2020 г.
  73. ^ «Обзор кредитов SETI@Home» . БОИНК . Проверено 15 июня 2018 г.
  74. ^ «Обзор Einstein@Home Credit» . БОИНК . Проверено 15 июня 2018 г.
  75. ^ «Обзор кредитов MilkyWay@Home» . БОИНК . Проверено 15 июня 2018 г.
  76. ^ «Технология распределенных вычислений Internet PrimeNet Server для эффективного поиска простых чисел Мерсенна в Интернете» . ГИМПЫ . Проверено 15 июня 2018 г.
  77. ^ 1634–1699: Маккаскер, Джей-Джей (1997). Сколько это в реальных деньгах? Исторический индекс цен для использования в качестве дефлятора денежных ценностей в экономике Соединенных Штатов: Addenda et Corrigenda (PDF) . Американское антикварное общество . 1700–1799: Маккаскер, Джей-Джей (1992). Сколько это в реальных деньгах? Исторический индекс цен для использования в качестве дефлятора денежных ценностей в экономике Соединенных Штатов (PDF) . Американское антикварное общество . 1800 – настоящее время: Федеральный резервный банк Миннеаполиса. «Индекс потребительских цен (оценка) 1800–» . Проверено 29 февраля 2024 г.
  78. ^ «IBM 7030 (СТРЕТЧ)» . Норман Харди . Проверено 24 февраля 2017 г.
  79. ^ «Локи и Хиглак» . Локи-www.lanl.gov. 13 июля 1997 года. Архивировано из оригинала 21 июля 2011 года . Проверено 9 февраля 2012 г.
  80. ^ «Тестовый стенд Linux Athlon 2 в Кентукки (KLAT2)» . Агрегат . Проверено 9 февраля 2012 г.
  81. ^ «КАСЫ0» . Агрегат . 22 августа 2003 года . Проверено 9 февраля 2012 г.
  82. ^ «Микроульф: персональный портативный кластер «Беовульф»» . Архивировано из оригинала 12 сентября 2007 года . Проверено 9 февраля 2012 г.
  83. ^ Адам Стивенсон, Янн Ле Дю и Марием Эль Африт. « Высокопроизводительные вычисления на игровых ПК ». Арс Техника . 31 марта 2011 г.
  84. ^ Том Логан (9 января 2012 г.). «Обзор HD7970 Quadfire Eyefinity» . OC3D.net .
  85. ^ « Sony разжигает ценовую войну с PS4 по цене 399 долларов ». CNBC . 11 июня 2013 г.
  86. ^ «Заморозить страницу» . Архивировано из оригинала 16 ноября 2013 года . Проверено 9 мая 2020 г.
  87. ^ «Заморозить страницу» . Архивировано из оригинала 19 декабря 2013 года . Проверено 9 мая 2020 г.
  88. ^ «Заморозить страницу» . Архивировано из оригинала 10 января 2015 года . Проверено 9 мая 2020 г.
  89. ^ «Обзор Radeon R9 295X2 8 ГБ: проект Hydra получает жидкостное охлаждение» . 8 апреля 2014 г.
  90. ^ Перес, Кэрол Э. (13 июля 2017 г.). «Создание блока глубокого обучения AMD Vega мощностью 50 терафлопс менее чем за 3 тысячи долларов» . Машина интуиции . Проверено 26 июля 2017 г.
  91. ^ «lowest_$/fp16 — список сохраненных деталей mattebaughman — двухъядерный процессор Celeron G3930, 2,9 ГГц, Radeon RX VEGA 64, 8 ГБ (3-Way CrossFire), XON-350_BK ATX Mid Tower» . pcpartpicker.com . Проверено 13 сентября 2017 г.
  92. ^ «Системостроитель» . pcpartpicker.com . Проверено 7 декабря 2020 г.
  93. ^ «Характеристики графического процессора AMD Playstation 5» . techpowerup.com . Проверено 12 мая 2021 г.
  94. ^ «Xbox Series X | Xbox» . xbox.com . Проверено 21 сентября 2021 г.
  95. ^ «Nvidia объявляет о выпуске RTX 4090 12 октября, а RTX 4080 — позже» . tomshardware.com . 20 сентября 2022 г. . Проверено 20 сентября 2022 г.
  96. ^ «Обзор AMD Radeon RX 7600: дополнительные обновления» . tomshardware.com . 24 мая 2023 г. . Проверено 24 мая 2023 г.
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 493e01243df451d54138ec56c85cbeb4__1720685220
URL1:https://arc.ask3.ru/arc/aa/49/b4/493e01243df451d54138ec56c85cbeb4.html
Заголовок, (Title) документа по адресу, URL1:
FLOPS - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)