ФЛОПС
Операций с плавающей запятой в секунду ( FLOPS , flops или flop/s ) — это мера производительности компьютера при вычислениях , полезная в областях научных вычислений, требующих вычислений с плавающей запятой . [1]
В таких случаях это более точная мера, чем измерение количества инструкций в секунду . [ нужна ссылка ]
Арифметика с плавающей запятой
[ редактировать ]Имя | Единица | Ценить |
---|---|---|
килофлопс | кфлопс | 10 3 |
мега ФЛОПС | МФЛОПС | 10 6 |
гигафлопс | ГФЛОПС | 10 9 |
береговые шлепки | терафлопс | 10 12 |
пета- флопс | ПФЛОПС | 10 15 |
экса ФЛОПС | ЭФЛОПС | 10 18 |
Зетта ФЛОПС | Зфлопс | 10 21 |
йотта ФЛОПС | ЙФЛОПС | 10 24 |
Ронна ФЛОПС | RFLOPS | 10 27 |
кветта ФЛОПС | КФЛОПС | 10 30 |
Арифметика с плавающей запятой необходима для очень больших или очень маленьких действительных чисел или вычислений, требующих большого динамического диапазона. Представление с плавающей запятой похоже на экспоненциальную запись, за исключением того, что все выполняется по второй, а не по десятичной системе счисления. Схема кодирования хранит знак, показатель степени (по основанию два для Cray и VAX , по основанию два или десять для форматов с плавающей запятой IEEE и по основанию 16 для архитектуры IBM с плавающей запятой ) и мантиссу (число после запятой ). Хотя используется несколько подобных форматов, наиболее распространенным является ANSI/IEEE Std. 754-1985 . Этот стандарт определяет формат для 32-битных чисел, называемых одинарной точностью , а также 64-битных чисел, называемых двойной точностью , и более длинных чисел, называемых расширенной точностью (используемых для промежуточных результатов). Представления с плавающей запятой могут поддерживать гораздо более широкий диапазон значений, чем с фиксированной запятой, с возможностью представления как очень маленьких, так и очень больших чисел. [2]
Динамический диапазон и точность
[ редактировать ]Возведение в степень, свойственное вычислениям с плавающей запятой, обеспечивает гораздо больший динамический диапазон – самые большие и наименьшие числа, которые могут быть представлены – что особенно важно при обработке наборов данных, где некоторые данные могут иметь чрезвычайно широкий диапазон числовых значений или где диапазон может быть непредсказуемым. Таким образом, процессоры с плавающей запятой идеально подходят для приложений с интенсивными вычислениями. [3]
Вычислительная производительность
[ редактировать ]FLOPS и MIPS — это единицы измерения вычислительной производительности компьютера. Операции с плавающей запятой обычно используются в таких областях, как научные вычислительные исследования, а также в машинном обучении . Однако до конца 1980-х годов аппаратное обеспечение для операций с плавающей запятой (можно реализовать арифметику FP в программном обеспечении на любом целочисленном оборудовании) обычно было необязательной функцией, а компьютеры, на которых она была, назывались «научными компьютерами» или производящими « научные вычисления ». "возможность. Таким образом, единица MIPS была полезна для измерения целочисленной производительности любого компьютера, в том числе без такой возможности, а также для учета различий в архитектуре. Аналогичный MOPS (миллион операций в секунду) использовался еще в 1970 году. [4] также. Обратите внимание, что помимо целочисленной арифметики (или арифметики с фиксированной запятой), примеры целочисленных операций включают перемещение данных (от A к B) или проверку значений (если A = B, то C). Вот почему MIPS в качестве показателя производительности подходит, когда компьютер используется для запросов к базе данных, обработки текстов, электронных таблиц или для запуска нескольких виртуальных операционных систем. [5] [6] В 1974 году Дэвид Как ввел термины «флопс» и «мегафлопс» для описания производительности суперкомпьютеров того времени по количеству вычислений с плавающей запятой, которые они выполняли в секунду. [7] Это было намного лучше, чем использование распространенного MIPS для сравнения компьютеров, поскольку эта статистика обычно мало влияла на арифметические возможности машины при выполнении научных задач.
FLOPS в системе HPC можно рассчитать с помощью этого уравнения: [8]
Это можно упростить до наиболее распространенного случая: компьютер, имеющий ровно 1 процессор:
FLOPS могут быть записаны с разными показателями точности, например, список суперкомпьютеров TOP500 ранжирует компьютеры по 64-битным ( формат с плавающей запятой двойной точности ) операциям в секунду, сокращенно FP64 . [9] Аналогичные меры доступны для 32-битных ( FP32 ) и 16-битных ( FP16 ) операций.
Операции с плавающей запятой за такт для различных процессоров
[ редактировать ]Микроархитектура | Архитектура набора команд | ФП64 | ФП32 | РП16 |
---|---|---|---|---|
Процессор Intel | ||||
Интел 80486 | x87 (32-разрядная версия) | ? | 0.128 [11] | ? |
| x87 (32-разрядная версия) | ? | 0.5 [11] | ? |
| ММХ (64-разрядная версия) | ? | 1 [12] | ? |
Intel P6 Пентиум III | ССЕ (64-разрядная версия) | ? | 2 [12] | ? |
Intel NetBurst Pentium 4 (Уилламетт, Нортвуд) | SSE2 (64-разрядная версия) | 2 | 4 | ? |
Intel P6 Пентиум М | SSE2 (64-разрядная версия) | 1 | 2 | ? |
SSE3 (64-разрядная версия) | 2 | 4 | ? | |
4 | 8 | ? | ||
Intel Atom ( Боннелл , Солтвелл , Сильвермонт и Голдмонт ) | SSE3 (128-бит) | 2 | 4 | ? |
Intel Sandy Bridge ( Сэнди Бридж , Айви Бридж ) | AVX (256-бит) | 8 | 16 | 0 |
| AVX2 и FMA (256-бит) | 16 | 32 | 0 |
Intel Xeon Phi ( Рыцарский уголок ) | IMCI (512-битный) | 16 | 32 | 0 |
| AVX-512 и FMA (512-бит) | 32 | 64 | 0 |
Процессор AMD | ||||
AMD Бобкэт | AMD64 (64-разрядная версия) | 2 | 4 | 0 |
4 | 8 | 0 | ||
АМД К10 | SSE4/4a (128-бит) | 4 | 8 | 0 |
АМД Бульдозер [13] ( Сваедрайвер , Паровой каток , Экскаватор ) | 4 | 8 | 0 | |
AVX2 и FMA (128-битное, 256-битное декодирование) [18] | 8 | 16 | 0 | |
AVX2 и FMA (256-бит) | 16 | 32 | 0 | |
ARM-процессор | ||||
ARM Cortex-A7, A9, A15 | ARMv7 | 1 | 8 | 0 |
ARM Кортекс-А32, А35 | ARMv8 | 2 | 8 | 0 |
ARM Cortex-A53 , A55 , A57 , [13] А72 , А73 , А75 | ARMv8 | 4 | 8 | 0 |
ARM Cortex-A76 , A77 , A78 | ARMv8 | 8 | 16 | 0 |
ARM Кортекс-X1 | ARMv8 | 16 | 32 | ? |
Qualcomm Крайт | ARMv8 | 1 | 8 | 0 |
Qualcomm Крио (1xx - 3xx) | ARMv8 | 2 | 8 | 0 |
Qualcomm Крио (4xx - 5xx) | ARMv8 | 8 | 16 | 0 |
Samsung Exynos M1 и M2 | ARMv8 | 2 | 8 | 0 |
Samsung Exynos M3 и M4 | ARMv8 | 3 | 12 | 0 |
IBM PowerPC A2 (Blue Gene/Q) | ? | 8 | 8 (как FP64) | 0 |
Хитачи СХ-4 [20] [21] | Ш-4 | 1 | 7 | 0 |
графический процессор NVIDIA | ||||
Nvidia Curie ( серия GeForce 6 и серия GeForce 7 ) | ПТХ | ? | 8 | ? |
Nvidia Tesla 2.0 (GeForce GTX 260–295) | ПТХ | ? | 2 | ? |
Nvidia Fermi (только GeForce GTX 465–480, 560 Ti, 570–590) | ПТХ | 1/4 (заблокировано драйвером, 1 аппаратно) | 2 | 0 |
Nvidia Fermi (только Quadro 600–2000) | ПТХ | 1/8 | 2 | 0 |
Nvidia Fermi (только Quadro 4000–7000, Tesla) | ПТХ | 1 | 2 | 0 |
Nvidia Kepler (GeForce (кроме Titan и Titan Black), Quadro (кроме K6000), Tesla K10) | ПТХ | 1/12 (для GK110 : блокируется драйвером, 2/3 аппаратно) | 2 | 0 |
Nvidia Kepler (GeForce GTX Titan и Titan Black, Quadro K6000, Tesla (кроме K10)) | ПТХ | 2/3 | 2 | 0 |
ПТХ | 1/16 | 2 | 1/32 | |
Nvidia Pascal (только Quadro GP100 и Tesla P100) | ПТХ | 1 | 2 | 4 |
Нвидиа Вольта [22] | ПТХ | 1 | 2 ( ФП32 ) + 2 ( INT32 ) | 16 |
Nvidia Turing (только GeForce 16XX ) | ПТХ | 1/16 | 2 (ФП32) + 2 (ИНТ32) | 4 |
Nvidia Turing (все, кроме GeForce 16XX ) | ПТХ | 1/16 | 2 (ФП32) + 2 (ИНТ32) | 16 |
Нвидиа Ампер [23] [24] (только Тесла А100/А30) | ПТХ | 2 | 2 (ФП32) + 2 (ИНТ32) | 32 |
Nvidia Ampere (все GeForce и Quadro, Tesla A40/A10) | ПТХ | 1/32 | 2 (FP32) + 0 (INT32) или 1 (FP32) + 1 (INT32) | 8 |
AMD графический процессор | ||||
AMD TeraScale 1 ( серия Radeon HD 4000 ) | ТераСкейл 1 | 0.4 | 2 | ? |
AMD TeraScale 2 ( серия Radeon HD 5000 ) | ТераСкейл 2 | 1 | 2 | ? |
AMD TeraScale 3 ( серия Radeon HD 6000 ) | ТераСкейл 3 | 1 | 4 | ? |
AMD GCN (только Radeon Pro W 8100–9100) | GCN | 1 | 2 | ? |
AMD GCN (все, кроме Radeon Pro W 8100–9100, Vega 10–20) | GCN | 1/8 | 2 | 4 |
AMD GCN Вега 10 | GCN | 1/8 | 2 | 4 |
AMD GCN Vega 20 (только Radeon VII) | GCN | 1/2 (заблокировано драйвером, 1 аппаратно) | 2 | 4 |
AMD GCN Vega 20 (только Radeon Instinct MI50/MI60 и Radeon Pro VII) | GCN | 1 | 2 | 4 |
РДНА | 1/8 | 2 | 4 | |
AMD RDNA3 | РДНА | 1/8? | 4 | 8? |
AMD CDNA | CDNA | 1 | 4 (Тензор) [27] | 16 |
AMD CDNA 2 | CDNA 2 | 4 (Тензор) | 4 (Тензор) | 16 |
графический процессор Intel | ||||
Intel Xe-LP (Iris Xe MAX) [28] | Машина | 1/2? | 2 | 4 |
Intel Xe-HPG (Дуговой алхимик) [28] | Машина | 0 | 2 | 16 |
Intel Xe-HPC (старый мост) [29] | Машина | 2 | 2 | 32 |
графический процессор Qualcomm | ||||
Qualcomm Адрено 5x0 | Адрено 5xx | 1 | 2 | 4 |
Qualcomm Адрено 6x0 | Адрено 6xx | 1 | 2 | 4 |
Графкор | ||||
Графкор Колосс GC2 [30] [31] | ? | 0 | 16 | 64 |
? | 0 | 32 | 128 | |
Суперкомпьютер | ||||
ЭНИАК @ 100 кГц в 1945 году. | 0.004 [34] (~0,00000003 ФЛОПС/ Вт ) | |||
48-битный процессор с частотой 208 кГц в CDC 1604 в 1960 году. | ||||
60-битный процессор с частотой 10 МГц в CDC 6600 в 1964 году. | 0,3 (ФП60) | |||
60-битный процессор с частотой 10 МГц в CDC 7600 в 1967 году. | 1,0 (ФП60) | |||
Cray-1 @ 80 МГц в 1976 году. | 2 (700 ФЛОПС/Вт) | |||
CDC Cyber 205 @ 50 МГц в 1981 году ФОРТРАН компилятор (ANSI 77 с векторными расширениями) | 8 | 16 | ||
Транспьютер IMS T800-20 @ 20 МГц 1987 г. | 0.08 [35] | |||
Параллельный E16 @ 1000 МГц в 2012 г. | 2 [36] (5,0 ГФЛОПС/Вт) [37] | |||
Параллельный E64 @ 800 МГц в 2012 г. | 2 [38] (50,0 ГФЛОПС/Вт) [37] | |||
Микроархитектура | Архитектура набора команд | ФП64 | ФП32 | РП16 |
Рекорды производительности
[ редактировать ]Записи одного компьютера
[ редактировать ]В июне 1997 года Intel ASCI Red стал первым в мире компьютером, достигшим производительности в один терафлопс и выше. Директор Sandia Билл Кэмп заявил, что ASCI Red обладает лучшей надежностью из всех когда-либо созданных суперкомпьютеров и «является высшим достижением суперкомпьютеров по долговечности, цене и производительности». [39]
Суперкомпьютер NEC производительность которого SX-9 стал первым в мире векторным процессором, превысила 100 гигафлопс на одно ядро.
анонсировал новый компьютер В июне 2006 года японский исследовательский институт RIKEN — MDGRAPE-3 . Максимальная производительность компьютера составляет один петафлопс, что почти в два раза выше, чем у Blue Gene/L, но MDGRAPE-3 не является компьютером общего назначения, поэтому он не фигурирует в списке Top500.org . Он имеет специальные конвейеры для моделирования молекулярной динамики.
К 2007 году корпорация Intel представила экспериментальный многоядерный чип POLARIS , производительность которого достигает 1 терафлопс на частоте 3,13 ГГц. 80-ядерный чип способен поднять этот результат до 2 терафлопс на частоте 6,26 ГГц, хотя тепловыделение на этой частоте превышает 190 Вт. [40]
В июне 2007 года сайт Top500.org сообщил, что самым быстрым компьютером в мире является суперкомпьютер IBM Blue Gene/L с пиковой производительностью 596 терафлопс. [41] Cray XT4 занял второе место с производительностью 101,7 терафлопс.
26 июня 2007 года IBM анонсировала второе поколение своего лучшего суперкомпьютера, получившего название Blue Gene/P и предназначенного для непрерывной работы на скоростях, превышающих один петафлопс, что быстрее, чем Blue Gene/L. При такой настройке он может достигать скорости, превышающей три петафлопс. [42]
25 октября 2007 года NEC японская корпорация выпустила пресс-релиз, анонсирующий модель SX-9 серии SX . [43] утверждая, что это самый быстрый векторный суперкомпьютер в мире. SX -9 оснащен первым процессором, способным обеспечить пиковую векторную производительность 102,4 гигафлопс на одно ядро.
4 февраля 2008 года Национальный научный фонд и Техасский университет в Остине открыли полномасштабные исследования суперкомпьютера AMD и Sun под названием Ranger . [44] самая мощная в мире суперкомпьютерная система для открытых научных исследований, работающая с постоянной скоростью 0,5 петафлопс.
25 мая 2008 года американский суперкомпьютер построенный IBM , Roadrunner , достиг вычислительной вехи в один петафлопс. Он возглавил список TOP500 самых мощных суперкомпьютеров за июнь 2008 г. и ноябрь 2008 г. (исключая грид-компьютеры ). [45] [46] Компьютер расположен в Национальной лаборатории Лос-Аламоса в Нью-Мексико. Название компьютера отсылает к птице штата Нью-Мексико , большому дорожному бегуну ( Geococcyx Californianus ). [47]
В июне 2008 года AMD выпустила серию ATI Radeon HD 4800, которые, как сообщается, стали первыми графическими процессорами, достигающими производительности в один терафлопс. 12 августа 2008 года AMD выпустила видеокарту ATI Radeon HD 4870X2 с двумя графическими процессорами Radeon R770 общей производительностью 2,4 терафлопс.
В ноябре 2008 года модернизация суперкомпьютера Cray Jaguar в Окриджской национальной лаборатории (ORNL) Министерства энергетики (DOE) увеличила вычислительную мощность системы до пиковых 1,64 петафлопс, что сделало Jaguar первой в мире петафлопс-системой, предназначенной для открытых исследований . В начале 2009 года суперкомпьютер был назван в честь мифического существа Кракена . Kraken был объявлен самым быстрым в мире суперкомпьютером, управляемым университетом, и шестым по скорости в списке TOP500 2009 года. В 2010 году Kraken был модернизирован и теперь может работать быстрее и мощнее.
В 2009 году Cray Jaguar показал производительность 1,75 петафлопс, опередив IBM Roadrunner и заняв первое место в списке TOP500 . [48]
В октябре 2010 года Китай представил Tianhe-1 , суперкомпьютер, который работает с пиковой вычислительной скоростью 2,5 петафлопс. [49] [50]
По состоянию на 2010 год [update] самый быстрый процессор ПК достиг 109 гигафлопс ( Intel Core i7 980 XE ) [51] в вычислениях двойной точности. Графические процессоры значительно мощнее. Например, вычислительные процессоры Nvidia Tesla C2050 GPU имеют производительность около 515 гигафлопс. [52] в вычислениях двойной точности, а максимальная производительность AMD FireStream 9270 составляет 240 гигафлопс. [53]
В ноябре 2011 года было объявлено, что Япония достигла производительности своего компьютера K 10,51 петафлопс . [54] Он имеет 88 128 SPARC64 VIIIfx процессоров в 864 стойках с теоретической производительностью 11,28 петафлопс. Он назван в честь японского слова « кей », что означает 10 квадриллионов . [55] что соответствует целевой скорости 10 петафлопс.
15 ноября 2011 года Intel продемонстрировала один процессор на базе x86 под кодовым названием Knights Corner, обеспечивающий производительность более терафлопс в широком диапазоне операций DGEMM . Во время демонстрации Intel подчеркнула, что это устойчивая производительность в терафлопс (а не «необработанные терафлопс», используемые другими для получения более высоких, но менее значимых чисел), и что это был первый процессор общего назначения, когда-либо преодолевший терафлопс. [56] [57]
18 июня 2012 года суперкомпьютерная система Sequoia компании IBM , базирующаяся в Ливерморской национальной лаборатории им. Лоуренса (LLNL), достигла производительности 16 петафлопс, установив мировой рекорд и заняв первое место в последнем списке TOP500. [58]
12 ноября 2012 года список TOP500 признал Titan самым быстрым суперкомпьютером в мире согласно тесту LINPACK с производительностью 17,59 петафлопс. [59] [60] Он был разработан компанией Cray Inc. в Национальной лаборатории Ок-Ридж и сочетает в себе процессоры AMD Opteron и технологии графических процессоров (GPU) NVIDIA Tesla «Kepler». [61] [62]
10 июня 2013 года китайский Tianhe-2 был признан самым быстрым в мире с производительностью 33,86 петафлопс. [63]
20 июня 2016 года китайский Sunway TaihuLight был признан самым быстрым в мире с 93 петафлопсами по тесту LINPACK (из 125 пиковых петафлопс). Система была установлена в Национальном суперкомпьютерном центре в Уси и обеспечивала более высокую производительность, чем пять следующих самых мощных систем в списке TOP500 вместе взятых. [64]
В июне 2019 года суперкомпьютер Summit , построенный IBM и сейчас работающий в Окриджской национальной лаборатории (ORNL) Министерства энергетики (DOE), занял первое место с производительностью 148,6 петафлопс в тесте High Performance Linpack (HPL), эталонном тесте. используется для ранжирования списка TOP500. Summit имеет 4356 узлов, каждый из которых оснащен двумя 22-ядерными процессорами Power9 и шестью графическими процессорами NVIDIA Tesla V100. [65]
В июне 2022 года американский суперкомпьютер Frontier стал самым мощным суперкомпьютером в рейтинге TOP500, достигнув 1102 петафлопс (1,102 эксафлопс) по тестам LINPACK. [66]
Записи распределенных вычислений
[ редактировать ]Распределенные вычисления используют Интернет для связи персональных компьютеров для достижения большего количества FLOPS:
- По состоянию на апрель 2020 г. [update]Общая вычислительная мощность сети Folding@home превышает 2,3 экзафлопс. [67] [68] [69] [70] Это самая мощная распределенная компьютерная сеть, первая в истории, преодолевшая 1 экзафлопс общей вычислительной мощности. Такой уровень производительности в первую очередь обеспечивается совокупными усилиями огромного количества мощных блоков графического процессора и процессора . [71]
- По состоянию на декабрь 2020 г. [update]Средняя производительность всей сети BOINC составляет около 31 петафлопс. [72]
- По состоянию на июнь 2018 г. [update]SETI @home , использующая программную платформу BOINC , имеет среднюю производительность 896 терафлопс. [73]
- По состоянию на июнь 2018 г. [update], Einstein@Home , проект, использующий сеть BOINC , работает на скорости 3 петафлопс. [74]
- По состоянию на июнь 2018 г. [update]MilkyWay @home , используя инфраструктуру BOINC , обеспечивает производительность 847 терафлопс. [75]
- По состоянию на июнь 2020 г. [update]GIMPS простых при поиске чисел Мерсенна выдерживает производительность 1354 терафлопс. [76]
Стоимость вычислений
[ редактировать ]Стоимость оборудования
[ редактировать ]Дата | Приблизительная цена в долларах США за гигафлопс | Платформа, обеспечивающая самую низкую стоимость за гигафлопс | Комментарии | |
---|---|---|---|---|
Нескорректированный | 2023 [77] | |||
1945 | 130 триллионов долларов | 2 квадриллиона долларов | ЭНИАК : 487 000 долларов в 1945 году и 7 916 000 долларов в 2022 году. | 487 000 долларов США / 0,000 000 385 ГФЛОПС . Электронно-цифровой компьютер первого поколения ( на основе электронных ламп ). |
1961 | 20 миллиардов долларов | 204 миллиарда долларов | базовой установки IBM 7030 Stretch Стоимость на тот момент составляла 7,78 миллиона долларов США каждая. | IBM 7030 Stretch выполняет одно умножение чисел с плавающей запятой каждые 2,4 микросекунды . [78] Компьютер второго поколения ( на транзисторах ). |
1984 | $20,000,000 | $100,000,000 | Крей X-MP /48 | 15 000 000 долларов США / 0,8 ГФЛОПС . Компьютер третьего поколения ( на базе интегральной схемы ). |
1997 | $30,000 | $57,000 | Два 16-процессорных кластера Beowulf с Pentium Pro микропроцессорами [79] | |
апрель 2000 г. | $1,000 | $2,000 | Скопление Буньип Беовульф | Bunyip был первой вычислительной технологией стоимостью менее доллара США 1 за MFLOPS . В 2000 году он получил премию Гордона Белла. |
май 2000 г. | $640 | $1,000 | КЛАТ2 | KLAT2 была первой вычислительной технологией, которая масштабировалась для больших приложений, сохраняя при этом стоимость менее 1 доллара США за MFLOPS . [80] |
август 2003 г. | $90 | $100 | КАСЫ0 | KASY0 была первой вычислительной технологией стоимостью менее 100 долларов США за гигафлопс . [81] |
август 2007 г. | $50 | $70 | Микровульф | По состоянию на август 2007 года этот «персональный» кластер Beowulf производительностью 26 гигафлопс можно построить за 1256 долларов. [82] |
март 2011 г. | $1.80 | $2 | HPU4Наука | Этот кластер стоимостью 30 000 долларов был построен с использованием только коммерчески доступного оборудования «геймерского» уровня. [83] |
август 2012 г. | $0.75 | $1 | Четырехъядерная AMD Radeon 7970 система | Настольный компьютер с четырехъядерным процессором AMD Radeon 7970, обеспечивающий вычислительную производительность 16 терафлопс одинарной точности и 4 терафлопс двойной точности. Общая стоимость системы составила 3000 долларов; построен с использованием только коммерчески доступного оборудования. [84] |
июнь 2013 г. | $0.22 | $0.3 | Сони PlayStation 4 | Sony PlayStation 4 имеет пиковую производительность 1,84 терафлопс по цене 400 долларов. [85] |
ноябрь 2013 г. | $0.16 | $0.21 | AMD Sempron 145 и GeForce GTX 760 Система | Построенная с использованием имеющихся в продаже комплектующих, система с использованием одного AMD Sempron 145 и трех Nvidia GeForce GTX 760 достигает общей производительности 6,771 терафлопс при общей стоимости 1090,66 долларов США . [86] |
декабрь 2013 г. | $0.12 | $0.16 | Pentium G550 и Radeon R9 290 Система | Построен с использованием имеющихся в продаже деталей. Intel Pentium G550 и AMD Radeon R9 290 имеют максимальную производительность 4,848 терафлопс на общую сумму 681,84 доллара США . [87] |
Январь 2015 г. | $0.08 | $0.1 | Celeron G1830 и Radeon R9 295X2 Система | Построен с использованием имеющихся в продаже деталей. Intel Celeron G1830 и AMD Radeon R9 295X2 имеют максимальную производительность более 11,5 терафлопс при общей сумме 902,57 долларов США . [88] [89] |
июнь 2017 г. | $0.06 | $0.07 | AMD Ryzen 7 1700 и AMD Radeon Vega Frontier Edition Система | Построен с использованием имеющихся в продаже деталей. Процессор AMD Ryzen 7 1700 в сочетании с картами AMD Radeon Vega FE в режиме CrossFire обеспечивает максимальную производительность более 50 терафлопс при цене чуть менее 3000 долларов США за всю систему. [90] |
Октябрь 2017 г. | $0.03 | $0.04 | Intel Celeron G3930 и AMD RX Vega 64 Система | Построен с использованием имеющихся в продаже деталей. Три AMD RX Vega 64 обеспечивают производительность чуть более 75 терафлопс с половинной точностью (38 терафлопс SP или 2,6 терафлопс DP в сочетании с ЦП) при цене ~ 2050 долларов за всю систему. видеокарты [91] |
ноябрь 2020 г. | $0.03 | $0.03 | AMD Ryzen 3600 и 3 × NVIDIA RTX 3080 Система | AMD Ryzen 3600 @ 484 гигафлопс и 199,99 долларов США 3 × NVIDIA RTX 3080 с производительностью 29 770 гигафлопс каждая и 699,99 долларов США. Общий объем системы GFLOPS = 89 794 / TFLOPS = 89,2794 Общая стоимость системы, вкл. реалистичные, но недорогие детали; соответствует другому примеру = $2839 [92] Доллар США /ГФЛОП = 0,0314 доллара США |
ноябрь 2020 г. | $0.04 | $0.04 | PlayStation 5 | Sony PlayStation 5 Digital Edition имеет пиковую производительность 10,28 терафлопс (20,58 терафлопс при половинной точности) при розничной цене 399 долларов. [93] |
ноябрь 2020 г. | $0.04 | $0.04 | Xbox серии X | от Microsoft Xbox Series X имеет максимальную производительность 12,15 терафлопс (24,30 терафлопс при половинной точности) при розничной цене 499 долларов. [94] |
сентябрь 2022 г. | $0.02 | $0.02 | РТХ 4090 | У Nvidia RTX 4090 заявлена пиковая производительность 82,6 терафлопс (1,32 терафлопс при 8-битной точности) при розничной цене 1599 долларов. [95] |
май 2023 г. | $0.01 | $0.01 | Радеон РХ 7600 | AMD RX 7600 имеет пиковую производительность 21,5 терафлопс при розничной цене 269 долларов. [96] |
См. также
[ редактировать ]Ссылки
[ редактировать ]- ^ «Понимание показателей производительности суперкомпьютера и емкости системы хранения» . kb.iu.edu . Проверено 23 марта 2024 г.
- ^ Плавающая точка Получено 25 декабря 2009 г.
- ^ Краткое описание: Фиксированная точка (целое число) и плавающая точка. Архивировано 31 декабря 2009 г. на Wayback Machine. Проверено 25 декабря 2009 г.
- ^ Техническое примечание НАСА . Национальное управление по аэронавтике и исследованию космического пространства. 1970.
- ^ Фиксированная и плавающая точка. Проверено 25 декабря 2009 г.
- ^ Манипулирование данными и математические расчеты. Проверено 25 декабря 2009 г.
- ^ Кук, диджей (1974). Основы производительности компьютерной системы . Министерство торговли США, Национальное бюро стандартов.
- ^ « Узлы, сокеты, ядра и флопсы, о боже» доктора Марка Р. Фернандеса, доктора философии». Архивировано из оригинала 13 февраля 2019 года . Проверено 12 февраля 2019 г.
- ^ «ЧАСТО ЗАДАВАЕМЫЕ ВОПРОСЫ» . top500.org . Проверено 23 июня 2020 г.
- ^ «Операций с плавающей запятой в секунду (флопс)» .
- ^ Перейти обратно: а б «home.iae.nl» .
- ^ Перейти обратно: а б «Вычислительная мощность на протяжении всей истории» . Альтернативные войны.com . Проверено 13 февраля 2021 г.
- ^ Перейти обратно: а б с д и Дольбо, Ромен (2017). «Теоретический пик FLOPS на набор инструкций: учебное пособие». Журнал суперкомпьютеров . 74 (3): 1341–1377. дои : 10.1007/s11227-017-2177-5 . S2CID 3540951 .
- ^ «Поддержка новых инструкций для Bulldozer (FMA3) и Piledriver (FMA3+4 и CVT, BMI, TBM)» (PDF) .
- ^ «Блог Агнера о процессорах — результаты тестов AMD Ryzen» .
- ^ https://arstechnica.com/gadgets/2017/03/amds-moment-of-zen-finally-an-architecture-that-can-compete/2/ «каждое ядро теперь имеет пару 128-битных блоков FMA. свой собственный»
- ^ Майк Кларк (23 августа 2016 г.). Новая базовая архитектура x86 для вычислений следующего поколения (PDF) . ХотЧипс 28. AMD. Архивировано из оригинала (PDF) 31 июля 2020 г. Проверено 8 октября 2017 г. страница 7
- ^ «Микроархитектура процессоров Intel и AMD» (PDF) .
- ^ «Выступление генерального директора AMD Лизы Су на выставке COMPUTEX 2019» . youtube.com . Архивировано из оригинала 11 декабря 2021 года.
- ^ «Развлекательные системы и высокопроизводительный процессор SH-4» (PDF) . Обзор Хитачи . 48 (2). Хитачи : 58–63. 1999 . Проверено 21 июня 2019 г.
- ^ «Архитектура DSP нового поколения SH-4 для VoIP» (PDF) . Хитачи . 2000 . Проверено 21 июня 2019 г.
- ^ «Внутри Volta: самый продвинутый в мире графический процессор для центров обработки данных» . 10 мая 2017 г.
- ^ «Подробное описание архитектуры NVIDIA Ampere» . 14 мая 2020 г.
- ^ «Графические процессоры NVIDIA A100 обеспечивают работу современного центра обработки данных» . NVIDIA .
- ^ Шиллинг, Андреас (10 июня 2019 г.). «Архитектура RDNA — страница 2» . Аппаратное обеспечениеluxx .
- ^ «Характеристики AMD Radeon RX 5700 XT» . TechPowerUp .
- ^ «Ускоритель AMD Instinct MI100» .
- ^ Перейти обратно: а б «Введение в архитектуру Xe-HPG» .
- ^ «Intel Data Center GPU Max» . 9 ноября 2022 г.
- ^ «250 Тфлопс/с для двух чипов со смешанной точностью FP16» . youtube.com .
- ^ Архивировано в Ghostarchive и Wayback Machine : «Оценка по энергопотреблению: FP32 составляет 1/4 от FP16, а тактовая частота ниже 1,5 ГГц» . youtube.com .
- ^ Архивировано в Ghostarchive и Wayback Machine : «Представляем системы Graphcore Mk2 IPU» . youtube.com .
- ^ «Лук-2000 ИПУ-Машина» . docs.graphcore.ai/ .
- ^ ENIAC]] @ 100 кГц с 385 флопами «Компьютеры прошлого» . Clear.rice.edu . Проверено 26 февраля 2021 г.
- ^ «Архитектура IMS T800» . Transputer.net . Проверено 28 декабря 2023 г.
- ^ 16-ядерный 65-нм микропроцессор Epiphany-III (E16G301) // администратор (19 августа 2012 г.)
- ^ Перейти обратно: а б Фельдман, Майкл (22 августа 2012 г.). «Adapteva представляет 64-ядерный чип» . HPCWire . Проверено 3 сентября 2014 г.
- ^ 64-ядерный 28-нм микропроцессор Epiphany-IV (E64G401) // администратор (19 августа 2012 г.)
- ^ «ASCI Red компании Sandia, первый в мире суперкомпьютер с терафлопной производительностью, выведен из эксплуатации» (PDF) . Архивировано из оригинала (PDF) 5 ноября 2010 г. Проверено 17 ноября 2011 г.
- ^ Ричард Суинберн (30 апреля 2007 г.). «Прибытие компьютеров TeraFLOP» . bit-tech.net . Проверено 9 февраля 2012 г.
- ^ «Выпущен 29-й список TOP500 самых быстрых суперкомпьютеров в мире» . Top500.org . 23 июня 2007. Архивировано из оригинала 9 мая 2008 года . Проверено 8 июля 2008 г.
- ^ «Июнь 2008 года» . ТОП500 . Проверено 8 июля 2008 г.
- ^ «NEC представляет самый быстрый в мире векторный суперкомпьютер SX-9» . НЭК. 25 октября 2007 года . Проверено 8 июля 2008 г.
- ^ «Техасский университет в Остине, Техасский центр передовых вычислений» . Архивировано из оригинала 1 августа 2009 года . Проверено 13 сентября 2010 г.
Любой исследователь в институте США может подать заявку на распределение циклов в системе.
- ^ Шэрон Годен (9 июня 2008 г.). «Roadrunner от IBM преодолевает 4-минутную милю суперкомпьютеров» . Компьютерный мир. Архивировано из оригинала 24 декабря 2008 года . Проверено 10 июня 2008 г.
- ^ «Остин ISC08» . Топ500.org. 14 ноября 2008 года. Архивировано из оригинала 22 февраля 2012 года . Проверено 9 февраля 2012 г.
- ^ Филдс, Джонатан (9 июня 2008 г.). «Суперкомпьютер задает темп в петафлопе» . Новости Би-би-си . Проверено 8 июля 2008 г.
- ^ Гринберг, Энди (16 ноября 2009 г.). «Крей свергает IBM с трона в области суперкомпьютеров» . Форбс .
- ^ «Китай претендует на корону суперкомпьютера» . Новости Би-би-си. 28 октября 2010 г.
- ^ Диллоу, Клей (28 октября 2010 г.). «Китай представляет суперкомпьютер мощностью 2507 петафлопс, самый быстрый в мире» . Popsci.com . Проверено 9 февраля 2012 г.
- ^ «Intel Core i7-980X Extreme Edition — готовы к плохим результатам?: Математика: Сандра Арифметика, криптография, Microsoft Excel» . Техгейдж . 10 марта 2010 года . Проверено 9 февраля 2012 г.
- ^ «Персональный суперкомпьютер NVIDIA Tesla» . Nvidia.com . Проверено 9 февраля 2012 г.
- ^ «Вычислительный ускоритель графического процессора AMD FireStream 9270» . Amd.com . Проверено 9 февраля 2012 г.
- ^ « Компьютер K достиг цели в 10 петафлопс» . Fujitsu.com . Проверено 9 февраля 2012 г.
- ^ См. японские цифры .
- ^ «Уголок Intel's Knights: 50+ ядерный 22-нм сопроцессор» . 16 ноября 2011 года . Проверено 16 ноября 2011 г.
- ^ «Intel представляет Knight's Corner с производительностью 1 терафлопс/с» . Проверено 16 ноября 2011 г.
- ^ Кларк, Дон (18 июня 2012 г.). «Компьютер IBM устанавливает рекорд скорости» . Уолл Стрит Джорнал . Проверено 18 июня 2012 г.
- ^ «Американский суперкомпьютер Titan оказался самым быстрым в мире» . Би-би-си. 12 ноября 2012 года . Проверено 28 февраля 2013 г.
- ^ «Ок-Ридж претендует на первое место в последнем списке TOP500 с Titan | TOP500 суперкомпьютерных сайтов» . Топ500.org. 12 ноября 2012 года . Проверено 28 февраля 2013 г.
- ^ Монтальбано, Элизабет (11 октября 2011 г.). «Лаборатория Ок-Ридж создает самый быстрый суперкомпьютер» . Информационная неделя . Проверено 9 февраля 2012 г.
- ^ Тибкен, Шара (29 октября 2012 г.). «Суперкомпьютер Titan дебютирует для открытых научных исследований | Cutting Edge» . Новости.CNet.com . Проверено 28 февраля 2013 г.
- ^ «Китайский суперкомпьютер теперь самый быстрый в мире – с большим отрывом» . Журнал Форбс . 17 июня 2013 года . Проверено 17 июня 2013 г.
- ^ Фельдман, Майкл. «Китай лидирует в списке ТОП-500 суперкомпьютеров, положив конец превосходству США» . Top500.org . Проверено 31 декабря 2016 г.
- ^ «Июнь 2018» . Top500.org . Проверено 17 июля 2018 г.
- ^ https://en.wikipedia.org/wiki/TOP500
- ^ «Активные процессоры и графические процессоры Folding@Home в зависимости от ОС» . Foldingathome.org . Проверено 8 апреля 2020 г.
- ^ Folding@home (25 марта 2020 г.). «Благодаря нашему УДИВИТЕЛЬНОму сообществу мы преодолели барьер exaFLOP! Это более 1 000 000 000 000 000 000 операций в секунду, что делает нас примерно в 10 раз быстрее, чем IBM Summit! pic.twitter.com/mPMnb4xdH3» . @foldingathome . Проверено 4 апреля 2020 г.
- ^ «Folding@Home преодолевает экзафлопсный барьер, теперь быстрее, чем десятки суперкомпьютеров — ExtremeTech» . Extremetech.com . Проверено 4 апреля 2020 г.
- ^ «Folding@Home превышает 1,5 ExaFLOPS в борьбе с Covid-19» . ТехСпот . 26 марта 2020 г. Проверено 4 апреля 2020 г.
- ^ «Поддержка Sony Computer Entertainment проекта Folding@home на PlayStation™3 получила в этом году золотую награду за хороший дизайн» ( пресс-релиз). Sony Computer Entertainment Inc., 6 ноября 2008 г. Архивировано из оригинала 31 января 2009 г. Проверено 11 декабря 2008 г.
- ^ «Вычислительная мощность BOINC» . БОИНК . Проверено 28 декабря 2020 г.
- ^ «Обзор кредитов SETI@Home» . БОИНК . Проверено 15 июня 2018 г.
- ^ «Обзор Einstein@Home Credit» . БОИНК . Проверено 15 июня 2018 г.
- ^ «Обзор кредитов MilkyWay@Home» . БОИНК . Проверено 15 июня 2018 г.
- ^ «Технология распределенных вычислений Internet PrimeNet Server для эффективного поиска простых чисел Мерсенна в Интернете» . ГИМПЫ . Проверено 15 июня 2018 г.
- ^ 1634–1699: Маккаскер, Джей-Джей (1997). Сколько это в реальных деньгах? Исторический индекс цен для использования в качестве дефлятора денежных ценностей в экономике Соединенных Штатов: Addenda et Corrigenda (PDF) . Американское антикварное общество . 1700–1799: Маккаскер, Джей-Джей (1992). Сколько это в реальных деньгах? Исторический индекс цен для использования в качестве дефлятора денежных ценностей в экономике Соединенных Штатов (PDF) . Американское антикварное общество . 1800 – настоящее время: Федеральный резервный банк Миннеаполиса. «Индекс потребительских цен (оценка) 1800–» . Проверено 29 февраля 2024 г.
- ^ «IBM 7030 (СТРЕТЧ)» . Норман Харди . Проверено 24 февраля 2017 г.
- ^ «Локи и Хиглак» . Локи-www.lanl.gov. 13 июля 1997 года. Архивировано из оригинала 21 июля 2011 года . Проверено 9 февраля 2012 г.
- ^ «Тестовый стенд Linux Athlon 2 в Кентукки (KLAT2)» . Агрегат . Проверено 9 февраля 2012 г.
- ^ «КАСЫ0» . Агрегат . 22 августа 2003 года . Проверено 9 февраля 2012 г.
- ^ «Микроульф: персональный портативный кластер «Беовульф»» . Архивировано из оригинала 12 сентября 2007 года . Проверено 9 февраля 2012 г.
- ^ Адам Стивенсон, Янн Ле Дю и Марием Эль Африт. « Высокопроизводительные вычисления на игровых ПК ». Арс Техника . 31 марта 2011 г.
- ^ Том Логан (9 января 2012 г.). «Обзор HD7970 Quadfire Eyefinity» . OC3D.net .
- ^ « Sony разжигает ценовую войну с PS4 по цене 399 долларов ». CNBC . 11 июня 2013 г.
- ^ «Заморозить страницу» . Архивировано из оригинала 16 ноября 2013 года . Проверено 9 мая 2020 г.
- ^ «Заморозить страницу» . Архивировано из оригинала 19 декабря 2013 года . Проверено 9 мая 2020 г.
- ^ «Заморозить страницу» . Архивировано из оригинала 10 января 2015 года . Проверено 9 мая 2020 г.
- ^ «Обзор Radeon R9 295X2 8 ГБ: проект Hydra получает жидкостное охлаждение» . 8 апреля 2014 г.
- ^ Перес, Кэрол Э. (13 июля 2017 г.). «Создание блока глубокого обучения AMD Vega производительностью 50 терафлопс менее чем за 3 тысячи долларов» . Машина интуиции . Проверено 26 июля 2017 г.
- ^ «lowest_$/fp16 — список сохраненных деталей mattebaughman — двухъядерный процессор Celeron G3930 2,9 ГГц, Radeon RX VEGA 64 8 ГБ (3-Way CrossFire), XON-350_BK ATX Mid Tower» . pcpartpicker.com . Проверено 13 сентября 2017 г.
- ^ «Системостроитель» . pcpartpicker.com . Проверено 7 декабря 2020 г.
- ^ «Характеристики графического процессора AMD Playstation 5» . techpowerup.com . Проверено 12 мая 2021 г.
- ^ «Xbox Series X | Xbox» . xbox.com . Проверено 21 сентября 2021 г.
- ^ «Nvidia объявляет о выпуске RTX 4090 12 октября, а RTX 4080 — позже» . tomshardware.com . 20 сентября 2022 г. . Проверено 20 сентября 2022 г.
- ^ «Обзор AMD Radeon RX 7600: дополнительные обновления» . tomshardware.com . 24 мая 2023 г. . Проверено 24 мая 2023 г.