Jump to content

Флопс

(Перенаправлено из TFLOPS )

Операции с плавающей запятой в секунду ( провалы , провалы или флоп/с ) являются мерой производительности компьютера в вычислениях , полезных в областях научных вычислений, которые требуют расчетов с плавающей точкой . [ 1 ]

Для таких случаев это более точная мера, чем измерение инструкций в секунду . [ Цитация необходима ]

Арифметика с плавающей точкой

[ редактировать ]
Множители для провалов
Имя Единица Ценить
килограммы провалов KFLOPS 10 3
мегафлопы MFLOPS 10 6
Гига Шлопс Gflops 10 9
Тера флопс Tflops 10 12
ПЕТА Флопы ПФЛОП 10 15
Exa Flops Eflops 10 18
Zetta Flops Zflops 10 21
Йотта Шлопс Yflops 10 24
Ронна Шлопс Rflops 10 27
КВЕТТА Флопы Qflops 10 30

Арифметика с плавающей точкой необходима для очень больших или очень маленьких реальных чисел или вычислений, которые требуют большого динамического диапазона. Представление с плавающей запятой аналогично научному обозначению, за исключением того, что все проводится во второй основе, а не на основе десяти. Схема кодирования хранит знак, показатель (в двух базе для Cray и Vax , базовый два или десять для форматов плавающей запятой IEEE , и базовый 16 для архитектуры IBM с плавающей запятой ) и значимость (число после точки Radix ). В то время как несколько подобных форматов используются, наиболее распространенным является ANSI/IEEE Std. 754-1985 . Этот стандарт определяет формат для 32-битных чисел, называемых отдельной точностью , а также 64-битные числа, называемые двойной точностью и более длинные числа, называемые расширенной точностью (используется для промежуточных результатов). Представления с плавающей запятой могут поддерживать гораздо более широкий диапазон значений, чем фиксированная точка, с возможностью представлять очень маленькие числа и очень большие числа. [ 2 ]

Динамический диапазон и точность

[ редактировать ]

Экспоненты, присущее вычислению с плавающей точкой, обеспечивает гораздо больший динамический диапазон-самые большие и наименьшие числа, которые могут быть представлены-что особенно важно при обработке наборов данных, где некоторые данные могут иметь чрезвычайно большой диапазон численных значений или где диапазон может быть непредсказуемым. Таким образом, процессоры с плавающей запятой идеально подходят для вычисления интенсивных приложений. [ 3 ]

Вычислительная производительность

[ редактировать ]

Флопы и MIP являются единицами измерения для численных вычислений компьютера. Операции с плавающей запятой обычно используются в таких областях, как научные вычислительные исследования, а также в машинном обучении . Однако до конца 1980-х годов оборудование с плавающей точкой (можно реализовать арифметику FP в программном обеспечении над любым целочисленным оборудованием), как правило, была необязательной функцией, и компьютеры, которые, как говорили, были «научными компьютерами» или имеют « научные вычисления "Возможности. Таким образом, единица MIPS был полезен для измерения целочисленной производительности любого компьютера, в том числе без такой возможности, и для учета различий в архитектуре, аналогичные MOP (миллион операций в секунду) использовались еще в 1970 году. [ 4 ] также. Обратите внимание, что помимо целочисленного (или фиксированной) арифметики, примеры целочисленной операции включают движение данных (от B до b) или тестирование значения (если A = B, то C). Вот почему MIPS в качестве эталона производительности адекватен, когда компьютер используется в запросах базы данных, обработке текстов, электронных таблицах или для запуска нескольких виртуальных операционных систем. [ 5 ] [ 6 ] В 1974 году Дэвид Кук придумал термины и мегафлопс для описания суперкомпьютеров дня по количеству расчетов с плавающей точкой, которые они выполняли в секунду. [ 7 ] Это было намного лучше, чем использование распространенных MIP для сравнения компьютеров, так как эта статистика обычно мало имела арифметическую способность машины на научных задачах.

Шлевы по крупнейшему суперкомпьютеру с течением времени

Флопы на HPC-системе могут быть рассчитаны с использованием этого уравнения: [ 8 ]

Это может быть упрощено до наиболее распространенного случая: компьютер, на котором ровно 1 ЦП:

Флопы могут быть записаны в различных показателях точности, например, список суперкомпьютеров TOP500 ранжирует компьютеры на 64-битном ( формате с плавающей точкой с двумя рецептами ) в секунду, сокращенно до FP64 . [ 9 ] Аналогичные меры доступны для 32-битных ( FP32 ) и 16-битных ( FP16 ) операций.

Операции с плавающей запятой за тактовой цикл для различных процессоров

[ редактировать ]
Операции с плавающей запятой за цикл такта на ядро [ 10 ]
Микроархитектура Архитектура набора инструкций FP64 FP32 FP16
CPU Intel
Intel 80486 x87 (32-битный) ? 0.128 [ 11 ] ?
x87 (32-битный) ? 0.5 [ 11 ] ?
MMX (64-битный) ? 1 [ 12 ] ?
Intel P6 Pentium 3 SSE (64-битный) ? 2 [ 12 ] ?
Intel Netburst Pentium 4 (Willamette, Northwood) SSE2 (64-битный) 2 4 ?
Intel P6 Pentium m SSE2 (64-битный) 1 2 ?
SSE3 (64-битный) 2 4 ?
4 8 ?
Intel Atom ( Bonnell , Saltwell , Silvermont и Goldmont ) SSE3 (128-битный) 2 4 ?
Intel Sandy Bridge ( Сэнди -мост , мост Айви ) AVX (256-битный) 8 16 0
AVX2 & FMA (256-бит) 16 32 0
Intel Xeon Phi ( Knights Corner ) IMCI (512-бит) 16 32 0
AVX-512 & FMA (512-бит) 32 64 0
CPU AMD
AMD BOBCAT AMD64 (64-бит) 2 4 0
4 8 0
AMD K10 SSE4/4A (128-битный) 4 8 0
Амд Бульдозер [ 13 ] ( Piledriver , Steamroller , Excavator )
  • AVX (128-битный) (бульдозер, Steamroller)
  • AVX2 (128-бит) (экскаватор)
  • FMA3 (бульдозер) [ 14 ]
  • FMA3/4 (Poodriver, Excavator)
4 8 0
AVX2 & FMA (128-битная, 256-битная декодирование) [ 18 ] 8 16 0
AVX2 & FMA (256-бит) 16 32 0
ARM CPU
Arm Cortex-A7, A9, A15 ARMV7 1 8 0
ARM Cortex-A32, A35 ARMV8 2 8 0
Arm Cortex-A53 , A55 , A57 , [ 13 ] A72 , A73 , A75 ARMV8 4 8 0
Arm Cortex-A76 , A77 , A78 ARMV8 8 16 0
ARM Cortex-X1 ARMV8 16 32 ?
Qualcomm Kirad ARMV8 1 8 0
Qualcomm Kryo (1xx - 3xx) ARMV8 2 8 0
Qualcomm Kryo (4xx - 5xx) ARMV8 8 16 0
Samsung Exynos M1 и M2 ARMV8 2 8 0
Samsung Exynos M3 и M4 ARMV8 3 12 0
IBM PowerPC A2 (синий ген/Q) ? 8 8 (как FP64) 0
Hitachi SH-4 [ 20 ] [ 21 ] SH-4 1 7 0
NVIDIA GPU
Nvidia Curie ( серия GeForce 6 и серия GeForce 7 ) Ptx ? 8 ?
Nvidia tesla 2.0 (GeForce GTX 260–295) Ptx ? 2 ?
Nvidia Fermi (только GeForce GTX 465–480, 560, 570–590) Ptx 1/4 (заблокирован драйвером, 1 в оборудовании) 2 0
Nvidia fermi (только Quadro 600–2000) Ptx 1/8 2 0
Nvidia Fermi (только Quadro 4000–7000, Tesla) Ptx 1 2 0
Nvidia Kepler (Geforce (кроме Titan и Titan Black), Quadro (кроме K6000), Tesla K10) Ptx 1/12 (для GK110 : заблокирован драйвером, 2/3 в оборудовании) 2 0
Nvidia Kepler (Geforce Gtx Titan и Titan Black, Quadro K6000, Tesla (кроме K10)) Ptx 2/3 2 0
Ptx 1/16 2 1/32
Nvidia Pascal (только Quadro GP100 и Tesla P100) Ptx 1 2 4
Nvidia Volta [ 22 ] Ptx 1 2 ( FP32 ) + 2 ( Int32 ) 16
Nvidia Turing (только Geforce 16xx ) Ptx 1/16 2 (FP32) + 2 (Int32) 4
Nvidia Turing (все, кроме Geforce 16xx ) Ptx 1/16 2 (FP32) + 2 (Int32) 16
NVIDIA AMPERE [ 23 ] [ 24 ] (только Tesla A100/A30) Ptx 2 2 (FP32) + 2 (Int32) 32
Nvidia ampere (All Geforce и Quadro, Tesla A40/A10) Ptx 1/32 2 (FP32) + 0 (Int32) или 1 (FP32) + 1 (Int32) 8
AMD GPU
AMD Terascale 1 ( серия Radeon HD 4000 ) Терапия 1 0.4 2 ?
AMD Terascale 2 ( серия Radeon HD 5000 ) Терапия 2 1 2 ?
AMD Terascale 3 ( серия Radeon HD 6000 ) Терапия 3 1 4 ?
AMD GCN (только Radeon Pro W 8100–9100) GCN 1 2 ?
AMD GCN (все, кроме Radeon Pro W 8100–9100, Vega 10–20) GCN 1/8 2 4
AMD GCN Vega 10 GCN 1/8 2 4
AMD GCN Vega 20 (только Radeon VII) GCN 1/2 (заблокирован драйвером, 1 в оборудовании) 2 4
AMD GCN Vega 20 (только Radeon Instinct Mi50 / Mi60 и Radeon Pro VII) GCN 1 2 4
РДНК 1/8 2 4
AMD RDNA3 РДНК 1/8? 4 8?
AMD кДНК КДНК 1 4 (тензор) [ 27 ] 16
AMD кДНК 2 КДНК 2 4 (тензор) 4 (тензор) 16
Intel GPU
Intel XE-LP (Iris XE Max) [ 28 ] Машина 1/2? 2 4
Intel XE-HPG (Arc Alchemist) [ 28 ] Машина 0 2 16
Intel XE-HPC (Ponte Vecchio) [ 29 ] Машина 2 2 32
Qualcomm GPU
Qualcomm Adreno 5x0 Адрено 5xx 1 2 4
Qualcomm Adreno 6x0 Адрено 6xx 1 2 4
Graphcore
Graphcore Colossus GC2 [ 30 ] [ 31 ] ? 0 16 64
? 0 32 128
Суперкомпьютер
Eniac @ 100 кГц в 1945 году 0.004 [ 34 ] (~ 0,00000003 Флопы/ W )
48-битный процессор при 208 кГц в CDC 1604 в 1960 году
60-битный процессор при 10 МГц в CDC 6600 в 1964 году 0,3 (FP60)
60-битный процессор при 10 МГц в CDC 7600 в 1967 году 1.0 (FP60)
Cray-1 @ 80 МГц в 1976 году 2 (700 флопов/w)
CDC Cyber ​​205 @ 50 МГц в 1981 году

Фортран компилятор (ANSI 77 с векторными расширениями)

8 16
Транспутер IMS T800-20 @ 20 МГц в 1987 году 0.08 [ 35 ]
Parallella e16 @ 1000 МГц в 2012 году 2 [ 36 ] (5,0 GFLOPS/W) [ 37 ]
Parallella e64 @ 800 МГц в 2012 году 2 [ 38 ] (50,0 GFLOPS/W) [ 37 ]
Микроархитектура Архитектура набора инструкций FP64 FP32 FP16

Performance Records

[ редактировать ]

Одиночные компьютерные записи

[ редактировать ]

В июне 1997 года Intel 's ASCI Red был первым в мире компьютером, который достиг одного терафлопа и за ее пределами. Директор Sandia Билл Кэмп сказал, что Asci Red была наилучшей надежностью всех построенных суперкомпьютеров, и «был высокой отметкой суперкомпьютинг в долголетию, цене и производительности». [ 39 ]

NEC от Суперкомпьютер SX-9 был первым в мире векторным процессором, превышающим 100 гигафлопов на одно ядро.

В июне 2006 года был объявлен новый компьютер Японским исследовательским институтом Riken , Mdgrape-3 . Производительность компьютера достигает одного из Petaflops, почти в два раза быстрее, чем Blue Gene/L, но Mdgrape-3 не является компьютером общего назначения, поэтому он не появляется в списке Top500.org . Он имеет специальные трубопроводы для моделирования молекулярной динамики.

К 2007 году Intel Corporation представила экспериментальный многоядерный чип Polaris , который достигает 1 терафлопа при 3,13 ГГц. 80-ядерный чип может поднять этот результат до 2 терафлопов при 6,26 ГГц, хотя тепловое рассеяние на этой частоте превышает 190 Вт. [ 40 ]

В июне 2007 года Top500.org сообщил, что самый быстрый компьютер в мире является суперкомпьютером IBM Blue Dene/L , измеряющим пик 596 Teraflops. [ 41 ] Cray XT4 занял второе место с 101,7 терафлопами.

26 июня 2007 года IBM анонсировала второе поколение своего высшего суперкомпьютера, получившего название Blue Gene/P и предназначенного для постоянной работы на скоростях, превышающих одну Petaflops, быстрее, чем синий ген/л. При настройке для этого он может достигать скорости, превышающих три петифлоп. [ 42 ]

25 октября 2007 года NEC Corporation of Japan выпустила пресс-релиз, объявляющий о своей модели SX-серии SX-9 , [ 43 ] утверждая, что это самый быстрый в мире суперкомпьютер. SX -9 оснащен первым процессором, способным к пиковой переносной перспективе 102,4 гигафлопа на одно ядро.

4 февраля 2008 года NSF и Техасский университет в Остине открыли полномасштабные исследования на AMD , Sun Supercomputer по имени Рейнджер , [ 44 ] Самая мощная суперкомпьютирующая система в мире для исследований в области открытых наук, которая работает с устойчивой скоростью 0,5 Petaflops.

25 мая 2008 года американский суперкомпьютер, построенный IBM , названный « Roadrunner », достиг вычислительной вехи одного петафлопса. Он возглавлял сетки список самых мощных суперкомпьютеров в июне 2008 года и ноябре 2008 года (исключая компьютеров ). [ 45 ] [ 46 ] Компьютер расположен в Национальной лаборатории Лос -Аламоса в Нью -Мексико. Название компьютера относится к птице штата Нью -Мексико , Большому Roadrunner ( Geococcyx Californianus ). [ 47 ]

В июне 2008 года AMD выпустил серию Ati Radeon HD 4800, которые, как сообщается, являются первыми графическими процессорами, которые достигли одного террафлопа. 12 августа 2008 года AMD выпустила видеокарту ATI Radeon HD 4870x2 с двумя графическими процессорами Radeon R770 на общую сумму 2,4 терафлопа.

В ноябре 2008 года обновление суперкомпьютера Cray Jaguar в Национальной лаборатории Министерства энергетики (DOE) Oak Ridge (ORNL) подняло вычислительную силу системы на пик 1,64 Petaflops, что сделало Jaguar первой в мире системой Petaflops, посвященной открытию исследований . В начале 2009 года суперкомпьютер был назван в честь мифического существа Кракена . Кракен был объявлен самым быстрым в мире суперкомпьютером в мире и шестым самым быстрым в общем зачете в списке Top500 2009 года. В 2010 году Кракен был обновлен и может работать быстрее и более мощный.

В 2009 году Cray Jaguar выступил в 1,75 Petaflops, обыграв IBM Roadrunner за номер один в списке TOP500 . [ 48 ]

В октябре 2010 года Китай обнародовал Tianhe-1 , суперкомпьютер, который работает с пиковой скоростью вычислений 2,5 Petaflops. [ 49 ] [ 50 ]

По состоянию на 2010 год Самый быстрый процессор ПК достиг 109 гигафлопс ( Intel Core I7 980 XE ) [ 51 ] В двойных точных расчетах. Графические процессоры значительно более мощные. Например, Nvidia Tesla C2050 Computing Compacitors выполняют около 515 гигафлоп [ 52 ] в двойных вычислениях точности, и AMD FireStream 9270 пики при 240 гигафлопсах. [ 53 ]

В ноябре 2011 года было объявлено, что Япония достигла 10,51 Petaflops с помощью K -компьютера . [ 54 ] Он имеет 88 128 SPARC64 VIIIFX процессоров в 864 стойках, с теоретическими показателями 11,28 Petaflops. Он назван в честь японского слова " kei ", которое означает 10 квадриллион , [ 55 ] соответствует целевой скорости 10 Petaflops.

15 ноября 2011 года Intel продемонстрировала один процессор на основе X86, названный «Knights Corner», который поддержал более чем терафлопс на широком диапазоне операций DGEMM . Intel подчеркнула во время демонстрации, что это был устойчивый терафлоп (не «необработанные терафлопы», используемые другими, для получения более высоких, но менее значимых чисел), и что это был первый процессор общего назначения, который когда -либо пересекал терафлопс. [ 56 ] [ 57 ]

18 июня 2012 года система суперкомпьютеров IBM Sequoia , базирующаяся в Национальной лаборатории Лоуренса в США (LLNL), достигла 16 Petaflops, установив мировой рекорд и претендуя на первое место в последнем списке Top500. [ 58 ]

12 ноября 2012 года сертифицированный Top500 Titan как самый быстрый в мире суперкомпьютер в соответствии с эталоном Linpack, 17,59 Petaflops. [ 59 ] [ 60 ] Он был разработан Cray Inc. в Национальной лаборатории Oak Ridge и объединяет процессоры AMD Opteron с технологиями «Кеплер». [ 61 ] [ 62 ]

10 июня 2013 года китайский Tianhe-2 был ранжирован по самым быстрым в мире с 33,86 Petaflops. [ 63 ]

20 июня 2016 года в Китае Sunway Taihulight была ранжирована по самым быстрым в мире с 93 Petaflops на тесте Linpack (из 125 пиковых петифлопс). Система была установлена ​​в Национальном центре суперкомпьютерных в WUSI и представляла собой большую производительность, чем следующие пять самых мощных систем в списке TOP500 в то время вместе взятых. [ 64 ]

В июне 2019 года Summit , суперкомпьютер, построенный IBM, в настоящее время работающий в Национальной лаборатории Министерства энергетики (DOE) Oak Ridge (ORNL), запечатлел место номер один с показателем 148,6 Petaflop используется для ранжирования списка TOP500. Summit имеет 4356 узлов, каждый из которых оснащен двумя 22-ядерными процессорами9, и шестью графическими процессорами Nvidia Tesla V100. [ 65 ]

Соединенных Штатов В июне 2022 года граница является самым мощным суперкомпьютером на TOP500, достигнув 1102 Petaflops (1,102 Exaflops) на тестах Linpack. [ 66 ]

Распределенные вычислительные записи

[ редактировать ]

Распределенные вычисления используют Интернет для связи персональных компьютеров для достижения большего количества провалов:

  • По состоянию на апрель 2020 года В сети складки@Home более 2,3 Exaflops общей вычислительной мощности. [ 67 ] [ 68 ] [ 69 ] [ 70 ] Это самая мощная распределенная компьютерная сеть, которая является первой в истории, которая сломает 1 экзафлопс общей вычислительной мощности. Этот уровень производительности в первую очередь обеспечивается кумулятивным усилием огромного множества мощных графических и процессоров . [ 71 ]

Стоимость вычислений

[ редактировать ]

Затраты на оборудование

[ редактировать ]
Дата Приблизительно доллар США за GFLOPS Платформа обеспечивает самую низкую стоимость за GFLOPS Комментарии
Нескорректировано 2023 [ 77 ]
1945 130 триллионов долларов $ 2 Квадриллион ENIAC : 487 000 долл. США в 1945 году и 7 916 000 долл. США в 2022 году. 487 000 долл . США / 0,000 000 385   GFLOPS . Электронный цифровой компьютер на основе вакуумной трубки ).
1961 20 миллиардов долларов 204 миллиарда долларов Основная установка IBM 7030 Stretch имела стоимость в 7,78 миллиона долларов США каждый. Растяжение IBM 7030 выполняет одну плавающую точку, умножающуюся каждые 2,4 микросекунд . [ 78 ] Компьютер второго поколения ( на основе транзистора ).
1984 $20,000,000 $100,000,000 Cray X-MP /48 $ 15 000 000 / 0,8 GFLOPS . Компьютер третьего поколения ( на основе интегрированной схемы ).
1997 $30,000 $57,000 Два кластера из 16-процессора Беовульфа с Pentium Pro микропроцессорами [ 79 ]
Апрель 2000 $1,000 $2,000 Bunyip Beowulf Cluster Bunyip был первой технологией вычислительной техники в 1 доллар США / MFLOPS . Он выиграл премию Гордона Белла в 2000 году.
Май 2000 $640 $1,000 Klat2 KLAT2 был первой вычислительной технологией, которая масштабировалась до больших приложений, оставаясь под 1 доллар США /Мфопс . [ 80 ]
Август 2003 г. $90 $100 Каси0 Kasy0 был первой технологией вычислительной техники в 100 долларов США /GFLOPS . [ 81 ]
Август 2007 $50 $70 Микровульф По состоянию на август 2007 года этот 26 GFLOPS "Personal" Beowulf Cluster может быть построен за 1256 долларов. [ 82 ]
Март 2011 г. $1.80 $2 HPU4Science Этот кластер за 30 000 долларов был построен с использованием только коммерчески доступного оборудования для «геймеров». [ 83 ]
Август 2012 $0.75 $1 Quad Amd Radeon 7970 Система Настольный компьютер Quad AMD Radeon 7970, достигающий 16 TFLOPS однократного, 4 TFLOPS вычисления с двумя определениями. Общая стоимость системы составила 3000 долларов США; Создан с использованием только коммерчески доступного оборудования. [ 84 ]
Июнь 2013 года $0.22 $0.3 Sony PlayStation 4 Sony PlayStation 4 указана как пиковая производительность 1,84 TFLOP , по цене 400 долларов США. [ 85 ]
Ноябрь 2013 года $0.16 $0.21 AMD Sempron 145 & Geforce GTX 760 Система Созданная с использованием коммерчески доступных деталей, система, использующая один AMD Sempron 145 и три Nvidia Geforce GTX 760, достигает в общей сложности 6,771 TFLOP за общую стоимость 1 090,66 долл. США . [ 86 ]
Декабрь 2013 года $0.12 $0.16 Pentium G550 & Radeon R9 290 System Построен с использованием коммерчески доступных деталей. Intel Pentium G550 и AMD Radeon R9 290 выходят на 4,848 TFLOPS GRAND в 681,84 долл. США . [ 87 ]
Январь 2015 $0.08 $0.1 Celeron G1830 & Radeon R9 295x2 Система Построен с использованием коммерчески доступных деталей. Intel Celeron G1830 и AMD Radeon R9 295x2 выходят на более чем 11,5 TFLOP на сумму 902,57 долл. США . [ 88 ] [ 89 ]
Июнь 2017 года $0.06 $0.07 Amd Ryzen 7 1700 и Amd Radeon Vega Frontier Edition System Построен с использованием коммерчески доступных деталей. AMD Ryzen 7 1700 CPU в сочетании с картами AMD Radeon Vega FE в Crossfire выходит на более чем 50 TFLOP , чуть менее 3000 долларов США для полной системы. [ 90 ]
Октябрь 2017 года $0.03 $0.04 Intel Celeron G3930 и AMD RX Vega 64 Система Построен с использованием коммерчески доступных деталей. Три графические карты AMD RX Vega 64 предоставляют чуть более 75 TFLOPS HALTER PREACHION (38 TFLOPS SP или 2,6 TFLOPS DP в сочетании с процессором) на уровне ~ 2050 долл. США для полной системы. [ 91 ]
Ноябрь 2020 года $0.03 $0.03 AMD Ryzen 3600 и 3 × NVIDIA RTX 3080 Система AMD Ryzen 3600 @ 484 Gflops & $ 199,99

3 × nvidia RTX 3080 @ 29 770 GFLOPS каждый и $ 699,99

Общая система GFLOPS = 89,794 / TFLOPS = 89,2794

Общая стоимость системы вкл. Реалистичные, но недорогие детали; соответствует другому примеру = 2839 долл. США [ 92 ]

US $ /GFLOP = 0,0314 долл. США

Ноябрь 2020 года $0.04 $0.04 PlayStation 5 Digital Edition Sony PlayStation 5 указано как пиковая производительность 10,28 TFLOPS (20,58 TFLOPS с половиной точностью) по розничной цене 399 долларов. [ 93 ]
Ноябрь 2020 года $0.04 $0.04 Xbox Series X. Microsoft Xbox Series X указана как пиковая производительность 12,15 TFLOPS (24,30 TFLOP с половиной точностью) по розничной цене 499 долларов. [ 94 ]
Сентябрь 2022 года $0.02 $0.02 RTX 4090 в NVIDIA RTX 4090 указан как пиковая производительность 82,6 TFLOP (1,32 PFLOPS с 8-битной точностью) по розничной цене в 1599 долларов. [ 95 ]
Май 2023 г. $0.01 $0.01 Radeon RX 7600 AMD RX 7600 указан как пиковая производительность 21,5 TFLOP по розничной цене 269 долларов. [ 96 ]


Смотрите также

[ редактировать ]
  1. ^ «Понять меры производительности суперкомпьютеров и емкости системы хранения» . kb.iu.edu . Получено 23 марта 2024 года .
  2. ^ Плавающая запястья получена 25 декабря 2009 года.
  3. ^ Резюме: фиксированная точка (целое число) против плавающей точки архивирована 31 декабря 2009 года, на машине Wayback, извлеченной 25 декабря 2009 года.
  4. ^ Техническая примечание НАСА . Национальная авиационная и космическая администрация. 1970.
  5. ^ Исправлено против плавающей запятой. Получено 25 декабря 2009 года.
  6. ^ Манипулирование данными и расчет математики. Получено 25 декабря 2009 года.
  7. ^ Кук, DJ (1974). Основы мощности компьютерной системы . Министерство торговли США, Национальное бюро стандартов.
  8. ^ « Узлы, розетки, ядра и флоп, Огайо, мой» доктора Марка Р. Фернандеса, доктор философии » Архивировано из оригинала 13 февраля 2019 года . Получено 12 февраля 2019 года .
  9. ^ «Часто задаваемые вопросы» . Top500.org . Получено 23 июня 2020 года .
  10. ^ «Операции с плавающей запятой в секунду (флопс)» .
  11. ^ Jump up to: а беременный "home.iae.nl" .
  12. ^ Jump up to: а беременный «Вычислительная мощность на протяжении всей истории» . alternatewars.com . Получено 13 февраля 2021 года .
  13. ^ Jump up to: а беременный в дюймовый и Dolbeau, Romain (2017). «Теоретические пиковые провалы на набор инструкций: учебник». Журнал суперкомпьютинг . 74 (3): 1341–1377. doi : 10.1007/s11227-017-2177-5 . S2CID   3540951 .
  14. ^ «Новые инструкции поддержка бульдозер (FMA3) и Piledriver (FMA3+4 и CVT, BMI, TBM)» (PDF) .
  15. ^ «Блог процессора Agner - результаты испытаний для Amd Ryzen» .
  16. ^ https://arstechnica.com/gadgets/2017/03/amds-ment-of-zen-finally-an-architecture-that-can-compete/2/ "Каждое ядро ​​теперь имеет пару 128-битных единиц FMA своего собственного "
  17. ^ Майк Кларк (23 августа 2016 г.). Новая основная архитектура X86 для следующего поколения вычислений (PDF) . Hotchips 28. Amd. Архивировано из оригинала (PDF) 31 июля 2020 года . Получено 8 октября 2017 года . Страница 7
  18. ^ «Микроархитектура процессоров Intel и AMD» (PDF) .
  19. ^ «Генеральный директор AMD Лиза Su's Computex 2019» . youtube.com . 27 мая 2019 года. Архивировано с оригинала 11 декабря 2021 года.
  20. ^ «Развлекательные системы и высокопроизводительный процессор SH-4» (PDF) . Hitachi Review . 48 (2). Hitachi : 58–63. 1999 . Получено 21 июня 2019 года .
  21. ^ «SH-4 следующего поколения архитектура DSP для VoIP» (PDF) . Hitachi . 2000 . Получено 21 июня 2019 года .
  22. ^ «Inside Volta: самый продвинутый в мире графический процессор центра обработки данных» . 10 мая 2017 года.
  23. ^ «Глубокая архитектура nvidia ampere» . 14 мая 2020 года.
  24. ^ «NVIDIA A100 GPUS Power Современный центр обработки данных» . Нвидия .
  25. ^ Шиллинг, Андреас (10 июня 2019 г.). «Архитектура рДНК - стр. 2» . Hardwareluxx .
  26. ^ «AMD Radeon RX 5700 XT спецификации» . TechPowerup .
  27. ^ «Амд инстинкт Mi100 ускоритель» .
  28. ^ Jump up to: а беременный «Введение в архитектуру XE-HPG» .
  29. ^ «Центр обработки данных Intel Max» . 9 ноября 2022 года.
  30. ^ «250 TFLOPS/S для двух чипов со смешанной точностью FP16» . youtube.com . 26 октября 2018 года.
  31. ^ Заархивировано в Ghostarchive и на машине Wayback : «Оценка с помощью энергопотребления, которое FP32 составляет 1/4 от FP16 и что тактовая частота ниже 1,5 ГГц» . youtube.com . 25 октября 2017 года.
  32. ^ Заархивировано в Ghostarchive и на машине Wayback : «Представление GraphCore Mk2 IPU Systems» . youtube.com . 15 июля 2020 года.
  33. ^ "BOW-2000 IPU-Machine" . docs.graphcore.ai/ .
  34. ^ Eniac]] @ 100 кГц с 385 шлебцами «Компьютеры головы» . clear.rice.edu . Получено 26 февраля 2021 года .
  35. ^ «Архитектура IMS T800» . Transputer.net . Получено 28 декабря 2023 года .
  36. ^ Epiphany-III 16-ядерный 65-нм микропроцессор (E16G301) // Администратор (19 августа 2012 г.)
  37. ^ Jump up to: а беременный Фельдман, Майкл (22 августа 2012 г.). «Адаптева открывает 64-ядерный чип» . HPCWIRE . Получено 3 сентября 2014 года .
  38. ^ Epiphany-iv 64-ядерный 28-нм микропроцессор (E64G401) // Администратор (19 августа 2012 г.)
  39. ^ «Sandia's Asci Red, первый в мире суперкомпьютер Teraflop, выводится из эксплуатации» (PDF) . Архивировано из оригинала (PDF) 5 ноября 2010 года . Получено 17 ноября 2011 года .
  40. ^ Ричард Суинберн (30 апреля 2007 г.). «Прибытие вычислений Teraflop» . bit-tech.net . Получено 9 февраля 2012 года .
  41. ^ «29 -й список Top500 самых быстрых суперкомпьютеров в мире выпущен» . Top500.org . 23 июня 2007 года. Архивировано с оригинала 9 мая 2008 года . Получено 8 июля 2008 года .
  42. ^ «Июнь 2008 года» . TOP500 . Получено 8 июля 2008 года .
  43. ^ «NEC запускает самый быстрый векторный суперкомпьютер мира, SX-9» . НИК 25 октября 2007 г. Получено 8 июля 2008 года .
  44. ^ «Университет Техаса в Остине, штат Техас, продвинутый компьютерный центр» . Архивировано из оригинала 1 августа 2009 года . Получено 13 сентября 2010 года . Любой исследователь в американском учреждении может представить предложение для запроса распределения циклов по системе.
  45. ^ Шарон Гаудин (9 июня 2008 г.). «Roadrunner IBM разбивает 4-минутную милю суперкомпьютинг» . Computerworld. Архивировано из оригинала 24 декабря 2008 года . Получено 10 июня 2008 года .
  46. ^ «Остин ISC08» . Top500.org. 14 ноября 2008 года. Архивировано с оригинала 22 февраля 2012 года . Получено 9 февраля 2012 года .
  47. ^ Филдс, Джонатан (9 июня 2008 г.). «Суперкомпьютер устанавливает темп Petaflop» . BBC News . Получено 8 июля 2008 года .
  48. ^ Гринберг, Энди (16 ноября 2009 г.). «Крэй детернов IBM в суперкомпьютинге» . Форбс .
  49. ^ «Китай претендует на суперкомпьютер корону» . BBC News. 28 октября 2010 г.
  50. ^ Диллоу, Клэй (28 октября 2010 г.). «Китай представляет 2507 суперкомпьютер Petaflop, самый быстрый в мире» . Popsci.com . Получено 9 февраля 2012 года .
  51. ^ «Extreme Edition Intel i7-980x-готово к больным результатам?: Математика: Сандра арифметика, крипто, Microsoft Excel» . Технология . 10 марта 2010 г. Получено 9 февраля 2012 года .
  52. ^ «Nvidia Tesla Personal Supercomputer» . Nvidia.com . Получено 9 февраля 2012 года .
  53. ^ «AMD FireStream 9270 GPU Compute Accelerator» . Amd.com . Получено 9 февраля 2012 года .
  54. ^ « K Computer» достигает цели 10 Petaflops » . Fujitsu.com . Получено 9 февраля 2012 года .
  55. ^ См . Японские числа
  56. ^ «Рыцарский угол Intel: 50+ CORE 22-нм со-процессор» . 16 ноября 2011 г. Получено 16 ноября 2011 года .
  57. ^ «Intel представляет 1 Tflop/S Knight's Corner» . Получено 16 ноября 2011 года .
  58. ^ Кларк, Дон (18 июня 2012 г.). «IBM компьютер устанавливает скоростную запись» . Wall Street Journal . Получено 18 июня 2012 года .
  59. ^ «Us Titan Supercompuster выступил как самый быстрый в мире» . Би -би -си. 12 ноября 2012 года . Получено 28 февраля 2013 года .
  60. ^ «Oak Ridge претендует на позицию № 1 в последнем списке Top500 с Titan | SuperComputer сайтами TOP500» . Top500.org. 12 ноября 2012 года . Получено 28 февраля 2013 года .
  61. ^ Монтальбано, Элизабет (11 октября 2011 г.). «Oak Ridge Labs строит самый быстрый суперкомпьютер» . InformationWeek . Получено 9 февраля 2012 года .
  62. ^ Тибкен, Шара (29 октября 2012 г.). «Суперкомпьютер титана дебютирует для открытых научных исследований | News.cnet.com . Получено 28 февраля 2013 года .
  63. ^ «Китайский суперкомпьютер теперь самый быстрый в мире - много» . Журнал Forbes . 17 июня 2013 года . Получено 17 июня 2013 года .
  64. ^ Фельдман, Майкл. «Китайские гонки впереди в списке суперкомпьютеров TOP500, заканчивая превосходство США» . Top500.org . Получено 31 декабря 2016 года .
  65. ^ «Июнь 2018» . Top500.org . Получено 17 июля 2018 года .
  66. ^ https://en.wikipedia.org/wiki/top500 [ только URL ]
  67. ^ "Folding@Home Active CPU и графические процессоры от OS" . FOOKINGATHOME.org . Получено 8 апреля 2020 года .
  68. ^ Склад@Home (25 марта 2020 г.). «Благодаря нашему удивительному сообществу, мы пересекли барьер Exaflop! Это более 1 000 000 000 000 000 000 операций в секунду, что делает нас ~ 10 раз быстрее, чем Summit IBM! Pic.twitter.com/mpmnb4xdh3» . @foldingathome . Получено 4 апреля 2020 года .
  69. ^ «Folding@Home Crushs Exascale Barrier, теперь быстрее, чем десятки суперкомпьютеров - Extretech» . Extremetech.com . Получено 4 апреля 2020 года .
  70. ^ «Склад@Home превышает 1,5 ExaFlops в битве против Covid-19» . Techspot . 26 марта 2020 года . Получено 4 апреля 2020 года .
  71. ^ «Поддержка Sony Computer Entertainment для PlayStation ™ 3 получает« Good Design Gold Award » ( пресс -релиз). Sony Computer Entertainment Inc. 6 ноября 2008 года. Архивировано из оригинала 31 января 2009 года . Получено 11 декабря 2008 года .
  72. ^ "Boinc Computing Power" . Боевой ​Получено 28 декабря 2020 года .
  73. ^ "Seti@Home Credit Обзор" . Боевой ​Получено 15 июня 2018 года .
  74. ^ «Einstein@Home Credit Обзор» . Боевой ​Получено 15 июня 2018 года .
  75. ^ "Milkyway@Home Credit Review" . Боевой ​Получено 15 июня 2018 года .
  76. ^ «Интернет -Primenet Server Distribute Computing Technology для Great Internet Internet Mersenne Prime Search» . GIMPS . Получено 15 июня 2018 года .
  77. ^ 1634–1699: McCusker, JJ (1997). Сколько это в реальных деньгах? Исторический индекс цен для использования в качестве дефлятора денег в экономике Соединенных Штатов: Addenda et Corrigenda (PDF) . Американское антикварное общество . 1700–1799: McCusker, JJ (1992). Сколько это в реальных деньгах? Исторический индекс цен для использования в качестве дефлятора денег в экономике Соединенных Штатов (PDF) . Американское антикварное общество . 1800 - Present: Федеральный резервный банк Миннеаполиса. «Индекс потребительской цены (оценка) 1800–» . Получено 29 февраля 2024 года .
  78. ^ «IBM 7030 (растяжение)» . Норман Харди . Получено 24 февраля 2017 года .
  79. ^ "Локи и Хиглак" . Loki-www.lanl.gov. 13 июля 1997 года. Архивировано с оригинала 21 июля 2011 года . Получено 9 февраля 2012 года .
  80. ^ «Кентукки Linux Athlon Testdle 2 (klat2)» . Совокупность . Получено 9 февраля 2012 года .
  81. ^ "Kasy0" . Совокупность . 22 августа 2003 г. Получено 9 февраля 2012 года .
  82. ^ «Микровульф: личный портативный кластер Беовульф» . Архивировано из оригинала 12 сентября 2007 года . Получено 9 февраля 2012 года .
  83. ^ Адам Стивенсон, Янн Ле Ду и Марием Эль Африт. « Высокопроизводительные вычисления на геймерных ПК ». Ars Technica . 31 марта 2011 г.
  84. ^ Том Логан (9 января 2012 г.). «HD7970 Quadfire Eyefinity Review» . OC3D.NET .
  85. ^ " Sony Sparks Price War с PS4 по цене $ 399 ". CNBC . 11 июня 2013 года.
  86. ^ "FreezePage" . Архивировано с оригинала 16 ноября 2013 года . Получено 9 мая 2020 года .
  87. ^ "FreezePage" . Архивировано из оригинала 19 декабря 2013 года . Получено 9 мая 2020 года .
  88. ^ "FreezePage" . Архивировано с оригинала 10 января 2015 года . Получено 9 мая 2020 года .
  89. ^ «Radeon R9 295x2 8 ГБ обзор: Project Hydra получает жидкое охлаждение» . 8 апреля 2014 года.
  90. ^ Перес, Кэрол Э. (13 июля 2017 г.). «Построение 50 Teraflops Amd Vega Deep Learning Box за 3 тысячи долларов» . Машина интуиции . Получено 26 июля 2017 года .
  91. ^ «Самый низкий _ $/fp16-Список сохраненных деталей Mattebaughman-Celeron G3930 2,9 ГГц двойной ядер, Radeon Rx Vega 64 8GB (3-й перекрестный огонь), xon-350_bk Atx Mid Tower» . pcpartpicker.com . Получено 13 сентября 2017 года .
  92. ^ «Системный строитель» . pcpartpicker.com . Получено 7 декабря 2020 года .
  93. ^ "AMD PlayStation 5 спецификации графического процесса" . TechPowerup.com . Получено 12 мая 2021 года .
  94. ^ "Xbox Series X | Xbox" . xbox.com . Получено 21 сентября 2021 года .
  95. ^ «NVIDIA объявляет RTX 4090, наступающем 12 октября, RTX 4080 позже» . tomshardware.com . 20 сентября 2022 года . Получено 20 сентября 2022 года .
  96. ^ «AMD Radeon RX 7600 Обзор: инкрементные обновления» . tomshardware.com . 24 мая 2023 года . Получено 24 мая 2023 года .
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 36a98b035ed9b0a312c9259224abf5cb__1724083140
URL1:https://arc.ask3.ru/arc/aa/36/cb/36a98b035ed9b0a312c9259224abf5cb.html
Заголовок, (Title) документа по адресу, URL1:
FLOPS - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)