Санвей SW26010
SW26010 разработанный — это 260-ядерный многоядерный процессор, Шанхайским центром развития интегрированных технологий и промышленности (сокращенно ICC ) . Он реализует архитектуру Sunway — 64-битную архитектуру вычислений с сокращенным набором команд (RISC), разработанную в Китае . [1] SW26010 имеет четыре кластера по 64 элемента вычислительной обработки (CPE), которые расположены в массиве восемь на восемь. CPE поддерживают инструкции SIMD и способны выполнять восемь двойной точности операций с плавающей запятой за цикл. Каждый кластер сопровождается более традиционным ядром общего назначения , называемым элементом обработки управления (MPE), которое обеспечивает функции контроля. [1] Каждый кластер имеет собственный выделенный DDR3 SDRAM контроллер и банк памяти со своим адресным пространством . [2] [3] Процессор работает на тактовой частоте 1,45 ГГц. [4]
Ядра CPE имеют 64 КБ оперативной памяти для данных и 16 КБ для инструкций и обмениваются данными через сеть на кристалле вместо традиционной иерархии кэша . [5] MPE имеют более традиционную настройку: L1 кэши инструкций и данных объемом 32 КБ и кэш L2 объемом 256 КБ . [1] Наконец, внутрикристальная сеть подключается к единому системному интерфейсу, который соединяет чип с внешним миром.
SW26010 используется в Sunway TaihuLight суперкомпьютере , который в период с марта по июнь 2018 года был самым быстрым суперкомпьютером в мире согласно рейтингу проекта TOP500 . [6] Система использует 40 960 SW26010 для достижения производительности 93,01 PFLOPS в тесте LINPACK .
Преемник: SW26010P
[ редактировать ]SW26010P включает в себя 6 основных групп (CG), каждая из которых включает в себя один элемент обработки управления (MPE) и один кластер вычислительных элементов обработки (CPE) 8×8. Каждый CG имеет свой контроллер памяти (MC), к которому подключается 16 ГБ памяти DDR4 с пропускной способностью 51,2 ГБ/с. Обмен данными между каждыми двумя CPE в одном кластере CPE осуществляется через интерфейс удаленного доступа к памяти (RMA) (замена функции связи регистров в предыдущем поколении). Каждое CPE имеет быструю локальную память данных (LDM) объемом 256 КБ. Каждый процессор SW26010P состоит из 390 обрабатывающих элементов. [7]
См. также
[ редактировать ]Ссылки
[ редактировать ]- ^ Jump up to: а б с Донгарра, Джек (20 июня 2016 г.). «Отчет о системе Sunway TaihuLight» (PDF) . www.netlib.org . Проверено 20 июня 2016 г.
- ^ Цзюньфэн и др. (2016). : система и приложения» . Sunway TaihuLight Хаохуань Фу , , « Суперкомпьютер 5588-7 .
- ^ Трейдер, Тиффани (19 июня 2016 г.). «Китай представляет процессор Sunway с производительностью 93 петафлопс» . Провод HPC . Проверено 21 июня 2016 г.
Каждое ядро CPE имеет один конвейер с плавающей запятой , который может выполнять 8 флопов за цикл на ядро (64-битная арифметика с плавающей запятой), а MPE имеет двойной конвейер, каждый из которых может выполнять 8 флопов за цикл на каждый конвейер (64-битная арифметика с плавающей запятой). арифметика с плавающей запятой).
- ^ Хемсот, Николь (20 июня 2016 г.). «Взгляд изнутри на новый суперкомпьютер Китая, возглавивший чарты» . Следующая платформа . Проверено 20 июня 2016 г.
- ^ Лендино, Джейми (20 июня 2016 г.). «Познакомьтесь с самым быстрым суперкомпьютером в мире: китайским TaihuLight» . Экстримтех . Проверено 21 июня 2016 г.
В отчете TOP500 говорится, что в чипе также отсутствует традиционный кеш L1-L2-L3, а вместо этого имеется 12 КБ кэша инструкций и 64 КБ «локального блокнота», который работает как кеш L1.
- ^ «Список 500 лучших: ноябрь 2016 г.» . ТОП 500 . 14 ноября 2016 года . Проверено 26 ноября 2016 г.
- ^ Лю, Юн (Александр); Ли, Фан (Нэнси, Хаохуань; Сун, Цзявэй; Ван, Чжэнь, Дацзя; , Хуан, Хелян; Ву, Вэньчжао; Чен, Дексун (2021). Материалы Международной конференции по высокопроизводительным вычислениям, сетям, хранению и анализу , стр. 1–12. дои : 10.1145/3458817.3487399 . ISBN 9781450384421 . S2CID 239036985 .