Интеграция в масштабе пластины
Эта статья нуждается в дополнительных цитатах для проверки . ( май 2014 г. ) |
Интеграция в масштабе пластины ( WSI ) — это система построения сетей очень больших интегральных схем (обычно называемых «чипами») из всей кремниевой пластины для производства одного «суперчипа». Ожидалось, что WSI, сочетающий большой размер и уменьшенную упаковку, приведет к значительному снижению затрат на некоторые системы, особенно с массовым параллелизмом на суперкомпьютеры , но в настоящее время они используются для глубокого обучения . Название взято от термина « очень крупномасштабная интеграция» — современного состояния на момент разработки WSI.
Обзор [ править ]
один большой цилиндрический кристалл ( була В обычном процессе производства интегральных схем изготавливается ) кремния, который затем разрезается на диски, известные как пластины. Затем пластины очищаются и полируются перед процессом изготовления. Фотографический процесс используется для нанесения рисунка на поверхность, где материал следует наносить поверх пластины, а где нет. Наносится желаемый материал и снимается фотошаблон для следующего слоя. С этого момента пластина неоднократно обрабатывается таким образом, нанося на поверхность схему за слоем.
Множественные копии этих рисунков наносятся на пластину в виде сетки по ее поверхности. После того, как все возможные места размещены, поверхность пластины выглядит как лист миллиметровой бумаги с линиями сетки, очерчивающими отдельные чипы. Каждое из этих мест сети проверяется на наличие производственных дефектов с помощью автоматизированного оборудования. Те места, в которых обнаружены дефекты, записываются и отмечаются точкой краски (этот процесс называется «нанесением краски на штамп», и более современные методы изготовления пластин больше не требуют физической маркировки для идентификации дефектного кристалла). Затем пластину распиливают на части, чтобы вырезать отдельные чипы. Дефектные чипы выбрасываются или перерабатываются, а рабочие чипы помещаются в упаковку и повторно проверяются на предмет повреждений, которые могут возникнуть в процессе упаковки.
Невозможно избежать дефектов на поверхности пластин и проблем в процессе наслаивания/осаждения, что приводит к дефектам некоторых отдельных чипов. Доход от оставшихся рабочих чипов должен покрыть всю стоимость пластины и ее обработку, включая выброшенные дефектные чипы. Таким образом, чем больше количество работающих чипов или выше производительность , тем ниже стоимость каждого отдельного чипа. Чтобы максимизировать выход продукции, нужно делать чипы как можно меньше, чтобы на одной пластине можно было получить большее количество рабочих чипов. [ нужны разъяснения ]
Снижение стоимости [ править ]
Значительная часть стоимости изготовления (обычно 30–50 %). [ нужна ссылка ] связано с тестированием и упаковкой отдельных чипов. Дальнейшие затраты связаны с соединением микросхем в единую систему (обычно через печатную плату ). Интеграция в масштабе пластины направлена на снижение этих затрат, а также на повышение производительности за счет создания более крупных чипов в одном корпусе — в принципе, чипов размером с полную пластину. [ нужна ссылка ]
Конечно, это непросто, поскольку, учитывая дефекты пластин, один большой дизайн, напечатанный на пластине, почти всегда не работает. Постоянной целью было разработать методы обработки дефектных участков пластины с помощью логики, а не выпиливания их из пластины. Как правило, этот подход использует сетку подсхем и «перемонтирует» провода вокруг поврежденных участков с использованием соответствующей логики. Если полученная пластина имеет достаточное количество рабочих подсхем, ее можно использовать, несмотря на неисправности.
Проблемы [ править ]
Большая часть потерь производительности при производстве микросхем возникает из-за дефектов в слоях транзисторов или в нижних металлических слоях с высокой плотностью.Другой подход – кремниевая межкомпонентная ткань (Si-IF) – не имеет ни того, ни другого на пластине. Si-IF наносит на пластину только металлические слои относительно низкой плотности, примерно такой же плотности, как верхние слои системы на кристалле , используя пластину только для межсоединений между плотно упакованными небольшими голыми чипсетами . [1] Процессоры на базе Si-IF [2] и сетевые коммутаторы [3] были изучены.
производства Попытки
Многие компании пытались разработать производственные системы WSI в 1970-х и 1980-х годах, но все потерпели неудачу. Texas Instruments и ITT Corporation рассматривали это как способ разработать сложные конвейерные микропроцессоры и вернуться на рынок, где они теряли позиции, но не выпустили никаких продуктов.
Джин Амдал также попытался разработать WSI как метод создания суперкомпьютера, запустив Trilogy Systems в 1980 году. [4] [5] [6] и получение инвестиций от Groupe Bull , Sperry Rand и Digital Equipment Corporation , которые (вместе с другими) предоставили финансирование на сумму около 230 миллионов долларов. В конструкции предполагался квадратный чип размером 2,5 дюйма с 1200 контактами внизу.
Проекту помешала серия стихийных бедствий, в том числе наводнения, которые задержали строительство завода, а затем разрушили интерьер чистых помещений. После сгорания около капитала , Будучи 1/3 которому нечего было показать, Амдал в конце концов заявил, что эта идея сработает только с доходностью 99,99%, чего не произойдет в течение 100 лет. Он использовал оставшийся стартовый капитал Trilogy для покупки Elxsi , производителя суперминикомпьютеров, в 1985 году. В конечном итоге усилия Trilogy были прекращены и «стали» Elxsi. [7]
В 1989 году Anamartic разработала пластинчатую стековую память на основе технологии Айвора Кэтта , [8] но компания не смогла обеспечить достаточно большие поставки кремниевых пластин и закрылась в 1992 году.
пластинчатого масштаба в Устройства производстве
Cerebras Процессор Systems
19 августа 2019 года американская компания по производству компьютерных систем Cerebras Systems представила ход разработки WSI для ускорения глубокого обучения . Чип Cerebras Wafer-Scale Engine (WSE-1) имеет длину 46 225 мм. 2 (215 мм × 215 мм), что примерно в 56 раз больше, чем у самого большого кристалла графического процессора. Он производится компанией TSMC по 16-нм техпроцессу. WSE-1 имеет 1,2 триллиона транзисторов, 400 000 ядер искусственного интеллекта, 18 ГБ встроенной SRAM, полосу пропускания на пластине 100 Пбит/с и полосу пропускания ввода-вывода вне пластины 1,2 Пбит/с. Цена и тактовая частота не разглашаются. [9] В 2020 году продукт компании CS-1 был протестирован в рамках вычислительного моделирования гидродинамики . По сравнению с суперкомпьютером Джоуля в NETL , CS-1 был в 200 раз быстрее, потребляя при этом гораздо меньше энергии. [10]
В апреле 2021 года Cerebras анонсировала WSE-2 с удвоенным количеством транзисторов и заявленной 100% выходной мощностью. [11] Это достигается за счет разработки системы, в которой можно обойти любой производственный дефект. [11] Система Cerebras CS-2, включающая в себя WSE-2, находится в серийном производстве .
В марте 2024 года Cerebras анонсировала WSE-3, производительность которого вдвое превышает производительность предыдущего рекордсмена Cerebras WSE-2, при том же энергопотреблении и по той же цене. Он предназначен для обучения искусственному интеллекту и построен на 5-нм техпроцессе TSMC. [12]
См. также [ править ]
Ссылки [ править ]
- ^ Пунит Гупта и Субраманиан С. Айер. «Прощай, материнская плата. Привет, кремниевая межкомпонентная ткань» 2019.
- ^ Саптадип Пал, Дэниел Петриско, Мэтью Томей, Пунит Гупта, Суббу Айер и Ракеш Кумар. «Архитектура процессора Waferscale: пример графического процессора», 2019 г.
- ^ Шуанлян Чен, Саптадип Пал и Ракеш Кумар. «Сетевые коммутаторы Waferscale» 2024.
- ↑ Статья в журнале Fortune об истории Трилогии , 1 сентября 1986 г.
- ^ МОЖЕТ ЛИ ТРИХОЛОГИЯ ИСПОЛНИТЬ СВОЮ МЕЧТУ? / ЭРИК Н. БЕРГ, NYTimes, 8 июля 1984 г.
- ^ Определение трилогии в энциклопедии PCMag
- ^ Айвор Кэтт: Компьютеры-динозавры , МИР ЭЛЕКТРОНИКИ, июнь 2003 г.
- ^ «Стопка анамартических вафель» . История вычислений . Проверено 27 сентября 2020 г.
- ^ Катресс, доктор Ян. «Hot Chips 31 Live Blogs: процессор глубокого обучения Cerebras на 1,2 триллиона транзисторов» . www.anandtech.com . Проверено 29 августа 2019 г.
- ^ «Чип Cerebras размером с пластину в 10 000 раз быстрее графического процессора» . ВенчурБит . 17.11.2020 . Проверено 26 ноября 2020 г.
- ^ Jump up to: Перейти обратно: а б Катресс, доктор Ян. «Cerebras представляет второй двигатель пластинчатого масштаба (WSE2): 2,6 триллиона транзисторов, 100% выход» . www.anandtech.com . Проверено 26 июля 2021 г.
- ^ «Cerebras Systems представляет самый быстрый в мире ИИ-чип с колоссальными 4 триллионами транзисторов» . Системы Церебра . 11 марта 2024 г. Проверено 19 марта 2024 г.
Внешние ссылки [ править ]
- « Гигантские микросхемы для сверхбыстрых компьютеров », Джим Шефтер, Popular Science , январь 1984 г., стр. 66–67, 155.