Предиктор ветвей

В компьютерной архитектуре предсказатель ветвей ^[1]^[2]^[3]^[4]^[5] — это цифровая схема , которая пытается угадать, в каком направлении ветвь (например, структура if-then-else пойдет ), прежде чем это станет известно окончательно. Целью предсказателя ветвления является улучшение потока команд в конвейере . Предсказатели ветвей играют решающую роль в достижении высокой производительности во многих современных конвейерных микропроцессорных архитектурах.

Двустороннее ветвление обычно реализуется с помощью инструкции условного перехода . Условный переход можно либо «взять» и перейти в другое место в памяти программы, либо его можно «не совершить» и продолжить выполнение сразу после условного перехода. Достоверно неизвестно, будет ли выполнен условный переход или нет, пока условие не будет вычислено и условный переход не пройдет стадию выполнения в конвейере команд (см. рис. 1).

Без прогнозирования ветвления процессору пришлось бы ждать, пока инструкция условного перехода пройдет стадию выполнения, прежде чем следующая инструкция сможет войти в стадию выборки в конвейере. Предиктор ветвления пытается избежать этой траты времени, пытаясь угадать, будет ли условный переход выполнен с наибольшей вероятностью или нет. ветвь, которая считается наиболее вероятной Затем выбирается и спекулятивно выполняется . Если позже обнаруживается, что предположение было неправильным, то спекулятивно выполненные или частично выполненные инструкции отбрасываются, и конвейер начинается заново с правильной ветви, что приводит к задержке.

Время, потраченное впустую в случае неправильного предсказания перехода, равно количеству этапов в конвейере от этапа выборки до этапа выполнения. Современные микропроцессоры, как правило, имеют довольно длинные конвейеры, поэтому задержка неправильного прогнозирования составляет от 10 до 20 тактов . В результате увеличение длины конвейера увеличивает потребность в более совершенном средстве прогнозирования ветвей. ^[6]

Когда команда условного перехода встречается впервые, информации, на которой можно было бы основывать прогноз, не так много. Но предиктор ветвей сохраняет записи о том, выполняются или нет ветки. Когда он сталкивается с условным переходом, который уже наблюдался несколько раз, он может основывать прогноз на истории. Предиктор ветвления может, например, распознавать, что условный переход выполняется чаще, чем нет, или что он выполняется каждый второй раз.

Предсказание ветвления — это не то же самое, что предсказание цели ветвления . Предсказание ветвления пытается угадать, будет ли выполнен условный переход или нет. Прогнозирование цели ветвления пытается угадать цель выполненного условного или безусловного перехода до того, как она будет вычислена путем декодирования и выполнения самой инструкции. Предсказание ветвления и предсказание цели ветвления часто объединяются в одну и ту же схему.

Реализация [ править ]

Статическое предсказание ветвей [ править ]

Статическое прогнозирование — это самый простой метод прогнозирования ветвей, поскольку он не полагается на информацию о динамической истории выполнения кода. Вместо этого он прогнозирует результат перехода исключительно на основе инструкции перехода. ^[7]

Ранние реализации SPARC и MIPS (две из первых коммерческих RISC- архитектур) использовали однонаправленное статическое предсказание перехода: они всегда предсказывают, что условный переход не будет выполнен, поэтому они всегда выбирают следующую последовательную инструкцию. Только когда ветвь или переход оценены и признаны выполненными, указатель инструкции устанавливается на непоследовательный адрес.

Оба ЦП оценивают ветки на этапе декодирования и выполняют выборку инструкций за один цикл. В результате целевое повторение ветвления длится два цикла, и машина всегда извлекает инструкцию сразу после любой выполненной ветки. Обе архитектуры определяют слоты задержки перехода для использования этих выбранных инструкций.

Более продвинутая форма статического прогнозирования предполагает, что обратные ветки будут выполняться, а прямые — нет. Обратная ветвь — это ветвь, целевой адрес которой меньше ее собственного адреса. Этот метод может помочь повысить точность прогнозирования циклов, которые обычно представляют собой ветви, указывающие назад, и чаще всего выполняются, чем не выполняются.

Некоторые процессоры позволяют вставлять в код подсказки предсказания ветвления, чтобы указать, следует ли выполнять статическое предсказание или нет. Intel Pentium 4 поддерживает подсказки по предсказанию ветвей, но в более поздних процессорах Intel от этой функции отказались. ^[8]

Статическое прогнозирование используется в качестве резервного метода в некоторых процессорах с динамическим прогнозированием ветвей, когда у динамических предикторов недостаточно информации для использования. И Motorola MPC7450 (G4e) , и Intel Pentium 4 используют этот метод в качестве запасного варианта. ^[9]

При статическом прогнозировании все решения принимаются во время компиляции, перед выполнением программы. ^[10]

Динамическое предсказание ветвей [ править ]

Динамическое предсказание ветвей ^[2] использует информацию о принятых или непринятых ветвях, собранную во время выполнения, для прогнозирования результата ветвления. ^[1]

Случайное предсказание ветвей [ править ]

Использование случайного или псевдослучайного бита (чистое предположение) гарантирует для каждой ветви 50%-ную точность предсказания, которую нельзя улучшить (или ухудшить) путем изменения порядка инструкций. (С помощью простейшего статического прогнозирования «предполагаемого дубля» компиляторы могут переупорядочить инструкции, чтобы получить более чем 50%-ный правильный прогноз.) Кроме того, это сделало бы время [гораздо более] недетерминированным.

Предсказание следующей строки [ править ]

Некоторые суперскалярные процессоры (MIPS R8000 , Alpha 21264 и Alpha 21464 (EV8)) извлекают каждую строку инструкций с указателем на следующую строку. Этот предиктор следующей строки обрабатывает прогнозирование цели ветвления, а также прогнозирование направления ветвления.

Когда предиктор следующей строки указывает на выровненные группы из 2, 4 или 8 инструкций, целью ветвления обычно не будет первая извлекаемая инструкция, и поэтому начальные выбранные инструкции теряются. Предполагая для простоты равномерное распределение целей ветвления, 0,5, 1,5 и 3,5 выбранных инструкций отбрасываются соответственно.

Поскольку сама ветвь обычно не является последней инструкцией в выровненной группе, инструкции после взятой ветки (или ее слота задержки ) будут отброшены. Еще раз, предполагая равномерное распределение размещений инструкций перехода, выбранные инструкции 0,5, 1,5 и 3,5 отбрасываются.

Отброшенные инструкции на линиях ветвления и назначения составляют почти полный цикл выборки, даже для однотактного предсказателя следующей строки.

Одноуровневое предсказание ветвей [ править ]

Счетчик насыщения [ править ]

1-битный счетчик насыщения (по сути, триггер ) записывает последний результат ветвления. Это самая простая из возможных версий динамического предсказателя ветвей, хотя она и не очень точна.

2-битный счетчик насыщения ^[1] представляет собой конечный автомат с четырьмя состояниями:

Сильно не взяли
Слабо не взяли
Слабо взято
Сильно принято

Когда оценивается ветвь, соответствующий конечный автомат обновляется. Ветви, оцененные как незанятые, меняют состояние на сильно не занятое, а ветви, оцененные как занятые, меняют состояние на сильно занятое. Преимущество схемы двухбитного счетчика по сравнению с однобитной схемой заключается в том, что условный переход должен дважды отклониться от того, что он делал больше всего в прошлом, прежде чем прогноз изменится. Например, условный переход, закрывающий цикл, неверно прогнозируется один раз, а не дважды.

Исходный процессор Intel Pentium , не поддерживающий MMX, использует счетчик насыщения, хотя и с несовершенной реализацией. ^[8]

В тестах SPEC '89 очень большие бимодальные предикторы насыщаются с точностью 93,5%, как только каждая ветвь сопоставляется с уникальным счетчиком. ^[11]^: 3

Таблица предикторов индексируется битами адреса команды , так что процессор может получить прогноз для каждой команды до ее декодирования.

Двухуровневый предиктор [ править ]

Двухуровневый предиктор ветвей, также называемый предиктором ветвей на основе корреляции, использует двумерную таблицу счетчиков, также называемую «таблицей истории шаблонов». Записи таблицы представляют собой двухбитовые счетчики.

Двухуровневый адаптивный предиктор

Если if оператор выполняется три раза, решение, принятое при третьем выполнении, может зависеть от того, были ли выполнены предыдущие два или нет. В таких сценариях двухуровневый адаптивный предиктор работает эффективнее счетчика насыщения. Условные переходы, которые выполняются каждый второй раз или имеют какой-либо другой регулярно повторяющийся шаблон, плохо прогнозируются счетчиком насыщения. Двухуровневый адаптивный предиктор запоминает историю последних n вхождений ветки и использует один счетчик насыщения для каждого из 2 возможных вариантов. ^н закономерности истории. Этот метод проиллюстрирован на рисунке 3.

Рассмотрим пример n = 2. Это означает, что два последних вхождения перехода сохраняются в двухбитном сдвиговом регистре . Этот регистр истории ветвей может иметь четыре различных двоичных значения: 00, 01, 10 и 11, где ноль означает «не занято», а единица означает «взято». Таблица истории шаблонов содержит четыре записи на каждую ветвь, по одной на каждую из двух ветвей. ² = 4 возможных истории ветвей, и каждая запись в таблице содержит двухбитовый счетчик насыщения того же типа, что и на рисунке 2 для каждой ветки. Регистр истории ветвей используется для выбора того, какой из четырех счетчиков насыщения использовать. Если история равна 00, то используется первый счетчик; если история равна 11, то используется последний из четырех счетчиков.

Предположим, например, что условный переход совершается каждый третий раз. Последовательность ветвей — 001001001 . В этом случае запись номер 00 в таблице истории шаблонов перейдет в состояние «сильно занята», что указывает на то, что после двух нулей идет единица. Запись с номером 01 перейдет в состояние «категорически не принято», что указывает на то, что после 01 идет ноль. То же самое и с записью № 10, тогда как запись № 11 никогда не используется, поскольку не бывает двух последовательных записей.

Общее правило двухуровневого адаптивного предсказателя с n-битной историей заключается в том, что он может предсказывать любую повторяющуюся последовательность с любым периодом, если все n-битные подпоследовательности различны. ^[8]

Преимущество двухуровневого адаптивного предсказателя состоит в том, что он может быстро научиться предсказывать произвольную повторяющуюся структуру. Этот метод был изобретен Т.-Ю. Йе и Йель Пэтт из Мичиганского университета . ^[13] С момента первой публикации в 1991 году этот метод стал очень популярным. Варианты этого метода прогнозирования используются в большинстве современных микропроцессоров. ^{[ нужна ссылка ]}

Двухуровневый нейронный предиктор

двухуровневый предиктор ветвления, в котором второй уровень заменен нейронной сетью . Предложен ^[14]

Прогнозирование локальной ветки [ править ]

Локальный предиктор ветвления имеет отдельный буфер истории для каждой инструкции условного перехода. Он может использовать двухуровневый адаптивный предиктор. Буфер истории является отдельным для каждой инструкции условного перехода, в то время как таблица истории шаблонов также может быть отдельной или может использоваться совместно всеми условными переходами.

Intel имеют локальные предсказатели ветвей с локальной 4- битной Pentium MMX , Pentium II и Pentium III историей и таблицу локальной истории шаблонов с 16 записями для каждого условного перехода.

По тестам SPEC '89 очень большие локальные предикторы насыщаются с точностью 97,1%. ^[11]^: 6

Глобальное предсказание ветвей [ править ]

Глобальный предиктор ветвления не ведет отдельную запись истории для каждого условного перехода. Вместо этого он сохраняет общую историю всех условных переходов. Преимущество общей истории состоит в том, что любая корреляция между различными условными переходами является частью прогнозирования. Недостаток заключается в том, что история разбавляется ненужной информацией, если различные условные переходы не коррелированы, и что буфер истории может не включать в себя какие-либо биты из одной и той же ветви, если между ними есть много других ветвей. Он может использовать двухуровневый адаптивный предиктор.

Эта схема лучше, чем схема насыщающего счетчика, только для больших размеров таблиц и редко так же хороша, как локальное предсказание. Буфер истории должен быть длиннее, чтобы сделать хороший прогноз. Размер таблицы истории шаблонов растет экспоненциально с размером буфера истории. Следовательно, большая таблица истории шаблонов должна использоваться всеми условными переходами.

Двухуровневый адаптивный предиктор с глобально общим буфером истории и таблицей истории шаблонов называется предиктором «gshare», если он выполняет xor глобальной истории и ветвящегося ПК, и «gselect», если он объединяет их. Глобальное предсказание ветвлений используется в AMD процессорах Intel Pentium M , Core , Core 2 и Silvermont на базе Atom , а также в процессорах .

Прогнозирование ветвей сплавов [ править ]

Предиктор легированного перехода ^[15] объединяет принципы локального и глобального прогнозирования путем объединения локальной и глобальной истории ветвей, возможно, с некоторыми битами из счетчика программ также . Тесты показывают, что процессор VIA Nano может использовать эту технику. ^[8]

Согласен, предсказатель [ править ]

Согласованный предиктор — это двухуровневый адаптивный предиктор с глобально общим буфером истории и таблицей истории шаблонов, а также дополнительным локальным счетчиком насыщения. Выходные данные локальных и глобальных предикторов объединяются друг с другом с помощью операции XOR, чтобы получить окончательный прогноз. Цель состоит в том, чтобы уменьшить разногласия в таблице истории шаблонов, когда две ветви с противоположным прогнозом используют одну и ту же запись в таблице истории шаблонов. ^[16]

предиктор Гибридный

Гибридный предиктор, также называемый комбинированным предиктором, реализует более одного механизма прогнозирования. Окончательный прогноз основан либо на метапредсказателе, который запоминает, какой из предикторов сделал лучшие прогнозы в прошлом, либо на функции голосования большинства, основанной на нечетном числе различных предикторов.

Скотт Макфарлинг предложил комбинированное предсказание ветвей в своей статье 1993 года. ^[11]

По тестам SPEC'89 такой предиктор примерно так же хорош, как и локальный предиктор. ^{[ нужна ссылка ]}

Предикторы, такие как gshare, используют несколько записей таблицы для отслеживания поведения любой конкретной ветки. Такое умножение записей повышает вероятность того, что две ветви будут отображаться в одной и той же записи таблицы (ситуация, называемая псевдонимами), что, в свою очередь, значительно повышает вероятность того, что точность прогнозирования для этих ветвей пострадает. Если у вас есть несколько предикторов, полезно организовать так, чтобы каждый предиктор имел разные шаблоны наложения псевдонимов, чтобы более вероятно, что хотя бы один предиктор не будет иметь наложения псевдонимов. Комбинированные предикторы с разными функциями индексации для разных предикторов называются предикторами gskew и аналогичны перекошенным ассоциативным кэшам, используемым для кэширования данных и инструкций.

Предсказатель цикла [ править ]

, Условный переход управляющий циклом , лучше всего прогнозировать с помощью специального предсказателя цикла. Условный переход в конце цикла, повторяющийся N раз, будет выполнен N-1 раз, а затем не выполнен ни разу. Если условный переход помещен в начало цикла, он не будет выполнен N-1 раз, а затем выполнен один раз. Условный переход, который выполняется много раз в одну сторону, а затем один раз в другую, обнаруживается как имеющий циклическое поведение. Такой условный переход можно легко предсказать с помощью простого счетчика. Предиктор цикла — это часть гибридного предиктора, где метапредиктор определяет, имеет ли условный переход циклическое поведение.

ветвления Косвенный предиктор

Команда косвенного перехода может выбирать между более чем двумя ветвями. Некоторые процессоры имеют специализированные косвенные предсказатели ветвей. ^[17]^[18] Новые процессоры Intel ^[19] и AMD ^[20] может предсказывать косвенные ветвления, используя двухуровневый адаптивный предиктор. Инструкции такого типа вносят в буфер истории более одного бита. Процессоры zEC12 и более поздние версии z/Architecture от IBM поддерживают Команда BRANCH PREDICTION PRELOAD, которая может предварительно загрузить запись предсказателя ветвления для данной инструкции с целевым адресом ветвления, созданным путем добавления содержимого регистра общего назначения к значению немедленного смещения. ^[21]^[22]

Процессоры без этого механизма просто предсказывают непрямой переход к той же цели, что и в прошлый раз. ^[8]

Прогнозирование возврата функции [ править ]

Функция . обычно возвращается туда, откуда она была вызвана Инструкция возврата представляет собой косвенный переход, который считывает целевой адрес из стека вызовов . Многие микропроцессоры имеют отдельный механизм прогнозирования для инструкций возврата. Этот механизм основан на так называемом буфере стека возврата , который является локальным зеркалом стека вызовов. Размер буфера стека возврата обычно составляет 4–16 записей. ^[8]

Переопределение предсказания ветвей [ править ]

Компромисс между быстрым предсказанием ветвей и хорошим предсказанием ветвей иногда достигается за счет наличия двух предсказателей ветвей. Первый предиктор ветвления работает быстро и просто. Второй предиктор ветвления, который медленнее, сложнее и имеет большие таблицы, переопределит возможно неправильный прогноз, сделанный первым предиктором.

Микропроцессоры Alpha 21264 и Alpha EV8 использовали быстрый однотактный предсказатель следующей строки для обработки повторения целевой ветки и обеспечения простого и быстрого предсказания ветвления. Поскольку предиктор следующей строки очень неточен, а повторение разрешения перехода занимает очень много времени, оба ядра имеют двухтактные вторичные предикторы ветвления, которые могут переопределить предсказание предиктора следующей строки за счет потери одного цикла выборки.

Intel Core i7 имеет два целевых буфера ветвей и, возможно, два или более предсказателей ветвей. ^[23]

ветвей нейронных Прогнозирование

Машинное обучение для предсказания ветвей с использованием LVQ и многослойных персептронов , называемое « нейронным предсказанием ветвей», было предложено Люсианом Винтаном ( Университет Лучиана Блага в Сибиу ). ^[24]Год спустя он разработал предсказатель ветвей перцептрона. ^[25]Исследования в области прогнозирования нейронных ветвей получили дальнейшее развитие Дэниела Хименеса. ^[26]В 2001 году ^[26] был представлен первый предиктор перцептрона , который можно было реализовать аппаратно. Первая коммерческая реализация предсказателя ветвей перцептрона была в микроархитектуре Piledriver компании AMD . ^[27]

Основным преимуществом нейронного предиктора является его способность использовать длинные истории, требуя при этом только линейного роста ресурсов. Классические предикторы требуют экспоненциального роста ресурсов. Хименес сообщает о глобальном улучшении на 5,7% по сравнению с гибридным предсказателем в стиле Макфарлинга. ^[28] Он также использовал gshare/perceptron, переопределяющий гибридные предикторы. ^[28]

Основным недостатком предиктора перцептрона является его высокая задержка. Даже после использования высокоскоростных арифметических приемов задержка вычислений относительно высока по сравнению с тактовым периодом многих современных микроархитектур. Чтобы уменьшить задержку прогнозирования, Хименес в 2003 году предложил нейронный предиктор быстрого пути , в котором предиктор перцептрона выбирает свои веса в соответствии с путем текущей ветви, а не в соответствии с ПК ветки. Эту концепцию развивали многие другие исследователи (А. Сезнец, М. Монкьеро, Д. Тарьян и К. Скадрон, В. Десмет, Аккари и др., К. Аасарааи, Майкл Блэк и др.). ^{[ нужна ссылка ]}

Большинство современных предсказателей ветвей используют предсказатель перцептрона (см. «Чемпионат конкурса предсказаний ветвей» Intel). ^[29]). Intel уже реализовала эту идею в одном из симуляторов IA-64 (2003 г.). ^[30]

AMD Райзен ^[31]^[32]^[33] многоядерного процессора Infinity Fabric и процессор Samsung Exynos включают в себя систему прогнозирования нейронных ветвей на основе перцептрона.

История [ править ]

IBM 7030 Stretch , разработанный в конце 1950-х годов, предварительно выполняет все безусловные переходы и любые условные переходы, которые зависели от индексных регистров. Для других условных ветвей первые две реализованные производственные модели прогнозируют неиспользование; последующие модели были изменены для реализации прогнозов на основе текущих значений битов индикатора (соответствующих сегодняшним кодам условий). ^[34] Разработчики Stretch на ранних этапах проекта рассматривали статические подсказки в инструкциях ветвления, но отказались от них. Восстановление ошибочного прогноза обеспечивалось блоком прогнозирования на Stretch, и часть репутации Stretch как не очень хорошей производительности объяснялась временем, необходимым для восстановления ошибочного прогноза. Последующие разработки больших компьютеров IBM не использовали предсказание ветвей со спекулятивным выполнением до IBM 3090 в 1985 году.

Двухбитовые предсказатели были представлены Томом Маквильямсом и Куртом Уиддосом в 1977 году для суперкомпьютера S-1 Ливерморской национальной лаборатории Лоуренса и независимо Джимом Смитом в 1979 году в CDC. ^[35]

Микропрограммированные процессоры, популярные с 1960-х по 1980-е годы и позже, выполняли несколько циклов на команду и, как правило, не требовали предсказания ветвлений. Однако, помимо IBM 3090, существует несколько других примеров микропрограммных проектов, в которых реализовано предсказание ветвлений.

Burroughs B4900 , микропрограммируемая машина COBOL, выпущенная примерно в 1982 году, была конвейерной и использовала предсказание ветвей. Состояние истории прогнозирования ветвей B4900 сохраняется обратно в инструкции в памяти во время выполнения программы. B4900 реализует прогнозирование ветвления с 4 состояниями, используя 4 семантически эквивалентных кода операции ветвления для представления каждого типа оператора ветвления. Используемый код операции указывает историю этой конкретной инструкции перехода. Если аппаратное обеспечение определяет, что состояние прогнозирования ветвления для конкретной ветки необходимо обновить, оно перезаписывает код операции с использованием семантически эквивалентного кода операции, который указывает на правильную историю. Эта схема имеет показатель успеха 93%. патент США № 4 435 756 На эту схему выдан и другие.

DEC VAX 9000 , анонсированный в 1989 году, является одновременно микропрограммным и конвейерным, а также выполняет прогнозирование ветвлений. ^[36]

Первые коммерческие RISC-процессоры, MIPS R2000 и R3000, а также более ранние процессоры SPARC , выполняют только тривиальное предсказание «непринятых» ветвей. Поскольку они используют слоты задержки ветвления, выбирают только одну инструкцию за цикл и выполняются по порядку, потери производительности нет. Более поздний R4000 использует то же самое тривиальное предсказание «непринятого» перехода и теряет два цикла на каждую взятую ветвь, поскольку повторение разрешения перехода составляет четыре цикла.

Прогнозирование ветвлений стало более важным с появлением конвейерных суперскалярных процессоров, таких как Intel Pentium , DEC Alpha 21064 , MIPS R8000 и серия IBM POWER . Все эти процессоры полагаются на однобитные или простые бимодальные предикторы.

DEC Alpha 21264 (EV6) использует предиктор следующей строки, переопределяемый комбинированным локальным предсказателем и глобальным предсказателем, где выбор объединения осуществляется бимодальным предсказателем. ^[37]

AMD K8 имеет комбинированный бимодальный и глобальный предиктор, где комбинированным выбором является другой бимодальный предиктор. Этот процессор кэширует базовые счетчики бимодальных предсказателей и счетчики выбора в битах кэша L2, которые в противном случае используются для ECC. В результате он фактически имеет очень большие базовые таблицы и таблицы предикторов выбора, а также четность, а не ECC для инструкций в кэше L2. Конструкция четности достаточна, поскольку любая инструкция, содержащая ошибку четности, может быть признана недействительной и повторно выбрана из памяти.

Альфа 21464 ^[37] (EV8, отмененный на позднем этапе проектирования) имел минимальный штраф за неправильное предсказание перехода в 14 циклов. Он должен был использовать сложный, но быстрый предиктор следующей строки, переопределяемый комбинированным бимодальным предиктором и предиктором с большинством голосов. Большинство голосов было между бимодальным и двумя предикторами gskew.

катастрофическую уязвимость системы безопасности под названием Spectre и другие исследователи обнародовали В 2018 году Google Project Zero . Затрагивая практически все современные процессоры , уязвимость включает в себя настройку предсказателей ветвления, поэтому другой процесс (или ядро) неправильно предсказывает ветку и использует секретные данные в качестве индекса массива, удаляя одну из строк кэша злоумышленника. Злоумышленник может запланировать доступ к своему собственному массиву, чтобы выяснить, к какому из них, превращая это внутреннее (микроархитектурное) состояние ЦП в значение, которое злоумышленник может сохранить и которое содержит информацию о значениях, которые он не может прочитать напрямую. ^[38]

См. также [ править ]

Ссылки [ править ]

↑ Перейти обратно: Перейти обратно: ^а ^б ^с Малишевский, Алексей; Бек, Дуглас; Шмид, Андреас; Лэндри, Эрик. «Динамическое предсказание ветвей» . Архивировано из оригинала 17 июля 2019 г. Проверено 22 марта 2017 г.
↑ Перейти обратно: Перейти обратно: ^а ^б Ченг, Чи-Ченг. «Схемы и характеристики предикторов динамической ветви» (PDF) .
^ Парихар, Радж. «Методы и оптимизация прогнозирования ветвей» (PDF) . Архивировано из оригинала (PDF) 16 мая 2017 г. Проверено 2 апреля 2017 г.
^ Мутлу, Онур (11 февраля 2013 г.). «18-447 Лекция по компьютерной архитектуре 11: Прогнозирование ветвей» (PDF) . Архивировано из оригинала (PDF) 25 марта 2015 г.
^ Мишо, Пьер; Сезнец, Андре; Улиг, Ричард (сентябрь 1996 г.). Предикторы перекошенных ветвей . ХАЛ (отчет). S2CID 3712157 .
^ Эйрман, С.; Смит, Дж. Э.; Экхаут, Л. (2006). Характеристика штрафа за неправильное предсказание ветвления . 2006 Международный симпозиум IEEE по анализу производительности систем и программного обеспечения. IEEE. стр. 48–58. дои : 10.1109/ispass.2006.1620789 . ISBN 1-4244-0186-0 . S2CID 72217 .
^ Шен, Джон П.; Липасти, Микко (2005). Современный процессорный дизайн: основы суперскалярных процессоров . Бостон: Высшее образование Макгроу-Хилла . стр. 455 . ISBN 0-07-057064-7 .
↑ Перейти обратно: Перейти обратно: ^а ^б ^с ^д ^и ^ж Туман, Агнер (01 декабря 2016 г.). «Микроархитектура процессоров Intel, AMD и VIA» (PDF) . п. 36 . Проверено 22 марта 2017 г.
^ «Pentium 4 и G4e: архитектурное сравнение» . Арс Техника . 12 мая 2001 г.
^ Плюскеллик, Джим. «CMSC 611: Расширенная компьютерная архитектура, Глава 4 (Часть V)» .
↑ Перейти обратно: Перейти обратно: ^а ^б ^с Макфарлинг, Скотт (июнь 1993 г.). «Объединение предсказателей ветвей» (PDF) . Технический отчет Digital Western Research Lab (WRL), TN-36.
^ «Новый алгоритм улучшает прогнозирование ветвей: 27 марта 1995 г.» (PDF) . Отчет микропроцессора . 9 (4). 27 марта 1995 г. Архивировано (PDF) из оригинала 10 марта 2015 г. Проверено 2 февраля 2016 г.
^ Ага, Т.-Ю.; Патт, Ю.Н. (1991). «Прогнозирование ветвей двухуровневого адаптивного обучения». Материалы 24-го ежегодного международного симпозиума по микроархитектуре . Альбукерке, Нью-Мексико, Пуэрто-Рико: ACM. стр. 51–61. дои : 10.1145/123465.123475 .
^ Иган, Колин; Стивен, Гордон; Быстрый, П.; Ангера, Р.; Винтан, Люциан (декабрь 2003 г.). «Двухуровневое прогнозирование ветвей с использованием нейронных сетей» . Журнал системной архитектуры . 49 (12–15): 557–570. дои : 10.1016/S1383-7621(03)00095-X .
^ Скадрон, К.; Мартоноси, М.; Кларк, Д.В. (октябрь 2000 г.). «Таксономия ошибочных прогнозов ветвей и смешанные прогнозы как надежное решение проблемы ошибочных прогнозов истории» (PDF) . Материалы Международной конференции 2000 года по параллельным архитектурам и методам компиляции . Филадельфия. стр. 199–206. дои : 10.1109/PACT.2000.888344 .
^ Спрэнгл, Э.; Чаппелл, РС; Алсуп, М.; Патт, Ю.Н. (июнь 1997 г.). «Согласный предиктор: механизм уменьшения вмешательства в историю отрицательных ветвей» (PDF) . Материалы 24-го Международного симпозиума по компьютерной архитектуре . Денвер. дои : 10.1145/264107.264210 .
^ «Техническое справочное руководство Cortex-A15 MPCore, раздел 6.5.3 «Косвенный предиктор» » . АРМ Холдингс .
^ Дрисен, Карел; Хёльцле, Урс (25 июня 1997 г.). «Пределы косвенного прогнозирования ветвей» (PDF) . Архивировано из оригинала (PDF) 6 мая 2016 г.
^ Стоукс, Джон (25 февраля 2004 г.). «Взгляд на ядро Centrino: Pentium M» . стр. 2–3.
^ Кантер, Аарон (28 октября 2008 г.). «Анализ производительности Core 2 и K8: Часть 1» . п. 5.
^ z/Принципы работы архитектуры (PDF) (Четырнадцатое изд.). ИБМ . Май 2022 г. стр. 7-42–7-45. SA22-7832-14.
^ «Техническое руководство IBM zEnterprise BC12» (PDF) . ИБМ . Февраль 2014. с. 78.
^ WO 2000/014628 , Йе, Це-Ю и Шарангпани, HP, «Способ и устройство для прогнозирования ветвей с использованием таблицы прогнозирования ветвей второго уровня», опубликовано 16 марта 2000 г.
^ Винтан, Люциан Н. (1999). «На пути к высокопроизводительному предсказателю нейронных ветвей» (PDF) . Труды Международной журнальной конференции по нейронным сетям (IJCNN) . Архивировано из оригинала (PDF) 13 июля 2019 г. Проверено 2 декабря 2010 г.
^ Винтан, Люциан Н. (2000). «На пути к мощному предсказателю динамического ветвления» (PDF) . Румынский журнал информационных наук и технологий . 3 (3). Бухарест: Румынская академия: 287–301. ISSN 1453-8245 .
↑ Перейти обратно: Перейти обратно: ^а ^б Хименес, Д.А.; Лин, К. (2001). «Динамическое предсказание ветвей с помощью персептронов» (PDF) . Материалы 7-го Международного симпозиума по архитектуре высокопроизводительных компьютеров (HPCA-7) . Монтеррей, Нидерланды, Мексика. стр. 197–296. дои : 10.1109/HPCA.2001.903263 .
^ Уолтон, Джаред (15 мая 2012 г.). «Обзор AMD Trinity (A10-4600M): новая надежда» . АнандТех .
↑ Перейти обратно: Перейти обратно: ^а ^б Хименес, Дэниел А. (декабрь 2003 г.). Прогнозирование нейронных ветвей на основе быстрого пути (PDF) . 36-й ежегодный международный симпозиум IEEE/ACM по микроархитектуре (MICRO-36). Сан-Диего, США. стр. 243–252. дои : 10.1109/MICRO.2003.1253199 . Архивировано из оригинала (PDF) 31 марта 2016 г. Проверено 8 апреля 2018 г.
^ «Прогнозирование ветки чемпионата» .
^ Брекельбаум, Эдвард; Рупли, Джефф; Вилкерсон, Крис; Блэк, Брайан (декабрь 2002 г.). «Окна иерархического планирования». Материалы 35-го Международного симпозиума по микроархитектуре . Стамбул, Турция. дои : 10.1109/MICRO.2002.1176236 .
^ Джеймс, Дэйв (6 декабря 2017 г.). «Обзоры AMD Ryzen, новости, производительность, цены и доступность» . PCGamesN .
^ «AMD выводит вычисления на новый горизонт с процессорами Ryzen™» (пресс-релиз). АМД . Проверено 14 декабря 2016 г.
^ «Процессор AMD Zen теперь называется Ryzen, и он может бросить вызов Intel» . Арс Техника Великобритания . Проверено 14 декабря 2016 г.
^ «IBM Stretch (7030) — агрессивный однопроцессорный параллелизм» .
^ «Суперкомпьютер С-1» .
^ Мюррей, Дж. Э.; Салетт, РМ; Хетерингтон, Колорадо; Маккин, FX (1990). «Микроархитектура VAX 9000» . Дайджест статей Compcon Spring '90. Тридцать пятая международная конференция IEEE Computer Society по интеллектуальному использованию . стр. 44–53. дои : 10.1109/CMPCON.1990.63652 . ISBN 0-8186-2028-5 . S2CID 24999559 .
↑ Перейти обратно: Перейти обратно: ^а ^б Сезнец, А.; Феликс, С.; Кришнан, В.; Сазеидес, Ю. «Компромиссы при проектировании предсказателя условного перехода Alpha EV8» . Материалы 29-го ежегодного международного симпозиума по компьютерной архитектуре . дои : 10.1109/ISCA.2002.1003587 .
^ Гиббс, Сэмюэл (04 января 2018 г.). «Meltdown и Spectre: «худшие» ошибки ЦП затрагивают практически все компьютеры» . Хранитель . Проверено 18 мая 2018 г.

Внешние ссылки [ править ]

Сезнец и др. (1996). « Предикторы ветвей с несколькими блоками вперед, архивированные 20 июля 2008 г. в Wayback Machine » - демонстрирует, что точность прогнозирования не ухудшается из-за индексации с предыдущим адресом ветки.
Сезнец и др. (2002). « Компромиссы при проектировании предсказателя условного ветвления Alpha EV8. Архивировано 20 июля 2008 г. в Wayback Machine » - описывает предсказатель ветвления Alpha EV8. В этой статье прекрасно обсуждается, как они пришли к своей конструкции с учетом различных аппаратных ограничений и исследований моделирования.
Хименес (2003). « Пересмотр комплексных предикторов ветвей, заархивированных 27 декабря 2007 г. в Wayback Machine » — описываются предикторы ветвей EV6 и K8, а также соображения по конвейеризации.
Туман, Агнер (2009). «Микроархитектура процессоров Intel, AMD и VIA» . Проверено 1 октября 2009 г.
Эндрюс, Джефф (30 октября 2007 г.). «Реорганизация ветвей и циклов для предотвращения ошибочных прогнозов» . Сеть программного обеспечения Intel . Архивировано из оригинала 11 ноября 2018 г. Проверено 10 ноября 2018 г.
Да, Александр. «Что такое прогнозирование ветвей? – Пример переполнения стека» .

[dbp-class-report-1] Перейти обратно: Перейти обратно: ^а ^б ^с Малишевский, Алексей; Бек, Дуглас; Шмид, Андреас; Лэндри, Эрик. «Динамическое предсказание ветвей» . Архивировано из оригинала 17 июля 2019 г. Проверено 22 марта 2017 г.

[schemes-and-performances-2] Перейти обратно: Перейти обратно: ^а ^б Ченг, Чи-Ченг. «Схемы и характеристики предикторов динамической ветви» (PDF) .

[3] Парихар, Радж. «Методы и оптимизация прогнозирования ветвей» (PDF) . Архивировано из оригинала (PDF) 16 мая 2017 г. Проверено 2 апреля 2017 г.

[4] Мутлу, Онур (11 февраля 2013 г.). «18-447 Лекция по компьютерной архитектуре 11: Прогнозирование ветвей» (PDF) . Архивировано из оригинала (PDF) 25 марта 2015 г.

[5] Мишо, Пьер; Сезнец, Андре; Улиг, Ричард (сентябрь 1996 г.). Предикторы перекошенных ветвей . ХАЛ (отчет). S2CID 3712157 .

[6] Эйрман, С.; Смит, Дж. Э.; Экхаут, Л. (2006). Характеристика штрафа за неправильное предсказание ветвления . 2006 Международный симпозиум IEEE по анализу производительности систем и программного обеспечения. IEEE. стр. 48–58. дои : 10.1109/ispass.2006.1620789 . ISBN 1-4244-0186-0 . S2CID 72217 .

[7] Шен, Джон П.; Липасти, Микко (2005). Современный процессорный дизайн: основы суперскалярных процессоров . Бостон: Высшее образование Макгроу-Хилла . стр. 455 . ISBN 0-07-057064-7 .

[Fog_Microarchitecture-8] Перейти обратно: Перейти обратно: ^а ^б ^с ^д ^и ^ж Туман, Агнер (01 декабря 2016 г.). «Микроархитектура процессоров Intel, AMD и VIA» (PDF) . п. 36 . Проверено 22 марта 2017 г.

[9] «Pentium 4 и G4e: архитектурное сравнение» . Арс Техника . 12 мая 2001 г.

[10] Плюскеллик, Джим. «CMSC 611: Расширенная компьютерная архитектура, Глава 4 (Часть V)» .

[decwrl-tn-36-11] Перейти обратно: Перейти обратно: ^а ^б ^с Макфарлинг, Скотт (июнь 1993 г.). «Объединение предсказателей ветвей» (PDF) . Технический отчет Digital Western Research Lab (WRL), TN-36.

[12] «Новый алгоритм улучшает прогнозирование ветвей: 27 марта 1995 г.» (PDF) . Отчет микропроцессора . 9 (4). 27 марта 1995 г. Архивировано (PDF) из оригинала 10 марта 2015 г. Проверено 2 февраля 2016 г.

[13] Ага, Т.-Ю.; Патт, Ю.Н. (1991). «Прогнозирование ветвей двухуровневого адаптивного обучения». Материалы 24-го ежегодного международного симпозиума по микроархитектуре . Альбукерке, Нью-Мексико, Пуэрто-Рико: ACM. стр. 51–61. дои : 10.1145/123465.123475 .

[14] Иган, Колин; Стивен, Гордон; Быстрый, П.; Ангера, Р.; Винтан, Люциан (декабрь 2003 г.). «Двухуровневое прогнозирование ветвей с использованием нейронных сетей» . Журнал системной архитектуры . 49 (12–15): 557–570. дои : 10.1016/S1383-7621(03)00095-X .

[15] Скадрон, К.; Мартоноси, М.; Кларк, Д.В. (октябрь 2000 г.). «Таксономия ошибочных прогнозов ветвей и смешанные прогнозы как надежное решение проблемы ошибочных прогнозов истории» (PDF) . Материалы Международной конференции 2000 года по параллельным архитектурам и методам компиляции . Филадельфия. стр. 199–206. дои : 10.1109/PACT.2000.888344 .

[16] Спрэнгл, Э.; Чаппелл, РС; Алсуп, М.; Патт, Ю.Н. (июнь 1997 г.). «Согласный предиктор: механизм уменьшения вмешательства в историю отрицательных ветвей» (PDF) . Материалы 24-го Международного симпозиума по компьютерной архитектуре . Денвер. дои : 10.1145/264107.264210 .

[17] «Техническое справочное руководство Cortex-A15 MPCore, раздел 6.5.3 «Косвенный предиктор» » . АРМ Холдингс .

[18] Дрисен, Карел; Хёльцле, Урс (25 июня 1997 г.). «Пределы косвенного прогнозирования ветвей» (PDF) . Архивировано из оригинала (PDF) 6 мая 2016 г.

[19] Стоукс, Джон (25 февраля 2004 г.). «Взгляд на ядро Centrino: Pentium M» . стр. 2–3.

[20] Кантер, Аарон (28 октября 2008 г.). «Анализ производительности Core 2 и K8: Часть 1» . п. 5.

[21] z/Принципы работы архитектуры (PDF) (Четырнадцатое изд.). ИБМ . Май 2022 г. стр. 7-42–7-45. SA22-7832-14.

[22] «Техническое руководство IBM zEnterprise BC12» (PDF) . ИБМ . Февраль 2014. с. 78.

[23] WO 2000/014628 , Йе, Це-Ю и Шарангпани, HP, «Способ и устройство для прогнозирования ветвей с использованием таблицы прогнозирования ветвей второго уровня», опубликовано 16 марта 2000 г.

[24] Винтан, Люциан Н. (1999). «На пути к высокопроизводительному предсказателю нейронных ветвей» (PDF) . Труды Международной журнальной конференции по нейронным сетям (IJCNN) . Архивировано из оригинала (PDF) 13 июля 2019 г. Проверено 2 декабря 2010 г.

[25] Винтан, Люциан Н. (2000). «На пути к мощному предсказателю динамического ветвления» (PDF) . Румынский журнал информационных наук и технологий . 3 (3). Бухарест: Румынская академия: 287–301. ISSN 1453-8245 .

[jimenez-perceptrons-26] Перейти обратно: Перейти обратно: ^а ^б Хименес, Д.А.; Лин, К. (2001). «Динамическое предсказание ветвей с помощью персептронов» (PDF) . Материалы 7-го Международного симпозиума по архитектуре высокопроизводительных компьютеров (HPCA-7) . Монтеррей, Нидерланды, Мексика. стр. 197–296. дои : 10.1109/HPCA.2001.903263 .

[27] Уолтон, Джаред (15 мая 2012 г.). «Обзор AMD Trinity (A10-4600M): новая надежда» . АнандТех .

[jimenez-micro-36-28] Перейти обратно: Перейти обратно: ^а ^б Хименес, Дэниел А. (декабрь 2003 г.). Прогнозирование нейронных ветвей на основе быстрого пути (PDF) . 36-й ежегодный международный симпозиум IEEE/ACM по микроархитектуре (MICRO-36). Сан-Диего, США. стр. 243–252. дои : 10.1109/MICRO.2003.1253199 . Архивировано из оригинала (PDF) 31 марта 2016 г. Проверено 8 апреля 2018 г.

[29] «Прогнозирование ветки чемпионата» .

[30] Брекельбаум, Эдвард; Рупли, Джефф; Вилкерсон, Крис; Блэк, Брайан (декабрь 2002 г.). «Окна иерархического планирования». Материалы 35-го Международного симпозиума по микроархитектуре . Стамбул, Турция. дои : 10.1109/MICRO.2002.1176236 .

[31] Джеймс, Дэйв (6 декабря 2017 г.). «Обзоры AMD Ryzen, новости, производительность, цены и доступность» . PCGamesN .

[32] «AMD выводит вычисления на новый горизонт с процессорами Ryzen™» (пресс-релиз). АМД . Проверено 14 декабря 2016 г.

[33] «Процессор AMD Zen теперь называется Ryzen, и он может бросить вызов Intel» . Арс Техника Великобритания . Проверено 14 декабря 2016 г.

[34] «IBM Stretch (7030) — агрессивный однопроцессорный параллелизм» .

[35] «Суперкомпьютер С-1» .

[36] Мюррей, Дж. Э.; Салетт, РМ; Хетерингтон, Колорадо; Маккин, FX (1990). «Микроархитектура VAX 9000» . Дайджест статей Compcon Spring '90. Тридцать пятая международная конференция IEEE Computer Society по интеллектуальному использованию . стр. 44–53. дои : 10.1109/CMPCON.1990.63652 . ISBN 0-8186-2028-5 . S2CID 24999559 .

[seznec-37] Перейти обратно: Перейти обратно: ^а ^б Сезнец, А.; Феликс, С.; Кришнан, В.; Сазеидес, Ю. «Компромиссы при проектировании предсказателя условного перехода Alpha EV8» . Материалы 29-го ежегодного международного симпозиума по компьютерной архитектуре . дои : 10.1109/ISCA.2002.1003587 .

[38] Гиббс, Сэмюэл (04 января 2018 г.). «Meltdown и Spectre: «худшие» ошибки ЦП затрагивают практически все компьютеры» . Хранитель . Проверено 18 мая 2018 г.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

[15]

[16]

[17]

[18]

[19]

[20]

[21]

[22]

[23]

[24]

[25]

[26]

[27]

[28]

[29]

[30]

[31]

[32]

[33]

[34]

[35]

[36]

[37]

[38]