F16C

F16C ^[1] (ранее/неофициально известный как CVT16 ) — это x86 расширение архитектуры набора команд , которое обеспечивает поддержку преобразования между форматами с плавающей запятой половинной точности и стандартными форматами IEEE с плавающей запятой одинарной точности .

История

Набор инструкций CVT16, анонсированный AMD 1 мая 2009 г., ^[2] является расширением 128-битных инструкций ядра SSE в наборе инструкций x86 и AMD64 .

CVT16 — это переработка части предложения набора инструкций SSE5 , анонсированного 30 августа 2007 г., которая дополнена наборами инструкций XOP и FMA4 . Эта версия делает двоичное кодирование предлагаемых новых инструкций более совместимым с Intel расширениями инструкций AVX , при этом функциональность инструкций остается неизменной.

В недавних документах имя F16C официально используется в спецификациях архитектуры Intel и AMD x86-64 .

Техническая информация

Существуют варианты, которые преобразуют четыре значения с плавающей запятой в регистр XMM или 8 значений с плавающей запятой в регистр YMM .

Инструкции представляют собой аббревиатуры от «векторного преобразования упакованной половины в упакованную одинарную» и наоборот:

VCVTPH2PS xmmreg,xmmrm64 – преобразовать четыре значения с плавающей запятой половинной точности в памяти или нижнюю половину регистра XMM в четыре значения с плавающей запятой одинарной точности в регистре XMM.
VCVTPH2PS ymmreg,xmmrm128 – преобразовать восемь значений с плавающей запятой половинной точности в памяти или регистре XMM (нижняя половина регистра YMM) в восемь значений с плавающей запятой одинарной точности в регистре YMM.
VCVTPS2PH xmmrm64,xmmreg,imm8 – преобразовать четыре значения с плавающей запятой одинарной точности в регистре XMM в значения с плавающей запятой половинной точности в памяти или в нижнюю половину регистра XMM.
VCVTPS2PH xmmrm128,ymmreg,imm8 – преобразовать восемь значений с плавающей запятой одинарной точности в регистре YMM в значения с плавающей запятой половинной точности в памяти или регистре XMM.

8-битный непосредственный аргумент для VCVTPS2PH выбирает режим округления . Значения 0–4 выбирают ближайший, нижний, верхний, усеченный и режим, установленный в MXCSR.RC.

О поддержке этих инструкций свидетельствует бит 29 ECX после CPUID с EAX=1 .

Процессоры с F16C

АМД :
- на базе Jaguar Процессоры
- на базе Puma Процессоры
- Процессоры «Тяжелое оборудование»
  - Процессоры на базе Bulldozer , IV квартал 2011 г. ^[3]
  - Процессоры на базе Piledriver , IV квартал 2012 г. ^[4]
  - Процессоры на базе Steamroller , 1 квартал 2014 г.
  - Процессоры на базе экскаваторов , 2 квартал 2015 г.
- Процессоры на базе Zen , первый квартал 2017 г. и новее
Интел :
- Процессоры Ivy Bridge и новее

Ссылки

^ Чак Уолборн (11 сентября 2012 г.). «DirectXMath: F16C и FMA» .
^ «128-битные и 256-битные инструкции XOP, FMA4 и CVT16» (PDF) . Руководство программиста по архитектуре AMD64 . Том. 6. 01 мая 2009 г. Архивировано из оригинала (PDF) 20 мая 2009 г. Проверено 5 июля 2022 г.
^ Дэйв Кристи (07 мая 2009 г.), Поддерживая баланс , Блоги разработчиков AMD, заархивировано из оригинала 9 ноября 2013 г. , получено 17 января 2012 г.
^ Новые инструкции для «Бульдозера» и «Сваебойщика» (PDF) , AMD, октябрь 2012 г.

Внешние ссылки

Новые инструкции для бульдозеров и сваебойщиков [1]. Архивировано 7 января 2013 г. в Wayback Machine.
Математика DirectX F16C и FMA [2]
Руководство программиста по архитектуре AMD64, том 1 [3]. Архивировано 14 декабря 2013 г. на Wayback Machine.
Руководство программиста по архитектуре AMD64, том 2 [4]
Руководство программиста по архитектуре AMD64, том 3 [5]. Архивировано 14 декабря 2013 г. на Wayback Machine.
Руководство программиста по архитектуре AMD64, том 4 [6]. Архивировано 14 ноября 2021 г. на Wayback Machine.
Руководство программиста по архитектуре AMD64, том 5 [7]. Архивировано 14 декабря 2013 г. на Wayback Machine.
Руководство разработчика программного обеспечения для архитектуры IA32 [8]

[1] Чак Уолборн (11 сентября 2012 г.). «DirectXMath: F16C и FMA» .

[2] «128-битные и 256-битные инструкции XOP, FMA4 и CVT16» (PDF) . Руководство программиста по архитектуре AMD64 . Том. 6. 01 мая 2009 г. Архивировано из оригинала (PDF) 20 мая 2009 г. Проверено 5 июля 2022 г.

[3] Дэйв Кристи (07 мая 2009 г.), Поддерживая баланс , Блоги разработчиков AMD, заархивировано из оригинала 9 ноября 2013 г. , получено 17 января 2012 г.

[4] Новые инструкции для «Бульдозера» и «Сваебойщика» (PDF) , AMD, октябрь 2012 г.

[1]

[2]

[3]

[4]

v т и Intel Технология
Platforms	Centrino Centrino 2 Viiv MID Tablet CULV Ultrabook Skulltrail NUC Galileo Edison Curie Evo
Discontinued	Common Building Block MultiProcessor Specification Intel Communication Streaming Architecture Intel Inboard 386 Intel Play MMC-1 MMC-2
Current	Advanced Programmable Interrupt Controller CNVi Intel Turbo Boost vPro Intel Secure Key Intel Management Engine Active Management Technology AMT versions High-bandwidth Digital Content Protection High Definition Audio Hub Architecture Rapid Storage Technology SpeedStep Serial Digital Video Out Host Embedded Controller Interface Hyper-threading Omni-Path Platform Environment Control Interface QuickPath Interconnect Platform Controller Hub System Management Bus Thunderbolt Ultra Path Interconnect
Upcoming	Silicon Photonics Link

v т и набора команд Расширения
SIMD ( РИСК )	Альфа седые волосы РУКА НЕОН ВСЕ МИПС МДМС МИПС-3D МХУ МИПС SIMD ПА-РИСК МАКС Мощность ОДИН ВМХ СПАРК ВИС
SIMD ( x86 )	ММХ (1996) 3DСейчас! (1998) ССЕ (1999) ССЕ2 (2001) ССЕ3 (2004) СССЭ3 (2006 г.) ССЕ4 (2006) ССЕ5 ~~(2007)~~ АВКС (2008) Ф16С (2009) ХОП (2009) FMA (FMA4: 2011, FMA3: 2012) АВХ2 (2013) АВХ-512 (2015) АМХ (2022 г.) AVX10 (2023)
Битовые манипуляции	ИМТ (ABM: 2007, BMI1: 2012, BMI2: 2013, TBM: 2012) ADX (2014)
Сжатые инструкции	Большой палец MIPS16e ASE РВК
Безопасность и криптография	Замок (2003) АЭС-НИ (2008 г.); ARMv8 также имеет инструкции AES. КЛМУЛ (2010) РДРАНД (2012) ША (2013) МПХ (2015) СГХ (2015) ТДКС (2021)
Транзакционная память	ТСХ (2013) АЧС
Виртуализация	ВТ-х (2005) AMD-V (2006) ВТ-д (AMD-Vi)
Даты приостановленных продлений ~~зачеркнуты~~ .