серия GeForce 400
Дата выпуска | 12 апреля 2010 г |
---|---|
Кодовое имя | GF10x |
Архитектура | Ферми |
Модели | серия GeForce
|
Транзисторы | 260M, 40 нм (только GT218 — GeForce 405)
|
Карты | |
Начальный уровень | ГТ 420 ГТ 430 |
Средний уровень | ГТ 440 ГТС 450 ГТХ 460 ГТХ 465 |
Высококачественный | ГТХ 470 ГТХ 480 |
API Поддержка | |
ДиректХ | Direct3D 11.0 ( уровень функций 11_0) [ 1 ] Шейдерная модель 5.1 |
OpenCL | ОпенCL 1.1 |
OpenGL | OpenGL 4.6 |
История | |
Предшественник | серия GeForce 200 |
Преемник | серия GeForce 500 |
Статус поддержки | |
Не поддерживается |
Серия GeForce 400 — это серия графических процессоров , разработанная Nvidia и представляющая собой внедрение микроархитектуры Fermi . Его выпуск первоначально был запланирован на ноябрь 2009 года. [ 2 ] однако после задержек он был выпущен 26 марта 2010 г., а доступность появится в апреле 2010 г.
Его прямым конкурентом была ATI серия Radeon HD 5000 .
Архитектура
[ редактировать ]Nvidia описала микроархитектуру Fermi как следующий важный шаг в своей линейке графических процессоров после микроархитектуры Tesla, используемой со времен G80 . GF100, первый продукт с архитектурой Fermi, имеет большие размеры: 512 потоковых процессоров , сгруппированных в шестнадцать групп по 32, и 3,0 миллиарда транзисторов, изготовленных TSMC по 40-нм техпроцессу. Это первый чип Nvidia, поддерживающий OpenGL 4.0 и Direct3D 11 . Ни одна продукция с полностью включенным графическим процессором GF100 никогда не продавалась. У GTX 480 был отключен один потоковый мультипроцессор. У GTX 470 были отключены два потоковых мультипроцессора и один контроллер памяти. У GTX 465 было отключено пять потоковых мультипроцессоров и два контроллера памяти. Потребительские карты GeForce поставлялись с 256 МБ памяти, подключенными к каждому из включенных контроллеров памяти GDDR5, что в общей сложности составляло 1,5, 1,25 или 1,0 ГБ; у Tesla C2050 было 512 МБ на каждом из шести контроллеров, а у Tesla C2070 — 1024 МБ на каждый контроллер. Обе карты Tesla имели четырнадцать активных групп потоковых процессоров.
Чипы находятся в высокопроизводительной Tesla фирменной памяти с дополнительным ECC и способностью выполнять одну операцию с плавающей запятой двойной точности за цикл на ядро; потребительские карты GeForce искусственно ограничены драйверами одной операцией DP за четыре цикла. Благодаря этим функциям в сочетании с поддержкой Visual Studio и C++ Nvidia ориентировалась на профессиональные и коммерческие рынки, а также на использование в высокопроизводительных вычислениях .
Ферми назван в честь итальянского физика Энрико Ферми .
Текущие ограничения и компромиссы
[ редактировать ]Количество встроенной SRAM на одно ALU фактически уменьшилось пропорционально по сравнению с предыдущим поколением G200, несмотря на увеличение кэша L2 с 256 КБ на 240 ALU до 768 КБ на 512 ALU, поскольку у Fermi всего 32768 регистров на 32 ALU (против 16384). на 8 ALU), только 48 КБ общей памяти на 32 ALU (против 16 КБ на 8 ALU) и только 16 КБ кэша на 32 ALU (против 8 КБ постоянного кэша на 8 ALU + 24 КБ текстурного кэша на 24 ALU). Такие параметры, как количество регистров, можно найти в таблице сравнения вычислительных возможностей CUDA в справочном руководстве. [ 3 ]
История
[ редактировать ]30 сентября 2009 г. Nvidia выпустила официальный документ с описанием архитектуры: [ 4 ] чип оснащен 16 «потоковыми мультипроцессорами», каждый из которых имеет 32 «ядра CUDA», способными выполнять одну операцию одинарной точности за цикл или одну операцию двойной точности каждый второй цикл, 40-битное виртуальное адресное пространство, которое позволяет отображать память хоста в адресное пространство чипа, что означает, что существует только один тип указателя, что значительно упрощает поддержку C++, а также 384-битный интерфейс памяти GDDR5 . Как и в G80 и GT200 , потоки планируются в «варпах» — наборах по 32 потока, каждый из которых выполняется на одном шейдерном ядре. В то время как GT200 имел 16 КБ «общей памяти», связанной с каждым шейдерным кластером, и требовал, чтобы данные считывались через блоки текстурирования, если был необходим кэш, GF100 имеет 64 КБ памяти, связанной с каждым кластером, которую можно использовать либо в качестве Кэш 48 КБ плюс 16 КБ общей памяти или кэш 16 КБ плюс 48 КБ общей памяти вместе с кэшем L2 объемом 768 КБ, общим для всех 16 кластеров.
В официальном документе чип описывается скорее как процессор общего назначения для рабочих нагрузок, охватывающих десятки тысяч потоков (напоминающий архитектуру Tera MTA , хотя и без поддержки этой машиной очень эффективного произвольного доступа к памяти), чем как графический процессор.
Многие пользователи сообщали о высоких температурах и энергопотреблении, в то же время получая соответственно низкий прирост производительности графических процессоров Fermi серии GeForce 400 по сравнению с конкурирующей серией AMD Radeon HD 5000 , что побудило AMD создать и выпустить рекламный видеоролик «Недоразумение». [ 5 ] посмеяться над этим вопросом. На видео видно, как полицейское подразделение начинает рейд на дом с большим тепловым профилем, что указывает на операцию по выращиванию . Однако при входе в дом становится ясно, что источником высокой температуры является графический процессор Fermi. [ 6 ] [ 7 ] Стало распространённой шуткой, что можно поджарить яйцо . на графическом процессоре Fermi при полной нагрузке [ 8 ]
Продукты
[ редактировать ]- 1 SPs — Шейдерные процессоры — Унифицированные шейдеры : Единицы отображения текстур : Единицы вывода рендеринга
- 2 Каждый потоковый мультипроцессор (SM) в графическом процессоре архитектуры GF100 содержит 32 SP и 4 SFU. Каждый потоковый мультипроцессор (SM) в графическом процессоре архитектуры GF104/106/108 содержит 48 SP и 8 SFU. Каждый SP может выполнять две операции умножения-сложения одинарной точности ( FMA ) за цикл. Каждый SFU может выполнять четыре операции SF за цикл. Одна операция FMA засчитывается за две операции с плавающей запятой. Таким образом, теоретическая пиковая производительность одинарной точности с количеством шейдеров [ n ] и частотой шейдеров [ f , ГГц] может быть оценена по следующей формуле: FLOPS sp ≈ f × n × 2 (FMA). Общая вычислительная мощность: для GF100 FLOPS sp ≈ f × m × (32 SP × 2(FMA) + 4 × 4 SFU) и для GF104/106/108 FLOPS sp ≈ f × m × (48 SP × 2(FMA) + 4×8 SFU) или для GF100 FLOPS sp ≈ f×n×2,5 и для GF104/106/108 FLOPS sp ≈ f×n×8/3. [ 9 ]
SP — шейдерный процессор (Unified Shader, CUDA Core), SFU — блок специальных функций, SM — потоковый мультипроцессор.
- 3 Каждый SM в GF100 содержит 4 блока фильтрации текстур для каждого блока адреса текстуры. Полный кристалл GF100 содержит 64 блока адресации текстур и 256 блоков фильтрации текстур. [ 10 ] Каждый SM в архитектуре GF104/106/108 содержит 8 блоков фильтрации текстур для каждого блока адреса текстуры. Полный кристалл GF104 содержит 64 блока текстурных адресов и 512 блоков текстурной фильтрации, полный кристалл GF106 содержит 32 блока текстурных адресов и 256 блоков текстурной фильтрации, а полный кристалл GF108 содержит 16 блоков текстурных адресов и 128 блоков текстурных фильтров. [ 11 ]
Вся продукция производится по технологическому процессу 40 нм. Все продукты поддерживают Direct3D 12.0 на уровне функций 11_0, OpenGL 4.6 и OpenCL 1.1. Единственным исключением является GeForce 405, карта, предназначенная только для OEM-производителей, которая основана на ядре GT218 ( Tesla ), поддерживает только DirectX 10.1, OpenGL 3.3 и не поддерживает OpenCL, и является единственной картой в линейке GeForce 400, не основанной на Микроархитектура Ферми. По параметрам GeForce 405 идентична GeForce 310 , также OEM-карте, которая сама основана на GeForce 210 . Все продукты имеют один разъем VGA DB15 на плате полной высоты и полной длины, если не указано иное.
8 ноября 2010 года Nvidia выпустила чип GF110 вместе с GTX 580 (замена 480). Это переработанный чип GF100, который потребляет значительно меньше энергии. Это позволило Nvidia включить все 16 SM (все 16 ядер), что ранее было невозможно на GF100. «Нвидиа GeForce GTX 580» . Различные функции архитектуры GF100 были доступны только на более дорогих сериях карт Quadro и Tesla. [ 12 ] Для потребительских продуктов GeForce производительность двойной точности составляет четверть производительности «полной» архитектуры Fermi. Проверка и исправление ошибок памяти (ECC) также не работает на потребительских картах. [ 13 ] Карты GF100 обеспечивают вычислительные возможности 2.0, а карты GF104/106/108 — вычислительные возможности 2.1.
Прекращена поддержка
[ редактировать ]Nvidia объявила, что после выпуска драйверов Release 390 она больше не будет выпускать 32-битные драйверы для 32-битных операционных систем. [ 14 ]
В апреле 2018 года Nvidia объявила, что Fermi перейдет на статус поддержки устаревших драйверов и будет поддерживаться до января 2019 года. [ 15 ]
Таблица чипсета
[ редактировать ]Модель | Запуск | Кодовое имя | Потрясающе ( нм ) | Транзисторы (млн) | Размер матрицы (мм 2 ) | количество SM | Основная конфигурация [ а ] [ б ] | Тактовая частота | Скорость заполнения | Конфигурация памяти | Поддерживаемая API версия | Вычислительная мощность ( ГФЛОПС ) [ с ] | TDP (Ватт) [ д ] | Цена выпуска (долл. США) | ||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Ядро ( МГц ) | Шейдер ( МГц ) | Память ( МГц ) | Пиксель ( ГП /с) | Текстура ( ГТ /с) | Размер ( МБ ) | Пропускная способность ( ГБ /с) | Тип DRAM | Ширина шины ( бит ) | Вулкан | Директ3D | OpenGL | OpenCL [ и ] | Одинарная точность | Двойная точность | ||||||||||
видеокарта 405 [ ж ] | 16 сентября 2011 г. | GT216 GT218 |
40 нм | 486 260 |
100 57 |
1 | 48:16:8 16:8:4 |
475 589 |
1100 1402 |
800 790 |
3.8 2.36 |
7.6 4.71 |
512 1024 |
12.6 | DDR3 | 64 | н/д [ 18 ] | 10.1 | 3.3 | 1.1 | 105.6 44.86 |
Unknown | 30.5 | OEM |
GeForce GT 420 | 3 сентября 2010 г. | ГФ108 | ТСМК 40 нм | 585 | 116 | 48:4:4 | 700 | 1400 | 1800 | 2.8 | 2.8 | 512 | 28.8 | ГДДР3 | 128 | 12 ЭТ 11_1 | 4.6 | 134.4 | Unknown | 50 | ||||
GeForce GT 430 | 11 октября 2010 г. | ГФ108 ГФ108-300-А1 |
2 | 96:16:4 | 1600 1800 |
11.2 | 512 | 25.6 28.8 |
1.2 | 268.8 | Unknown | 60 | ||||||||||||
1800 | 512 1024 2048 |
28.8 | 128 | 1.1 | 268.8 | Неизвестный | 49 | $79 | ||||||||||||||||
1300 | 10.4 | 64 | ||||||||||||||||||||||
GeForce GT 440 | 1 февраля 2011 г. | ГФ108 | 810 | 1620 | 1800 3200 |
3.2 | 12.9 | 512 1024 |
28.8 51.2 |
ГДДР3 ГДДР5 |
128 | 311.04 | Unknown | 65 | $100 | |||||||||
11 октября 2010 г. | ГФ106 | 1170 | 238 | 3 | 144:24:24 | 594 | 1189 | 1600 1800 |
4.86 | 19.44 | 1536 3072 |
43.2 | DDR3 | 192 | 342.43 | Unknown | 56 | OEM | ||||||
GeForce ГТС 450 | 790 | 1580 | 4000 | 4.7 | 18.9 | 1536 | 96.0 | ГДДР5 | 455.04 | Unknown | 106 | |||||||||||||
13 сентября 2010 г. 15 марта 2011 г. |
ГФ106-250 ГФ116-200 |
4 | 192:32:16 | 783 | 1566 | 1200-1600 (ГДДР3) 3608 (ГДДР5) |
6.2 | 25.0 | 512 1024 |
57.7 | 128 | 601.34 | Unknown | 106 | $129 | |||||||||
GeForce GTX 460 SE | 15 ноября 2010 г. | ГФ104-225-А1 | 1950 | 332 | 6 | 288:48:32 | 650 | 1300 | 3400 | 7.8 | 31.2 | 1024 | 108.8 | 256 | 748.8 | Unknown | 150 | $160 | ||||||
GeForce GTX 460 | 11 октября 2010 г. | ГФ104 | 7 | 336:56:32 | 9.1 | 36.4 | 1024 | 108.8 | 873.6 | Unknown | OEM | |||||||||||||
12 июля 2010 г. | ГФ104-300-КБ-А1 | 336:56:24 | 675 | 1350 | 3600 | 9.4 | 37.8 | 768 | 86.4 | 192 | 907.2 | Неизвестный | $199 | |||||||||||
336:56:32 | 1024 2048 |
115.2 | 256 | 160 | $229 | |||||||||||||||||||
24 сентября 2011 г. | ГФ114 | 336:56:24 | 779 | 1557 | 4008 | 10.9 | 43.6 | 1024 | 96.2 | 192 | 1045.6 | Unknown | $199 | |||||||||||
GeForce GTX 465 | 31 мая 2010 г. | ГФ100-030-А3 | 3000 [ 19 ] | 529 | 11 | 352:44:32 | 608 | 1215 | 3206 | 13.3 | 26.7 | 1024 | 102.7 | 256 | 1.2 | 855.36 | 106.92 | 200 [ д ] | $279 | |||||
GeForce GTX 470 | 26 марта 2010 г. | ГФ100-275-А3 | 14 | 448:56:40 | 3348 | 17.0 | 34.0 | 1280 | 133.9 | 320 | 1088.64 | 136.08 | 215 [ д ] | $349 | ||||||||||
GeForce GTX 480 | 26 марта 2010 г. | ГФ100-375-А3 | 15 | 480:60:48 | 701 | 1401 | 3696 | 21.0 | 42.0 | 1536 | 177.4 | 384 | 1344.96 | 168.12 | 250 [ д ] | $499 | ||||||||
Модель | Запуск | Кодовое имя | Потрясающе ( нм ) | Транзисторы (млн) | Размер матрицы (мм 2 ) | количество SM | Основная конфигурация [ а ] [ б ] | Тактовая частота | Скорость заполнения | Конфигурация памяти | Поддерживаемая API версия | Вычислительная мощность ( ГФЛОПС ) [ с ] | TDP (Ватт) [ д ] | Цена выпуска (долл. США) | ||||||||||
Ядро ( МГц ) | Шейдер ( МГц ) | Память ( МГц ) | Пиксель ( ГП /с) | Текстура ( ГТ /с) | Размер ( МБ ) | Пропускная способность ( ГБ /с) | Тип DRAM | Ширина шины ( бит ) | Вулкан | Директ3D | OpenGL | OpenCL [ и ] | Одинарная точность | Двойная точность |
- ^ Jump up to: а б Унифицированные шейдеры : блоки наложения текстур : блоки вывода рендеринга.
- ^ Jump up to: а б Каждый SM в GF100 содержит 4 блока фильтрации текстур для каждого блока адреса текстуры. Полный кристалл GF100 содержит 64 блока адресации текстур и 256 блоков фильтрации текстур. [ 10 ] Каждый SM в архитектуре GF104/106/108 содержит 8 блоков фильтрации текстур для каждого блока адреса текстуры, но имеет удвоенное количество блоков адресации и фильтрации. Полный кристалл GF104 также содержит 64 блока текстурных адресов и 512 блоков текстурной фильтрации, несмотря на уменьшенное вдвое количество SM, полный кристалл GF106 содержит 32 блока текстурных адресов и 256 блоков текстурной фильтрации, а полный кристалл GF108 содержит 16 блоков текстурных адресов и 128 блоков текстурных фильтров. . [ 16 ]
- ^ Jump up to: а б Чтобы рассчитать вычислительную мощность, см. Fermi (microarchitecture)#Performance .
- ^ Jump up to: а б с д и Обратите внимание: хотя TDP GTX 460 сравним с TDP серии AMD HD5000, карты на базе GF100 (GTX 480/470/465) имеют гораздо более низкий рейтинг, но потребляют значительно больше энергии, например GTX 480 с TDP 250 Вт потребляет больше энергии, чем HD 5970. с TDP 297 Вт. [ 17 ]
- ^ Jump up to: а б Серия 400 — единственное семейство не OEM, от серии GeForce 9 до 700, которое не включает официальную систему с двумя графическими процессорами. Однако 18 марта 2011 года EVGA выпустила первую карту с одной печатной платой и двумя процессорами 460 на борту. Карта имела 2048 МБ памяти на частоте 3600 МГц и 672 шейдерных процессора на частоте 1400 МГц и предлагалась по рекомендованной розничной цене 429 долларов.
- ^ Карта GeForce 405 представляет собой обновленную версию GeForce 310, которая сама по себе является переименованной GeForce 210.
См. также
[ редактировать ]- серия GeForce 200
- серия GeForce 500
- серия GeForce 600
- серия GeForce 700
- Серия GeForce 800M
- серия GeForce 900
- Нвидиа Квадро
- Нвидия Тесла
Примечания
[ редактировать ]- Дэвид Кантер (30 сентября 2009 г.). «Внутри Fermi: продвижение HPC от Nvidia» . Realworldtech.com . Проверено 16 декабря 2010 г.
Ссылки
[ редактировать ]- ^ Киллиан, Зак (3 июля 2017 г.). «Nvidia наконец-то позволила владельцам графических процессоров Fermi насладиться DirectX 12» . Технический отчет . Проверено 4 июля 2017 г.
- ^ «ОФИЦИАЛЬНО: NVIDIA сообщает, что выпуск GT300 запланирован на четвертый квартал 2009 года, доходность хорошая — Яркая сторона новостей*» . Brightsideofnews.com. 25 сентября 2009 года . Проверено 20 сентября 2010 г.
- ^ Таблица сравнения вычислительных возможностей в «Страницы 147–148, Приложение G.1, официальное справочное руководство CUDA 3.1» (PDF) . На странице 97 в Приложении A перечислены старые графические процессоры NVIDIA и показано, что все серии G200 имеют вычислительную мощность 1.3, тогда как карты на базе Fermi имеют вычислительную мощность 2.x (стр. 14, раздел 2.5).
- ^ Технический документ по вычислительной архитектуре NVIDIA Fermi nvidia.com
- ^ Архивировано в Ghostarchive и Wayback Machine : «Недоразумение – представлено AMD» . Ютуб .
- ^ «AMD высмеивает тепловыделение графического процессора NVIDIA Fermi в видео «Недоразумение»» . 9 августа 2010 г.
- ^ «Графические процессоры NVIDIA Fermi GF100 — слишком мало, слишком поздно, слишком жарко и слишком дорого» . ЗДНет .
- ^ «GeForce GTX 480: достаточно ли жарко, чтобы пожарить яйцо?» . Архивировано из оригинала 20 сентября 2019 года . Проверено 20 сентября 2019 г.
- ^ Siliconmadness.com (2010). «Nvidia анонсирует Tesla 20 Series» . Архивировано из оригинала 21 мая 2010 года.
- ^ Jump up to: а б «Обзор GF100 — GeForce GTX 480 и GTX 470 от Nvidia: опоздание на 6 месяцев, стоило ли ждать?» . Anandtech.com . Архивировано из оригинала 5 августа 2011 года . Проверено 11 декабря 2015 г.
- ^ Смит, Райан. «NVIDIA GeForce GTX 460: король за 200 долларов» . www.anandtech.com . Проверено 16 мая 2024 г.
- ^ «Официальные форумы NVIDIA» . NVIDIA . Проверено 16 мая 2024 г.
- ^ «Веб-страница NVIDIA Tesla C2xxx» . , обратите внимание, из описания можно сделать вывод, что на Teslas ECC можно включать и выключать, используя 1/8 имеющейся встроенной памяти, в отличие от стандартных модулей памяти ECC, которым требуется 1/8 дополнительных микросхем памяти (то есть одна дополнительная микросхема устанавливается на печатную плату каждые 8).
- ^ «План поддержки 32-битных и 64-битных операционных систем | NVIDIA» .
- ^ «План поддержки графических процессоров GeForce серии Fermi | NVIDIA» .
- ^ «GF104: Nvidia становится суперскалярной — GeForce GTX 460 от Nvidia: король за 200 долларов» . Anandtech.com . Архивировано из оригинала 22 декабря 2015 года . Проверено 11 декабря 2015 г.
- ^ «GeForce GTX 480 и 470: от Fermi и GF100 к настоящим картам!» . Tomshardware.com . 27 марта 2010 года . Проверено 11 декабря 2015 г.
- ^ «Группа Хронос» . 31 мая 2022 г.
- ^ «Информационный документ по вычислительной архитектуре NVIDIA Fermi» (PDF) . Архивировано (PDF) из оригинала 22 ноября 2009 г. Проверено 17 апреля 2010 г. ( 855КБ) , страница 11 из 22
Внешние ссылки
[ редактировать ]- Следующее поколение NVIDIA GeForce
- Ферми архитектура
- Обзор GTX 400
- GeForce GTX 480
- GeForce GTX 470
- GeForce GTX 465
- GeForce GTX 460
- GeForce ГТС 450
- GeForce GT 440
- GeForce GT 430
- GeForce GTX 485M
- GeForce GTX 480M
- GeForce GTX 470M
- GeForce GTX 460M
- GeForce GT 445M
- GeForce GT 435M
- GeForce GT 425M
- GeForce GT 420M
- GeForce GT 415M
- GeForce 410М
- видеокарта 405
- Нвидиа Нсайт
- techPowerUp! База данных графического процессора