Jump to content

серия GeForce 400

серия GeForce 400
GeForce GTX 480, выпущенная в 2010 году как флагманская модель 400-й серии. Эта конкретная модель произведена партнером Nvidia, компанией Asus .
Дата выпуска 12 апреля 2010 г .; 14 лет назад ( 12 апреля 2010 г. )
Кодовое имя GF10x
Архитектура Ферми
Модели серия GeForce
  • Серия GeForce GT
  • Серия GeForce GTS
  • Серия GeForce GTX
Транзисторы 260M, 40 нм (только GT218 — GeForce 405)
  • 585М 40 нм (GF108)
  • 1,170 М 40 нм (GF106)
  • 1,950 м, 40 нм (GF104)
  • 1,950 м, 40 нм (GF114)
  • 3.200M 40 нм (GF100)
Карты
Начальный уровень ГТ 420
ГТ 430
Средний уровень ГТ 440
ГТС 450
ГТХ 460
ГТХ 465
Высококачественный ГТХ 470
ГТХ 480
API Поддержка
ДиректХ Direct3D 11.0 ( уровень функций 11_0) [1]
Шейдерная модель 5.1
OpenCL ОпенCL 1.1
OpenGL OpenGL 4.6
История
Предшественник серия GeForce 200
Преемник серия GeForce 500
Статус поддержки
Не поддерживается

Серия GeForce 400 — это серия графических процессоров , разработанная Nvidia и представляющая собой внедрение микроархитектуры Fermi . Его выпуск первоначально был запланирован на ноябрь 2009 года. [2] однако после задержек он был выпущен 26 марта 2010 г., а доступность появится в апреле 2010 г.

Его прямым конкурентом была ATI серия Radeon HD 5000 .

Архитектура

[ редактировать ]

Nvidia описала микроархитектуру Fermi как следующий важный шаг в своей линейке графических процессоров после микроархитектуры Tesla, используемой со времен G80 . GF100, первый продукт с архитектурой Fermi, имеет большие размеры: 512 потоковых процессоров , сгруппированных в шестнадцать групп по 32, и 3,0 миллиарда транзисторов, изготовленных TSMC по 40-нм техпроцессу. Это первый чип Nvidia, поддерживающий OpenGL 4.0 и Direct3D 11 . Ни одна продукция с полностью включенным графическим процессором GF100 никогда не продавалась. У GTX 480 был отключен один потоковый мультипроцессор. У GTX 470 были отключены два потоковых мультипроцессора и один контроллер памяти. У GTX 465 было отключено пять потоковых мультипроцессоров и два контроллера памяти. Потребительские карты GeForce поставлялись с 256 МБ памяти, подключенными к каждому из включенных контроллеров памяти GDDR5, что в общей сложности составляло 1,5, 1,25 или 1,0 ГБ; у Tesla C2050 было 512 МБ на каждом из шести контроллеров, а у Tesla C2070 — 1024 МБ на каждый контроллер. Обе карты Tesla имели четырнадцать активных групп потоковых процессоров.

Чипы находятся в высокопроизводительной Tesla фирменной памяти с дополнительным ECC и способностью выполнять одну операцию с плавающей запятой двойной точности за цикл на ядро; потребительские карты GeForce искусственно ограничены драйверами одной операцией DP за четыре цикла. Благодаря этим функциям в сочетании с поддержкой Visual Studio и C++ Nvidia ориентировалась на профессиональные и коммерческие рынки, а также на использование в высокопроизводительных вычислениях .

Ферми назван в честь итальянского физика Энрико Ферми .

Текущие ограничения и компромиссы

[ редактировать ]

Количество встроенной SRAM на одно ALU фактически уменьшилось пропорционально по сравнению с предыдущим поколением G200, несмотря на увеличение кэша L2 с 256 КБ на 240 ALU до 768 КБ на 512 ALU, поскольку у Fermi всего 32768 регистров на 32 ALU (против 16384). на 8 ALU), только 48 КБ общей памяти на 32 ALU (против 16 КБ на 8 ALU) и только 16 КБ кэша на 32 ALU (против 8 КБ постоянного кэша на 8 ALU + 24 КБ текстурного кэша на 24 ALU). Такие параметры, как количество регистров, можно найти в таблице сравнения вычислительных возможностей CUDA в справочном руководстве. [3]

30 сентября 2009 г. Nvidia выпустила официальный документ с описанием архитектуры: [4] чип оснащен 16 «потоковыми мультипроцессорами», каждый из которых имеет 32 «ядра CUDA», способными выполнять одну операцию одинарной точности за цикл или одну операцию двойной точности каждый второй цикл, 40-битное виртуальное адресное пространство, которое позволяет отображать память хоста в адресное пространство чипа, что означает, что существует только один тип указателя, что значительно упрощает поддержку C++, а также 384-битный интерфейс памяти GDDR5 . Как и в G80 и GT200 , потоки планируются в «варпах» — наборах по 32 потока, каждый из которых выполняется на одном шейдерном ядре. В то время как GT200 имел 16 КБ «общей памяти», связанной с каждым шейдерным кластером, и требовал, чтобы данные считывались через блоки текстурирования, если был необходим кэш, GF100 имеет 64 КБ памяти, связанной с каждым кластером, которую можно использовать либо в качестве Кэш 48 КБ плюс 16 КБ общей памяти или кэш 16 КБ плюс 48 КБ общей памяти вместе с кэшем L2 объемом 768 КБ, общим для всех 16 кластеров.

Печатная плата и кристалл GTX 480

В официальном документе чип описывается скорее как процессор общего назначения для рабочих нагрузок, охватывающих десятки тысяч потоков (напоминающий архитектуру Tera MTA , хотя и без поддержки этой машиной очень эффективного произвольного доступа к памяти), чем как графический процессор.

Многие пользователи сообщали о высоких температурах и энергопотреблении, в то же время получая соответственно низкий прирост производительности графических процессоров Fermi серии GeForce 400 по сравнению с конкурирующей серией AMD Radeon HD 5000 , что побудило AMD создать и выпустить рекламный видеоролик «Недоразумение». [5] посмеяться над этим вопросом. На видео видно, как полицейское подразделение начинает рейд на дом с большим тепловым профилем, что указывает на операцию по выращиванию . Однако при входе в дом становится ясно, что источником высокой температуры является графический процессор Fermi. [6] [7] Стало распространённой шуткой, что можно поджарить яйцо . на графическом процессоре Fermi при полной нагрузке [8]

Продукты

[ редактировать ]
GTX480 в ПК
  • 1 SPs — Шейдерные процессоры — Унифицированные шейдеры : Единицы отображения текстур : Единицы вывода рендеринга
  • 2 Каждый потоковый мультипроцессор (SM) в графическом процессоре архитектуры GF100 содержит 32 SP и 4 SFU. Каждый потоковый мультипроцессор (SM) в графическом процессоре архитектуры GF104/106/108 содержит 48 SP и 8 SFU. Каждый SP может выполнять две операции умножения-сложения одинарной точности ( FMA ) за цикл. Каждый SFU может выполнять четыре операции SF за цикл. Одна операция FMA засчитывается за две операции с плавающей запятой. Таким образом, теоретическая пиковая производительность одинарной точности с количеством шейдеров [ n ] и частотой шейдеров [ f , ГГц] может быть оценена по следующей формуле: FLOPS sp ≈ f × n × 2 (FMA). Общая вычислительная мощность: для GF100 FLOPS sp ≈ f × m × (32 SP × 2(FMA) + 4 × 4 SFU) и для GF104/106/108 FLOPS sp ≈ f × m × (48 SP × 2(FMA) + 4×8 SFU) или для GF100 FLOPS sp ≈ f×n×2,5 и для GF104/106/108 FLOPS sp ≈ f×n×8/3. [9]

SP — шейдерный процессор (Unified Shader, CUDA Core), SFU — блок специальных функций, SM — потоковый мультипроцессор.

  • 3 Каждый SM в GF100 содержит 4 блока фильтрации текстур для каждого блока адреса текстуры. Полный кристалл GF100 содержит 64 блока адресации текстур и 256 блоков фильтрации текстур. [10] Каждый SM в архитектуре GF104/106/108 содержит 8 блоков фильтрации текстур для каждого блока адреса текстуры. Полный кристалл GF104 содержит 64 блока текстурных адресов и 512 блоков текстурной фильтрации, полный кристалл GF106 содержит 32 блока текстурных адресов и 256 блоков текстурной фильтрации, а полный кристалл GF108 содержит 16 блоков текстурных адресов и 128 блоков текстурных фильтров. [11]

Вся продукция производится по технологическому процессу 40 нм. Все продукты поддерживают Direct3D 12.0 на уровне функций 11_0, OpenGL 4.6 и OpenCL 1.1. Единственным исключением является GeForce 405, карта, предназначенная только для OEM-производителей, которая основана на ядре GT218 ( Tesla ), поддерживает только DirectX 10.1, OpenGL 3.3 и не поддерживает OpenCL, и является единственной картой в линейке GeForce 400, не основанной на Микроархитектура Ферми. По параметрам GeForce 405 идентична GeForce 310 , также OEM-карте, которая сама основана на GeForce 210 . Все продукты имеют один разъем VGA DB15 на плате полной высоты и полной длины, если не указано иное.

8 ноября 2010 года Nvidia выпустила чип GF110 вместе с GTX 580 (замена 480). Это переработанный чип GF100, который потребляет значительно меньше энергии. Это позволило Nvidia включить все 16 SM (все 16 ядер), что ранее было невозможно на GF100. «Нвидиа GeForce GTX 580» . Различные функции архитектуры GF100 были доступны только на более дорогих сериях карт Quadro и Tesla. [12] Для потребительских продуктов GeForce производительность двойной точности составляет четверть производительности «полной» архитектуры Fermi. Проверка и исправление ошибок памяти (ECC) также не работает на потребительских картах. [13] Карты GF100 обеспечивают вычислительные возможности 2.0, а карты GF104/106/108 — вычислительные возможности 2.1.

Прекращена поддержка

[ редактировать ]

Nvidia объявила, что после выпуска драйверов Release 390 она больше не будет выпускать 32-битные драйверы для 32-битных операционных систем. [14]

В апреле 2018 года Nvidia объявила, что Fermi перейдет на статус поддержки устаревших драйверов и будет поддерживаться до января 2019 года. [15]

Таблица чипсета

[ редактировать ]
Модель Запуск Кодовое имя Потрясающе ( нм ) Транзисторы (млн) Размер матрицы (мм 2 ) количество SM Основная конфигурация [а] [б] Тактовая частота Скорость заполнения Конфигурация памяти Поддерживаемая API версия Вычислительная мощность ( ГФЛОПС ) [с] TDP (Ватт) [д] Цена выпуска (долл. США)
Ядро ( МГц ) Шейдер ( МГц ) Память ( МГц ) Пиксель ( ГП /с) Текстура ( ГТ /с) Размер ( МБ ) Пропускная способность ( ГБ /с) Тип DRAM Ширина шины ( бит ) Вулкан Директ3D OpenGL OpenCL [и] Одинарная точность Двойная точность
видеокарта 405 [ф] 16 сентября 2011 г. GT216
GT218
40 нм 486
260
100
57
1 48:16:8
16:8:4
475
589
1100
1402
800
790
3.8
2.36
7.6
4.71
512
1024
12.6 DDR3 64 н/д [18] 10.1 3.3 1.1 105.6
44.86
Un­known 30.5 OEM
GeForce GT 420 3 сентября 2010 г. ГФ108 ТСМК 40 нм 585 116 48:4:4 700 1400 1800 2.8 2.8 512 28.8 ГДДР3 128 12 ЭТ 11_1 4.6 134.4 Un­known 50
GeForce GT 430 11 октября 2010 г. ГФ108
ГФ108-300-А1
2 96:16:4 1600
1800
11.2 512 25.6
28.8
1.2 268.8 Un­known 60
1800 512
1024
2048
28.8 128 1.1 268.8 Неизвестный 49 $79
1300 10.4 64
GeForce GT 440 1 февраля 2011 г. ГФ108 810 1620 1800
3200
3.2 12.9 512
1024
28.8
51.2
ГДДР3
ГДДР5
128 311.04 Un­known 65 $100
11 октября 2010 г. ГФ106 1170 238 3 144:24:24 594 1189 1600
1800
4.86 19.44 1536
3072
43.2 DDR3 192 342.43 Un­known 56 OEM
GeForce ГТС 450 790 1580 4000 4.7 18.9 1536 96.0 ГДДР5 455.04 Un­known 106
13 сентября 2010 г.
15 марта 2011 г.
ГФ106-250
ГФ116-200
4 192:32:16 783 1566 1200-1600 (ГДДР3)
3608 (ГДДР5)
6.2 25.0 512
1024
57.7 128 601.34 Un­known 106 $129
GeForce GTX 460 SE 15 ноября 2010 г. GF104-225-A1 1950 332 6 288:48:32 650 1300 3400 7.8 31.2 1024 108.8 256 748.8 Un­known 150 $160
GeForce GTX 460 11 октября 2010 г. ГФ104 7 336:56:32 9.1 36.4 1024 108.8 873.6 Un­known OEM
12 июля 2010 г. ГФ104-300-КБ-А1 336:56:24 675 1350 3600 9.4 37.8 768 86.4 192 907.2 Неизвестный $199
336:56:32 1024
2048
115.2 256 160 $229
24 сентября 2011 г. ГФ114 336:56:24 779 1557 4008 10.9 43.6 1024 96.2 192 1045.6 Un­known $199
GeForce GTX 465 31 мая 2010 г. ГФ100-030-А3 3000 [19] 529 11 352:44:32 608 1215 3206 13.3 26.7 1024 102.7 256 1.2 855.36 106.92 200 [д] $279
GeForce GTX 470 26 марта 2010 г. ГФ100-275-А3 14 448:56:40 3348 17.0 34.0 1280 133.9 320 1088.64 136.08 215 [д] $349
GeForce GTX 480 26 марта 2010 г. ГФ100-375-А3 15 480:60:48 701 1401 3696 21.0 42.0 1536 177.4 384 1344.96 168.12 250 [д] $499
Модель Запуск Кодовое имя Потрясающе ( нм ) Транзисторы (млн) Размер матрицы (мм 2 ) количество SM Основная конфигурация [а] [б] Тактовая частота Скорость заполнения Конфигурация памяти Поддерживаемая API версия Вычислительная мощность ( ГФЛОПС ) [с] TDP (Ватт) [д] Цена выпуска (долл. США)
Ядро ( МГц ) Шейдер ( МГц ) Память ( МГц ) Пиксель ( ГП /с) Текстура ( ГТ /с) Размер ( МБ ) Пропускная способность ( ГБ /с) Тип DRAM Ширина шины ( бит ) Вулкан Директ3D OpenGL OpenCL [и] Одинарная точность Двойная точность
  1. ^ Jump up to: а б Унифицированные шейдеры : блоки наложения текстур : блоки вывода рендеринга.
  2. ^ Jump up to: а б Каждый SM в GF100 содержит 4 блока фильтрации текстур для каждого блока адреса текстуры. Полный кристалл GF100 содержит 64 блока адресации текстур и 256 блоков фильтрации текстур. [10] Каждый SM в архитектуре GF104/106/108 содержит 8 блоков фильтрации текстур для каждого блока адреса текстуры, но имеет удвоенное количество блоков адресации и фильтрации. Полный кристалл GF104 также содержит 64 блока текстурных адресов и 512 блоков текстурной фильтрации, несмотря на уменьшенное вдвое количество SM, полный кристалл GF106 содержит 32 блока текстурных адресов и 256 блоков текстурной фильтрации, а полный кристалл GF108 содержит 16 блоков текстурных адресов и 128 блоков текстурных фильтров. . [16]
  3. ^ Jump up to: а б Чтобы рассчитать вычислительную мощность, см. Fermi (microarchitecture)#Performance .
  4. ^ Jump up to: а б с д и Обратите внимание: хотя TDP GTX 460 сравним с TDP серии AMD HD5000, карты на базе GF100 (GTX 480/470/465) имеют гораздо более низкий рейтинг, но потребляют значительно больше энергии, например GTX 480 с TDP 250 Вт потребляет больше энергии, чем HD 5970. с TDP 297 Вт. [17]
  5. ^ Jump up to: а б Серия 400 — единственное семейство не OEM-производителей от серий GeForce 9 до 700, не имеющее официальной системы с двумя графическими процессорами. Однако 18 марта 2011 года EVGA выпустила первую карту с одной печатной платой и двумя процессорами 460 на борту. Карта имела 2048 МБ памяти на частоте 3600 МГц и 672 шейдерных процессора на частоте 1400 МГц и предлагалась по рекомендованной розничной цене 429 долларов.
  6. ^ Карта GeForce 405 представляет собой обновленную версию GeForce 310, которая сама по себе является переименованной GeForce 210.

См. также

[ редактировать ]

Примечания

[ редактировать ]
  1. ^ Киллиан, Зак (3 июля 2017 г.). «Nvidia наконец-то позволила владельцам графических процессоров Fermi насладиться DirectX 12» . Технический отчет . Проверено 4 июля 2017 г.
  2. ^ «ОФИЦИАЛЬНО: NVIDIA сообщает, что выпуск GT300 запланирован на четвертый квартал 2009 года, доходность хорошая — Яркая сторона новостей*» . Brightsideofnews.com. 25 сентября 2009 года . Проверено 20 сентября 2010 г.
  3. ^ Таблица сравнения вычислительных возможностей в «Страницы 147–148, Приложение G.1, официальное справочное руководство CUDA 3.1» (PDF) . На странице 97 в Приложении A перечислены старые графические процессоры NVIDIA и показано, что все серии G200 имеют вычислительную мощность 1.3, тогда как карты на базе Fermi имеют вычислительную мощность 2.x (стр. 14, раздел 2.5).
  4. ^ Технический документ по вычислительной архитектуре NVIDIA Fermi nvidia.com
  5. ^ Архивировано в Ghostarchive и Wayback Machine : «Недоразумение – представлено AMD» . Ютуб .
  6. ^ «AMD высмеивает тепловыделение графического процессора NVIDIA Fermi в видео «Недоразумение»» . 9 августа 2010 г.
  7. ^ «Графические процессоры NVIDIA Fermi GF100 — слишком мало, слишком поздно, слишком жарко и слишком дорого» . ЗДНет .
  8. ^ «GeForce GTX 480: достаточно ли жарко, чтобы пожарить яйцо?» . Архивировано из оригинала 20 сентября 2019 года . Проверено 20 сентября 2019 г.
  9. ^ Siliconmadness.com (2010). «Nvidia анонсирует Tesla 20 Series» . Архивировано из оригинала 21 мая 2010 года.
  10. ^ Jump up to: а б «Обзор GF100 — GeForce GTX 480 и GTX 470 от Nvidia: опоздание на 6 месяцев, стоило ли ждать?» . Anandtech.com . Архивировано из оригинала 5 августа 2011 года . Проверено 11 декабря 2015 г.
  11. ^ Смит, Райан. «NVIDIA GeForce GTX 460: король за 200 долларов» . www.anandtech.com . Проверено 16 мая 2024 г.
  12. ^ «Официальные форумы NVIDIA» . NVIDIA . Проверено 16 мая 2024 г.
  13. ^ «Веб-страница NVIDIA Tesla C2xxx» . , обратите внимание, из описания можно сделать вывод, что на Teslas ECC можно включать и выключать, используя 1/8 имеющейся встроенной памяти, в отличие от стандартных модулей памяти ECC, которым требуется 1/8 дополнительных микросхем памяти (то есть одна дополнительная микросхема устанавливается на печатную плату каждые 8).
  14. ^ «План поддержки 32-битных и 64-битных операционных систем | NVIDIA» .
  15. ^ «План поддержки графических процессоров GeForce серии Fermi | NVIDIA» .
  16. ^ «GF104: Nvidia становится суперскалярной — GeForce GTX 460 от Nvidia: король за 200 долларов» . Anandtech.com . Архивировано из оригинала 22 декабря 2015 года . Проверено 11 декабря 2015 г.
  17. ^ «GeForce GTX 480 и 470: от Fermi и GF100 к настоящим картам!» . Tomshardware.com . 27 марта 2010 года . Проверено 11 декабря 2015 г.
  18. ^ «Группа Хронос» . 31 мая 2022 г.
  19. ^ «Информационный документ по вычислительной архитектуре NVIDIA Fermi» (PDF) . Архивировано (PDF) из оригинала 22 ноября 2009 г. Проверено 17 апреля 2010 г.   ( 855КБ) , страница 11 из 22
[ редактировать ]
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: c16466a4aaab48f5d6d7bb73898a8db8__1719941040
URL1:https://arc.ask3.ru/arc/aa/c1/b8/c16466a4aaab48f5d6d7bb73898a8db8.html
Заголовок, (Title) документа по адресу, URL1:
GeForce 400 series - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)