Maxwell (микроархитектура)

Maxwell — кодовое название микроархитектуры графических процессоров, разработанной Nvidia в качестве преемника микроархитектуры Kepler. Архитектура Maxwell была введена в более поздних моделях GeForce 700 Series, а также используется в GeForce 800M Series, GeForce 900 Series и Quadro Mxxx serie. Nvidia для новой архитектуры Maxwell взяла в качестве основы Kepler и доработала её в нескольких областях. В архитектуре Maxwell потоковый мультипроцессор SMX был переименован в SMM (англ. Streaming Maxwell Multiprocessor), делящийся на четыре блока по 32 потоковых процессора. В общей сложности кластер SMM содержит 128 потоковых процессоров. Менее сложная логика управления обеспечивает более эффективное распределение задач по ядрам CUDA. Площадь чипа увеличилась на 25 % с 118 мм² до 148 мм². В то же время количество транзисторов выросло с 1,3 млрд до 1,87 млрд, что соответствует приросту на 44 %. Причина кроется в изменении компоновки чипа.

Maxwell
Дата выпуска Февраль 2014
Производители TSMC

Микроархитектура названа в честь Джеймса Клерка Максвелла, основателя теории электромагнитного излучения.

Особенности архитектуры Nvidia Maxwell

Увеличенная выделенная общая память

В архитектуре Maxwell предусмотрено 64 Кбайт распределённой (регистровой) памяти, в то время как в Fermi или Kepler эта память делится между L1-кэшем и распределённой памятью. В Maxwell один блок может использовать до 48 Кбайт распределённой памяти, причём увеличение общего объёма этой памяти может привести к увеличению нагрузки мультипроцессора. Это стало возможным благодаря сочетанию функциональности L1-кэша и текстурного кэша в отдельном блоке.

Более быстрые атомарные операции в разделённой памяти

В архитектуре Maxwell появились встроенные атомарные операции над 32-битными целыми числами в распределённой памяти, а также CAS-операции над 32-битными и 64-битными значениями в памяти — с помощью них можно реализовать другие атомарные функции. В случае Kepler и Fermi приходилось использовать сложный принцип «Lock / Update / Unlock», что приводило к дополнительным расходам.

Динамический параллелизм

Динамический параллелизм, который появился в Kepler GK110, позволяет GPU самому создавать задачи для себя. Поддержка этой функции была впервые добавлена в CUDA 5.0, позволяя потокам на GK110 запускать дополнительные ядра на том же GPU.

Тайловый рендеринг

Впервые для Nvidia и серии видеокарт GeForce была введена технология тайлового рендеринга для увеличения производительности и уменьшения нагрузки на память.[1][2] В то же время у конкурентов в лице AMD её практически нет, данная технология отсутствует до сих пор по настоящее время, исключением лишь является серия VEGA с HBM памятью.

Сравнение Kepler и Maxwell

ХарактеристикиKeplerMaxwell
GPUGK107 (Kepler)GM107 (Maxwell)
Ядра CUDA384640
Базовая частота1058 МГц1020 МГц
Boost-частота GPUн/д1085 МГц
Гигафлопс812,51305,6
Вычислительные возможности3.05.0
Распределённая память / SM16 КБ / 48 КБ64 КБ
Размер регистрового файла / SM256 КБ256 КБ
Максимальное количество блоков1632
Частота памяти5000 МГц5400 МГц
Размер L2-кэша256 КБ2048 КБ
TDP64 Вт60 Вт
Транзисторы1,3 млрд1,87 млрд.
Площадь кристалла118 мм²148 мм²
Техпроцесс28 нм28 нм

Преемник

Следующая архитектура после Maxwell появилась под кодовым названием Pascal.[3]

Примечания

  1. Раскрыт главный секрет эффективности новых архитектур NVIDIA. 3DNews - Daily Digital Digest. Дата обращения: 1 марта 2019.
  2. Тайловый рендеринг – секретный рецепт архитектуры Maxwell/Pascal. www.hardwareluxx.ru. Дата обращения: 1 марта 2019.
  3. NVIDIA Updates GPU Roadmap; Announces Pascal // Официальный блог NVIDIA, 25 марта 2014 г
This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. Additional terms may apply for the media files.