⇡#Двухчиповые видеоадаптеры на NVIDIA GK110 и AMD Hawaii
Когда одиночные GPU не могут обеспечить прогресс вычислительной мощности, на помощь приходит проверенное решение — двухпроцессорные графические карты. И хотя систему SLI/CrossFire можно было собрать из двух отдельных видеокарт GeForce GTX 780/780 Ti или Radeon R9 290/290X сразу, как только они появились в продаже, двухголовый монстр — это вопрос престижа производителя.
NVIDIA было легче справиться с задачей, ведь GK110 — более холодный чип по сравнению с Hawaii, гордостью AMD. Трехслотовая система охлаждения выглядит пугающе, но благодаря ей GTX TITAN Z может заменить сборку из двух дискретных GTX TITAN Black в одном корпусе. TITAN Z позиционируется как микс игровой и профессиональной видеокарты, что подкрепляют полностью разблокированные блоки FP64 в графических процессорах. Вот только цена обескураживает: ни много ни мало 3 тысячи долларов (на тысячу дороже пары TITAN Black). TITAN Z может быть востребован как ускоритель неграфических вычислений для компактных рабочих станций, но не будем кривить душой: это притянутое за уши оправдание для такой безумной наценки.
NVIDIA GeForce GTX TITAN Z
Работая над конкурирующим продуктом — R9 295X2 — AMD пошла на радикальные меры: два GPU Hawaii на одной плате ничуть не потеряли в частотах по сравнению с одиночными видеокартами, а стало быть, и тепловыделение достигает 300 Вт на брата. Но вместо того чтобы наращивать габариты воздушного кулера, Radeon R9 295X2 сделали первым графическим адаптером, который оснащается системой жидкостного охлаждения в референсной конфигурации.
AMD Radeon R9 295X2
DirectX 12
Выпустив API Mantle, AMD простимулировала развитие DirectX. До этого момента уже складывалось впечатление, что для наиболее универсального API наступил конец истории. Действительно, крупного обновления DirectX не знал с 2009 года. Грядущий релиз DirectX 12 сосредоточен не на расширении функций рендеринга, а на оптимизации runtime-библиотеки API.
AMD показала, что при определенной нагрузке DirectX 11 является бутылочным горлышком, ограничивающим производительность системы. Речь идет о ситуациях, когда экранное пространство наполнено множеством отдельных объектов, пусть и с простой геометрией. В таком случае время центрального процессора расходуется совсем не так эффективно, как при использовании того же Mantle.
Переработанный конвейер рендеринга Direct3D 12 лишен этого недостатка. Кроме того, API в целом стал более низкоуровневым, чем Direct3D 11. Некоторые функции, которые библиотека Direct3D 11 выполняет сама, теперь возложены на графический движок приложения, что, с одной стороны, дает возможность более эффективно распоряжаться ресурсами, а с другой — усложняет задачу разработчика.
Потенциально все GPU, работающие под управлением DirectX 11, совместимы с DirectX 12. Но следует различать собственно runtime-библиотеку API и новый feature level — набор функций рендеринга. Microsoft приняла в стандарт несколько технологий, которые, впрочем, не будут особо заметны на экране. В будущие GPU их будут внедрять на аппаратном уровне.
Cпецификации API уже финализированы в достаточной степени, чтобы разработчики приложений могли заранее приступить к внедрению DX12. Mircosoft пообещала появление первых игр с поддержкой DX12 в конце 2015 года. Будущее Mantle в связи с этой новостью выглядит туманным, хотя игры с его поддержкой продолжают выходить.
⇡#Что было
Дебют NVIDIA Maxwell
Для NVIDIA потенциал техпроцесса 28 нм далеко не исчерпан. В рамках архитектуры Kepler удалось выпустить такой крупный процессор, как GK110, состоящий из 7,1 млрд транзисторов, не выйдя за рамки теплового пакета 250 Вт, который является ориентиром для мощных дискретных GPU. Но Maxwell показал, что еще есть пространство для дополнительных оптимизаций.
В чипах Maxwell NVIDIA переработала топологию потокового мультипроцессора (SMM) — унифицированного строительного блока GPU, упростив логику планировщиков нагрузки. В результате удалось существенно сократить площадь SMM, сохранив около 90% исходной производительности. Как итог — практически удвоенный показатель производительности на единицу мощности в сравнении с Kepler, причем не только на бумаге, но и на практике.
Пока существует четыре десктопных видеоадаптера семейства Maxwell — GeForce GTX 750/750 Ti, GeForce GTX 970 и GTX 980. Остальные позиции в модельном ряду NVIDIA занимают продукты на базе Kepler. В целом «зеленая» линейка сейчас довольно сложно структурирована и включает одновременно представителей серий GeForce 600, GeForce 700 и GeForce 900. Путаницу усиливает тот факт, что NVIDIA пропустила серию GeForce 800 для десктопных адаптеров.
Игровые видеокарты начального уровня GeForce GTX 750 и GTX 750 Ti на чипе GM107 стали пробным шаром для Maxwell, который впервые продемонстрировал потрясающую энергоэффективность новой архитектуры. В тестах GTX 750 Ti одержал победу над GeForce GTX 650 Ti и Radeon R7 260X, энергопотребление которых практически вдвое выше.
NVIDIA GeForce GTX 750 Ti
Гораздо более важно, что NVIDIA удалось перенести преимущества Maxwell на более крупный GPU — GM204. Согласно действующей номенклатуре, это второй по старшинству чип в линейке: он включает 5,2 млрд транзисторов (для сравнения: GK110 — 7,1 млрд)
Несмотря на это, GeForce GTX 980 стал эквивалентной заменой GeForce GTX 780 Ti по производительности, притом что по энергопотреблению эта карта сравнима с GeForce GTX 770. Но если посмотреть другой стороны, то на практике GTX 980 не дает практически никакого прироста быстродействия по сравнению с GTX 780 Ti. Единственная реальная польза — это то, что благодаря удешевлению производства цена флагманской платы с одним GPU на момент релиза опустилась до привычной отметки $549.
NVIDIA GeForce GTX 980
GeForce GTX 970, в котором у GM204 отключена часть вычислительных блоков, — в практическом плане куда более интересная карта, чем GTX 980. Блоки, конечно, отключены, но в результате GTX 970 мало уступает в реальной производительности своему старшему родственнику и играет на равных с Radeon R9 290X. При этом официальная цена карты — скромные для без пяти минут флагмана $329.
AMD могла ответить на эту атаку только одним способом — сбросить цены на Radeon R9 290/290X до такого же уровня. Выставить равного соперника для GeForce GTX 980 «красные» пока не в состоянии. Тем не менее AMD сохраняет прочную позицию в сфере GP-GPU (неграфических вычислений), поскольку архитектура GCN изначально заточена под такие приложения. NVIDIA, напротив, в последних итерациях своего кремния сократила управляющую логику, которая имеет большое значение для большинства расчетных задач.
GM204 также наделили специфическими функциями рендеринга, которые NVIDIA использует для ускорения VXGI (Voxel Global Illumination) — метода глобального освещения на базе вокселов, работающего в реальном времени. Демонстрации весьма впечатляют, но, как обычно бывает с эксклюзивными технологиями, внедрение VXGI в реальных играх зависит от того, войдут ли необходимые алгоритмы в новый feature level DirectX 12 (об этом мы поговорим ниже).
VXGI в действии