Производительность SLI
Итак, мы знаем, что такое SLI, как он работает и что вам нужно для его использования. Но стоит ли вам бросаться покупать вторую GTX 1080 Ti? Здесь «вода становится мутной». В то время как Nvidia утверждает, что удвоение производительности возможно при удвоении количества карт, это случается редко.
Проблема в том, что игры изначально не знают, как правильно использовать несколько видеокарт, и разработчики должны добавлять в них профили SLI. Это не простая задача, и она может занять очень много времени, поэтому большинство разработчиков не тратят на это время.
Это означает, что если вы не играете в игру ААА, возможно, что не будет никакого увеличения производительности (фактически, даже есть вероятность снижения производительности).
Производительность для каждой игры будет отличаться. Так что это не значит, что это будет совершенно бесполезно для вас, просто вы должны знать об этом, прежде чем инвестировать в технологию или какие-либо конкретные игры.
Assassin’s Creed: Unity и Far Cry 4 — первые отголоски «некстгена»
Что же, перейдем к нашей «вишенке на торте». Посмотрим, как поведет себя трио GeForce GTX 980 в новых играх Ubisoft.
Небольшой дисклеймер: игры вышли больно неоптимизированными, поэтому полученные результаты не могут быть на 100% релевантными. К тому же и в Assassin’s Creed: Unity, и в Far Cry 4 реализованы далеко не все заявленные графические технологии. В общем, ждем патчей. После стабилизации ситуации вокруг этих игр я всенепременно добавлю их в обновленную методику тестирования видеокарт. Надеюсь, что это произойдет в самое ближайшее время. А пока давайте проанализируем эффективность работы 3-Way SLI, так сказать, по горячим следам.
Начну с Assassin’s Creed: Unity. Незадолго до выпуска игры Ubisoft анонсировала системные требования. В минимальных значится видеокарта GeForce GTX 680 (то есть, по сути, GeForce GTX 770), что очень лихо даже по сегодняшним меркам. Естественно, меня, а также моих коллег заинтересовала эта игра. Однако что это: маркетинговый ход или же реальная необходимость в столь производительной графике? Попробуем разобраться.
Выход версии AC: Unity для игровых консолей сопровождался настоящим скандалом. Во-первых, игра запускалась в разрешении 900p. Во-вторых, наблюдались очень серьезные просадки FPS и множество багов. На данный момент ситуацию вроде как исправили, однако AC: Unity сумела пошатнуть саму идеологию игровой приставки, ведь подобный тип устройств зачастую покупают люди, которые не хотят возиться с настройками качества графики. Они хотят играть в оптимизированные игры.
Масштабируемый интерфейс связи (SLI)
Так что же такое SLI? И что делает SLI, или более конкретно: как он помогает использовать несколько видеокарт?
Интерфейс Scalable Link Interface (SLI) – это небольшая жемчужина, которую нам предоставили Nvidia в 1998 году. Впервые эта технология была использована компанией 3dfx на линейке видеокарт Voodoo2 в 1998 году, но позже компания была куплена Nvidia, и эта технология была заморожена на некоторое время.
В 2004 году Nvidia повторно выпустила SLI с обновлениями, позволяющими ей работать с существующей на тот момент технологией шин PCIe.
Хотя существуют проблемы совместимости (обсуждаемые ниже), связанные с запуском нескольких установок графического процессора, SLI позволяет использовать от двух до четырех карт одновременно. Это достигается путем использования алгоритма параллельной обработки, который собирает информацию, разбивает её на более мелкие части и позволяет обрабатывать несколько частей одновременно несколькими видеокартами.
Тестирование
Конфигурация нашего тестового стенда состоит из следующих компонентов:• Процессор AMD Athlon 64 4000+;• Материнская плата Gigabyte GA-K8NXP-SLI (N-Force 4 SLI);• Жесткий диск Hitachi DeskStar S-ATA 7200 rpm 250Gb;• Блок питания PowerMan 520Wt.
Наша тестовая лаборатория благодарит компании AMD, Gigabyte, NVIDIA и PatriArch за предоставленное для тестовых стендов оборудование.
Мы провели тестирование в следующих программах.1) 3D Mark 2001 SE Ver330 (DirectX 8.1)2) 3D Mark 2005 (DirectX 9.0c)3) Quake3- Arena (OpenGL)4) Codecreatures Benchmark Pro (DirectX 8.1)5) Doom III (OpenGL)6) SeriousSam 2 (OpenGL)7) Tomb Raider 5 (DirectX 9.0b)8) HALO (DirectX 9.0b)9) Aquamark (DirectX 9.0b)10) FarCry(DirectX 9.0b)11) SpecViewPerf 8 (DirectX 9.0b)12) Return to Castle Wolfenstein13) Half-Life 2 (DirectX 9.0c)
Как можно заметить, в нашем тестировании не принимают участие продукты от EPIC Games – Unreal Tournament 2004 и Unreal II. Они напрочь отказались запускаться в режиме SLI, точнее, запускаться-то они запускались, но работала только одна карта в режиме PGC, а при выходе появлялся синий экран смерти с сообщением о проблемах с прерываниями, которых, кстати, не было.
На всех режимах все карты показали отличное качество 2D-картинки. Никаких артефактов и проблем не было замечено ни на одной из видеокарт. Однако стоит учитывать, что этот параметр очень сильно зависит от монитора, кабеля и качества всех соединений.
Во всех нижеприведённых графиках сохранена цветовая схема. Синим цветом выделена видеокарта Gigabyte GeForce 6600GT, красным – Gigabyte GeForce 6600GT в режиме SLI, зелёным – NVIDIA GeForce 6800GT, жёлтым – NVIDIA GeForce 6800GT SLI и фиолетовым – ATI X850XT PE.
3Dmark 2001 SE
История
В современной итерации технология SLI принадлежит и спроектирована Nvidia, но это не совсем так. Концепция SLI это детище ныне
несуществующего производителя графических процессоров 3Dfx. Который на период расцвета в 1990-х годах был основным в области
обработки трехмерной графики и технологии видеокарт, конкурируя с Nvidia и ATI (ныне AMD).
В 1998 году 3Dfx произвела и распространила линейку графических ускорителей, известную как Voodoo2. Это первое устройство, использующее недавно
представленный интерфейс 3dfx Scan-Line Interface, или SLI, и включающее три графических процессора на одной карте. Voodoo2 была первой
ориентированной на потребителя видеокартой. Во многом задала тон богатому, динамичному аппаратному рынку
в настоящее время для игровой индустрии.
Связь между двумя картами Voodoo2 обеспечивалась ленточным кабелем, который позволял картам обмениваться данными и отображать изображение,
чередуя рисование горизонтальных линий пикселей. Эта технология позволила использовать разрешение 1024 × 768, что считается значительным
скачком по сравнению с конкурентами с одной картой, которые могли управлять только стандартными 800 × 600.
На фоне агрессивного маркетингового продвижения технология SLI обещала удвоить вычислительную мощность ПК. В действительности, технология
столкнулась со многими проблемами, в основном связанными с необходимостью жертвовать слотами PCI Express для размещения двух устройств Voodoo2 за
счет сетевых карт и тому подобного.
Фактический процесс рендеринга был подвержен неприглядным артефактам отображения, таким как неполные кадры и разрывы.
Запретительные затраты на приобретение двух карт (около 300 долларов каждая) оказались препятствием для широкого распространения этой
технологии, и это оставалось прерогативой нишевых энтузиастов, жаждущих похвастаться своей игровой системой.
Но судьба 3Dfx быстро пошла на юг из-за грязного слияния с STB Systems, замедления продаж и неспособности идти в ногу с
экспоненциально лучшими линейками карт GeForce и Radeon. В конце 2000 года Nvidia приобрела компанию-производителя графических карт,
производство и поддержка которой вскоре прекратились.
Nvidia не сразу использовала технологию SLI, и она оставалась бездействующей до 2004 года. Компания повторно запустила его как
Scalable Link Interface, ориентированный на использование в слотах PCI-e, а не в ранее использовавшихся слотах PCI.
Технология стала повсеместно распространенной в большинстве современных графических процессоров Nvidia, и
большинство стандартных технологий чипсетов для материнских плат, особенно серии Intel X и Z, поддерживают SLI.
Большая часть аппаратной технологии была заменена и обновлена для современных потребностей, но основная концепция
использования мощности двух параллельных графических процессоров остается.
Что такое SLI?
SLI это технология, которая позволяет пользователям использовать несколько (до четырех) Видеокарты NVIDIA на одном компьютере.
Сокращенно от Scalable Link Interface, SLI разработан NVIDIA. Эта технология соединяет все видеокарты вместе для получения одного видеовыхода. С SLI вы можете получить до 100% прирост графической производительности от каждого из ваших графических процессоров (графический процессор, ядро вашей видеокарты).
Все видеокарты в системе SLI совместно используют информацию рендеринга в одной среде. Для организации всех этих графических процессоров SLI использует режим рендеринга, называемый Alternate Frame Rendering (AFR). По сути, это означает, что каждый графический процессор отображает один из N кадров соответственно (здесь «N» обозначает, сколько карт вы используете). Это сделано для того, чтобы каждый графический процессор мог работать независимо и максимально увеличить мощность системы SLI.
BIOS
Как и полагается высокоуровневым решениям на базе чипсетов NVIDIA, рассмотренные сегодня платы обладают широкими возможностями тонкой настройки системы. Кроме возможности повышать частоту системной шины до 625 МГц и основных напряжений, в BIOS Setup платы XFX MB-N780-ISH9 можно управлять количеством активных ядер процессора, а также таким параметром, как GTLVREF для каждого ядра, который позволяет компенсировать просадку напряжения при сильной загрузке процессора. Уровень настраиваемых напряжений не так велик и находится в разумных пределах, что вряд ли устроит хардкорных бенчеров. Естественно, уникальная возможность изменять частоту памяти независимо от частоты FSB (режим Unlinked), присущая решениям на чипсетах калифорнийской компании, присутствует и в этой модели системной платы. При необходимости можно выбрать «синхронный» режим работы модулей памяти (режим Linked), когда частоты памяти и FSB привязаны друг к другу. Количество настроек таймингов на должном уровне, имеется также возможность установить Command Rate 1T, увеличивающий быстродействие памяти, но уменьшающий её частотный потенциал. Напомним, что в чипсетах Intel до недавнего времени этот параметр был жёстко заблокирован на значении 2T.
ASUS Striker II Formula нисколько не уступает референсному решению, а даже превосходит его. Так, частоту шины FSB можно увеличить до нереальных 800 МГц, настройки напряжений изменяются в широких пределах (максимум 2,4 В на процессор и 2,78 В на память!), а параметр GTL_REF (аналогичен GTLVREF) можно настраивать как для процессора, так и для чипсета и памяти. Имеется возможность асинхронного изменения частоты работы памяти, а количество изменяемых таймингов равно 15. Раздел мониторинга в BIOS позволяет отследить все необходимые параметры системы и настроить порог срабатывания защиты при перегреве северного или южных мостов (70-90°). Для начинающих оверклокеров имеются предустановки, позволяющие разогнать имеющийся процессор до 20% от номинальной частоты.
Модель |
XFX MB-N780-ISH9 |
ASUS Striker II Formula |
BIOS |
||
Тип BIOS |
Phoenix-Award |
Phoenix-Award |
Возможность старта материнской платы при повреждении BIOS |
– |
– |
Мониторинг и управление системами охлаждения |
||
Количество контролируемых линий питания |
8 |
11 |
Количество контролируемых линий системы охлаждения (температура) |
3 |
7 |
Количество контролируемых линий системы охлаждения (обороты кулеров) |
5 |
8 |
Система зависимости оборотов кулеров от температуры |
+ |
+ |
Возможность выключения системы при перегреве |
– |
+ |
– |
+ |
|
Сигнализация при отказе кулеров |
– |
– |
Дополнительно |
– |
– |
Возможности разгона |
||
Изменение множителя процессора (функционирует ли реально) |
Есть, функционирует только на процессорах с разблокированным множителем |
Есть, функционирует только на процессорах с разблокированным множителем |
Изменение частот (указывается, в каких пределах и с каким шагом) |
||
Фронтальная шина |
От 400 до 2500 МГц с шагом 1 МГц |
От 533 до 3200 МГц с шагом 1 МГц |
Частоты шин |
PCI Express: от 100 до 200 МГц с шагом 1 МГц |
SPP<->MPC Ref Clock: от 200 до 500 МГц с шагом 2 МГцPCI Express х16(1,2): от 100 до 200 МГц с шагом 1 МГц |
Частота памяти (при использовании тестовых модулей) |
От 400 до 1400 МГц с шагом 1 МГц |
От 400 до 2600 МГц с шагом 1 МГц |
Изменение уровней питания (указывается, в каких пределах и с каким шагом) |
||
На центральный процессор |
От 0,50000 до 1,80000 В с шагом 0,0625 В |
От 1,10000 до 2,40000 В с шагом 0,0625 В |
На шину FSB, PCI-Express или другие |
CPU FSB: от 1,2 до 1,5 В с шагом 0,1 ВHT SPP<->MCP: от 1,20 до 1,55 В с шагом 0,05 ВMCP Auxiliary: от 1,50 до 1,70 В с шагом 0,10 В |
1.2V HT: от 1,20 до 1,95 В с шагом 0,05 ВCPU VTT: от 1,20 до 2,46 В с шагом 0,02 ВCPU PLL: от 1,50 до 3,00 В с шагом 0,02 ВBridge Core: от 1,20 до 1,55 В с шагом 0,05 В |
На модули памяти |
От 1,800 до 2,500 В с шагом 0,025 В |
От 1,50 до 2,78 В с шагом 0,02 В |
На NorthBridge (северный мост) |
От 1,500 до 1,750 В с шагом 0,025 В |
От 1,25 до 1,91 В с шагом 0,02 В |
На SouthBridge (южный мост) |
От 1,30 до 1,55 В с шагом 0,05 В |
От 1,50 до 1,85 В с шагом 0,05 В |
Количество изменяемых временных задержек памяти |
10 |
12 |
Перечисление изменяемых временных задержек памяти |
tCL, TRCD, TRP, tRAS, tRRD, TRC, TWR, TWTR, TREF, CMD |
tCL, tRCD, tRP, tRAS, CMD, tRRD, tRC, tWR, tWTR, tREF, tRD, tRFC |
Возможность динамического разгона |
– |
– |
Что такое мост SLI
Последнее, что вам понадобится для запуска настройки SLI, – это мост SLI. Nvidia использует физический разъем для соединения видеокарт вместе, что позволяет им взаимодействовать друг с другом, не используя драгоценную полосу пропускания в слотах PCIe.
Вам понадобится один из двух мостов SLI: либо стандартный мост (для менее мощных карт), либо мост с высокой пропускной способностью (для более мощных карт).
Серия SLI Bridge
Мост | Тактовая частота | Максимальная пропускная способность | Рекомендуемый монитор |
---|---|---|---|
Стандартный мост | 400 МГц | 1 Гб/с | 1920×1080 до 2560×1440 при 60 Гц |
Мост с высокой пропускной способностью | 650 МГц | 2 Гб/с | До 5K и объемный звук |
Если у вас более мощные карты (например, GTX 1080), вы можете использовать стандартный мост, но это не позволит обеспечить полную производительность карт.
Особенности технологии
SLI работает на устройствах подключенные в общую сеть видеокарт, где одна карта выступает в качестве конечного порта вызова или главного
устройства, отвечающего за отправку на дисплей окончательно прорисованной трехмерной графики. Эта технология может одновременно соединять 2,
3 и 4 графических процессора, стилизованные под 2-way, 3-way и 4-Way SLI.
Мост SLI обеспечивает передачу данных и отношения «ведущий-ведомый» между двумя идентичными графическими процессорами. Идея состоит в том,
чтобы обойти чипсет материнской платы в целом и позволить устройствам обмениваться данными напрямую, избегая, таким образом, конкуренции за
ограниченную пропускную способность.
Существует четыре типа мостов:
- Стандартный мост SLI с полосой пропускания до 1 ГБ в секунду и тактовой частотой 400 МГц.
-
Светодиодный мост SLI, который похож на ранее упомянутый стандартный мост, за исключением пикселей с тактовой частотой 540 МГц и
способности излучать светодиодное освещение RGB во время работы. -
Мост SLI HB или мост с высокой пропускной способностью, работающий на частоте 650 МГц со скоростью передачи около 2 ГБ в секунду. В
настоящее время это самый распространенный мост. -
Мост NVLink считаетсяя самым последним форматом и уникальным для линейки графических процессоров Nvidia RTX. Отличается
скоростью до 100 ГБ в секунду.
Различные скорости передачи означают, что каждый тип подходит для определенного разрешения. Мост SLI лучше работает при 1080p,
светодиод SLI — при 4K, а SLI HB и NVLink подходят для 5K.
Работа SLI — сводится к разделению задач рендеринга в равной степени между графическими процессорами. В
большинстве случаев одна карта будет концентрироваться на наборе кадров, а другая — на другой половине. В совокупности создается полностью
сформированный кадр, готовый для отображения на мониторе.
В настоящее время существует три режима SLI:
-
Рендеринг с разделением кадров, при котором нагрузка рендеринга распределяется по горизонтали на куски в зависимости от сложности 3D и
делится на графические процессоры. -
Альтернативный рендеринг кадров, при котором каждый графический процессор последовательно выводит кадр. GPU 1 отображает кадр 1, GPU 2
отображает кадр 2, GPU 1 отображает кадр 3, GPU 2 отображает кадр 4 и т.д. До бесконечности. Результатом считается более высокая частота
кадров. -
Сглаживание SLI, благодаря чему возможности сглаживания увеличиваются в два раза благодаря совместному распределению задачи обработки между
графическими процессорами в схеме смещения. Результатом считается поразительно лучшее визуальное качество, но в результате
производительность имеет тенденцию принимать удар. Возможно сталкивались с этой опцией в настройках игр, часто сопровождаемых SLI 8X
или SLI 16X, и задавались вопросом, что все это значит?
Чтобы SLI работал, разработчики должны кодировать игры для поддержки этой технологии. Из-за сложности, присущей двум графическим процессорам
для совместной работы, этот процесс требует значительных усилий.
После того, как они установили солидный набор настроек, которые не нарушают игру, Nvidia публикует так называемый профиль SLI. Он
содержит набор обновлений драйверов, предназначенных для подготовки графического процессора к работе с игрой и повышения графической
производительности.
Практика
Для начала опишем аппаратное оборудование, на котором проводилось тестирование, и скажем о нём пару слов. К нам на тестирование пришёл пакет оборудования для создания SLI системы от компании Gigabyte, в который входила материнская плата GA-K8NXP-SLI на базе N-Force 4 SLI, две видеоплаты Gigabyte GeForce 6600GT и центральный процессор AMD Athlon 64 4000+, любезно предоставленный компанией AMD. Также для тестирования были взяты две оригинальные платы от NVIDIA на базе GeForce 6800GT и, как оппонент со стороны конкурентов NVIDIA, – карта ATI X850XT. А теперь опишем основные компоненты более подробно, и начнём мы с центрального процессора.
Тестовый стенд
Для изучения эффективности работы технологии 3-Way SLI я использовал подходящий для этих целей тестовый стенд, так как процессоры Haswell-E вкупе с системными платами на чипсете X99 Express могут похвастать поддержкой сразу 40 линий PCI Express 3.0. Конкретно материнка ASUS X99-PRO поддерживает массивы из трех видеокарт AMD/NVIDIA по схеме х16+х16+х8. Такой пропускной способности достаточно, чтобы не считать плату узким местом в системе. Итак, тестовый стенд:
- Процессор: Intel Core i7-5960X @4,5 ГГц
- Процессорный кулер: ENERMAX LIQTECH 240
- Материнская плата: ASUS X99-PRO
- Видеокарта: 3x NVIDIA GeForce GTX 980
- Накопитель: OCZ Vertex 3, 360 Гбайт
- Блок питания:
- Периферия: , ROCCAT ARVO, ROCCAT SAVU
- Операционная система: Windows 8.1 х64
Совместимость и проблемы режима SLI
Казалось бы, купи две видеокарты Nvidia, вставь их в разъемы на материнской плате и наслаждайся «удвоенной» скоростью работы. К сожалению, не всё так просто…
Два (или более) вида
Первое, что вам нужно знать, это то, какие видеокарты будут соединяться вместе: не любые две видеокарты смогут так взаимодействовать. Они должны иметь один и тот же графический процессор, и должны иметь одинаковое количество видеопамяти.
Например, если у вас GTX 1070 Ti 8GB производства Asus, а другая той же спецификации, но от MSI, то режим SLI доступен. Но, GTX 1070 и GTX 1080 несовместимы, так как они не являются одним и тем же графическим процессором.
Вам также необходимо убедиться, что видеокарты совместимы с режимом SLI, так как карты без порта SLI могут быть несовместимы. Также стоит отметить, что в Nvidia убрала поддержку 3-х и 4-х карточного SLI для серии GTX 10.
Слоты и заглушки
Следующим в списке стоит ваша материнская плата и блок питания. Они оба должны быть совместимы со SLI.
Это означает, что вашей материнской плате потребуется достаточно слотов PCIe x16, чтобы соответствовать количеству графических процессоров, а вашему блоку питания потребуется достаточно разъемов PCIe для питания того количества карт, которое вы будете использовать.
Отсутствие удвоения видеопамяти
Распространенное заблуждение относительно SLI состоит в том, что вы можете получить двойную, тройную или даже четырехкратную видеопамять с большим количеством видеокарт. К сожалению, Nvidia SLI использует ОЗУ только с одной карты, поскольку каждая карта должна получать доступ к одной и той же информации в одно и то же время.
Выводы
Как всё не просто в этом мире. Казалось бы, установи две платы в один компьютер и собирай дивиденды в виде двукратного увеличения производительности, ан нет, нужно еще понимать, где будет этот прирост и почему. Эффективность новой технологии SLI от NVIDIA не вызывает никаких нареканий, но только в условиях серьёзной нагрузки, когда центральный процессор не сдерживает мощность графических ускорителей, и вот в этом целая проблема, которая становится всё более насущной. Совершенствовать графические ускорители становится всё более бессмысленно из-за отсутствия достаточной процессорной мощности для создания правильного баланса. Посудите сами, имея AMD Athlon 64 4000+ в большинстве тестов, без использования антиалиасинга и анизотропии, результаты всех карт, участвующих в тестировании, были ограниченны мощностью центрального процессора. Более того, использование антиалиасинга и анизотропии чаще всего не решало ситуации, а лишь давало возможность взглянуть на мощность ускорителей в разрешениях 1280х1024 или 1600х1200. Даже самые последние и графически навороченные игры упирались в CPU, не говоря уже об играх предыдущего поколения. Плюс к этому, SLI система сама по себе расходует ресурсы центрального процессора и тем самым даёт фору одиночным решениям, как на базе своих же компонентов, так и сторонним производителям в лице ATI. Словом, хотите использовать мощность SLI – используйте, но увидите вы её только в играх, которые просто жаждут пожирать мощность графического ускорителя и не сильно загружают CPU, в противном случае, лучше бы у вас была одна карта, а не две.
Сама по себе технология SLI имеет весьма правильные задатки, и у неё возможно большое будущее, если, конечно же, NVIDIA не совершит ошибки 3DFx и не сделает на неё основную ставку, так как по экономическим соображениям SLI пока еще весьма далёк от идеала и по карману далеко не каждому. Стоимость материнской платы под SLI в сочетании с двумя видеокартами может легко быть заметно больше, чем аналогичное по производительности решение на базе одной карты. Плюс к этому, пока еще технология работает не до конца стабильно, и в ней еще имеются не прожаренные места, но, с нашей точки зрения, все их можно решить на уровне драйверов.
Тем не менее, мы можем констатировать, что материнская плата от Gigabyte с картами от неё же работает практически без единого сбоя, за исключением отказа от входа в режим SLI с некоторыми играми. Каждый компонент сам по себе работал очень стабильно и не вызвал никаких нареканий, и если вы всё же собрались покупать компьютер с поддержкой SLI прямо сейчас, то использование продуктов Gigabyte более, чем оправданно.