От теории к практике
После небольшого экскурса в особенности новых графических процессоров семейства ATI Radeon X1000 перейдём к знакомству с реальными видеокартами на этих процессорах. Выбор конкретных моделей видеокарт в данном случае не столь важен. В конечном итоге функциональные возможности и производительность любой видеокарты на 90% определяется именно установленным в ней графическим процессором. Ну а конкретная компания-производитель – это уже вторично.
Мы пытались выбирать видеокарты для нашего обзора, исходя их того, чтобы они обладали, во-первых, пассивной системой охлаждения, и, во-вторых, всеми функциональными возможностями по захвату и обработке видеосигнала, что позволит использовать их в медиацентрах.
Видеокарта Sapphire Radeon X1300
Итак, после краткого обзора возможностей семейства процессоров ATI Radeon X1000 самое время более подробно познакомиться с новинками. Несмотря на то, что компания ATI недавно анонсировала новый топовый графический процессор ATI Radeon X1900 (кодовое название R580), все производители видеокарт продолжают пополнять свои модельные ряды видеокартами на графических процессорах младших моделей, поскольку, как уже отмечалось, именно эти модели видеокарт оказываются наиболее востребованными на рынке в силу их оптимальности по соотношению производительность/цена.
Первая новинка, с которой мы начнём, – это видеокарта Sapphire Radeon X1300. Эта видеокарта ориентирована на установку в домашних компьютерах, не требующих высокой производительности в 3D-графике. Розничная стоимость видеокарты составляет около $100.
Чип, установленный на этой карте, носит кодовое название R515. Видеокарта имеет два разъёма подключения: DVI/I и обычный D-Sub. Объём видеопамяти DDR или DDR2 для этой карты может составлять от 128 до 512 Мбайт с 128-битным или 64-битным интерфейсом. В нашем тестировании принимала участие видеокарта X1300 с объёмом 128 Мбайт с 128-битным интерфейсом. Тактовая частота графического процессора составляет 450 МГц, а видеопамяти – 500 МГц. Максимальное разрешение, выдаваемое на монитор, составляет 2048×1536 точек.
Графический процессор имеет четыре пиксельных конвейера и три вершинных процессора.
Отличительной особенностью этой видеокарты является пассивная система охлаждения, которая представляет из себя массивный штыревой радиатор, соприкасающийся с графическим процессором. Отметим, что такая пассивная система охлаждения создает неплохие предпосылки для использования видеокарты в мультимедийных компьютерах.
Как проходило тестирование
На плате ASUS A8N SLI Deluxe (NVIDIA nForce4 SLI) активизировался двухканальный контроллер памяти посредством вставки двух одинаковых модулей памяти 512 MB Hynix DDR 400 в соответствующие слоты. Тайминги памяти были выставлены как 2.0/5/3/3.
Основные параметры в драйверах видеокарт NVIDIA и ATI были выставлены следующим образом:
NVIDIA ForceWare 78.01:
14 Image Settings: Quality;15 Trilinear optimization: On;16 Anisotropic mip filter optimization: Off;17 Anisotropic sample optimization: On;18 Vertical sync: Off;19 Остальные настройки: по умолчанию.
ATI CATALYST:
1 Mipmap Detail Level: Quality;2 Adaptive antialiasing: Off;3 Temporal antialiasing: Off;4 Quality AF: Off;5 CATALYST A.I.: Standart;6 Wait for vertical refresh: Always off;7 Остальные настройки: по умолчанию.
Качество 2D
Этот параметр довольно спорный, и оценить его можно только субъективно, так как качество выводимого изображения зависит и от монитора, и от соединительного кабеля.
Качество используемых в тестировании видеокарт в разрешениях 1600 х 1200 х 85 Гц, 1280 x 1024 x 100 Гц, 1024 x 768 x 120 Гц можно охарактеризовать как хорошее.
ATI Avivo
Долгое время возможности решений ATI по обработке видео выглядели достаточно скудно, особенно на фоне разработок главного конкурента – компании NVIDIA. Однако выход нового семейства RADEON X1000 положил конец этой несправедливости. Так, ATI RADEON X1600 XT получил в свое распоряжение Avivo Display Engine, который может похвастаться возможностью кодирования/декодирования форматов H.264 и VC-1 на аппаратном уровне. Напомним, что именно H.264 и VC-1 лежат в основе таких стандартов, как Blu-Ray и HD-DVD. Давайте затронем «железную» сторону Avivo Display Engine. Он состоит из двух 10-битных «движков» и решения Xilleon.
Оба 10-битных процессора полностью независимы и имеют следующие особенности:
- возможность осуществления масштабирования и деинтерлейсинг;
- поддержку оверлея, цветовой коррекции и гамма-коррекции.
Устройство Xilleon осуществляет кодирование сигнала в ТВ-формат, поддерживается формат HDTV, что не может не радовать.
ATI Radeon X1800 series в играх
Во-первых, это новые режимы сглаживания и анизотропной фильтрации, о которых вы можете прочитать в предыдущей статье про ATI Radeon X1800XT (см. обзор «Radeon X1800 series: новая звезда линейки ATI»), а во-вторых, это поддержка пиксельных и вершинных шейдеров версии 3.0 и эффектов High Dynamic Range. Однако если шейдеры 3.0 работают на новых Radeon вполне корректно, то вот HDR отказался работать на всех имеющихся в нашем распоряжении играх, поддерживающих этот эффект – максимально возможное качество картинки в «Splinter Cell: Chaos Theory», «FarCry 1.3» и «Serious Sam 2» оказалось для новых видеокарт ATI недостижимым.
Скорее всего, это связано с тем, что в 2004 году, когда готовились соответствующие приложения, у ATI не было SM3.0 решения, поэтому разработка и оптимизация игр и патчей с поддержкой High Dynamic Range велась исключительно на NVIDIA-решениях и оптимизировалась прежде всего под них. Это своего рода расплата за то, что в продуктах предыдущего поколения ATI отказалась от поддержки передовых технологии, заложенных в Shader Model 3.0.
Естественно, что тестировать необходимо при равных условиях, поэтому мы оставляли эффект HDR отключённым и на NV-картах. Что из этого получилось, сейчас и будет продемонстрировано.
Тестирование
Перейдём к тестированию. Мы проводили испытания на тестовом стенде следующей конфигурации.
- Процессор:
- Материнская плата:
- Оперативная память:
- Жёсткий диск:
- Блок питания:
- Драйверы:
- Драйвер для видеокарт NVIDIA: ForceWare 84.63
- Драйвер для видеокарт ATI: CATALYST 6.5
Основные параметры в драйверах видеокарт NVIDIA и ATI были выставлены следующим образом:
NVIDIA ForceWare
- Image Settings: Quality
- Trilinear optimization: On
- Anisotropic mip filter optimization: Off
- Anisotropic sample optimization: On
- Vertical sync: Off
- Остальные настройки: по умолчанию
ATI CATALYST
- Mipmap Detail Level: Quality
- Adaptive antialiasing: Off
- Temporal antialiasing: Off
- Quality AF: Off
- CATALYST A.I.: Standart
- Wait for vertical refresh: Always off
- Остальные настройки: по умолчанию
В качестве конкурентов для сравнения производительности мы выбрали следующие видеокарты: MSI RX1600XT-T2D256E, Gigabyte GV-RX16T256V-RH (Radeon X1600XT), Chaintech 7600GT, PowerColor X800GT. Сразу оценим расстановку сил.
Принципиальных отличий между Radeon X1600Pro и X1600XT нет, это одинаковые ядра RV530. Однако X1600XT оборудуется чипами памяти GDDR3 и работает на значительно более высоких частотах – 590/1380 МГц против 500/780 МГц у X1600Pro. Как мы увидим в результате тестирования, прирост частот в RV530 даёт ощутимые результаты.
Другой участник тестирования, Radeon X800GT, в своё время относился к высшему сегменту рынка видеокарт, однако постепенно упал в цене и сейчас конкурирует с представителями мейнстрим-графики. Чип R423 снабжен 8 пиксельными конвейерами с 8 TMU (обрабатывает по 8 текстур за такт) и 6 вершинными процессорами. Это даст небольшое преимущество при обработке шейдеров. Однако менее производительный внутренний контроллер памяти несколько уравняет шансы в борьбе с RV530. Чип работает на частотах 475/980 МГц, карта оборудована 256 Мбайт памяти GDDR3.
Ну и последним участником тестирования мы выбрали новейшего представителя среднего ценового диапазона от NVIDIA Corporation – GeForce 7600GT. Ядро G73 производится по техпроцессу 90 нм, оборудовано 12 конвейерами с 12 полночастотными текстурными процессорами и 5 вершинными процессорами. Частоты равны 600/1600 МГц, поскольку это предразогнанная модель от Chaintech, которую мы ещё протестируем отдельно.
Тестовый пакет состоит из следующих приложений.
- Синтетические тесты
- Futuremark 3DMark 2001SE
- Futuremark 3DMark’05
- Futuremark 3DMark’06
- SpecViewPerf 8
- CodeCult CodeCreatures
- Полусинтетические приложения
- Игровые тесты
- Call of Duty 2
- Doom 3
- FarCry
- F.E.A.R.
- Half-Life 2
- Quake 3
- Quake 4
- Chronicles of Riddick: Escape from Butcher Bay
- Return to Castle Wolfenstein: Checkpoint
- Serious Sam: The Second Encounter
- Serious Sam 2
Показатели при отключённых анизотропной фильтрации и полноэкранном сглаживании мы снимали только на номинальных частотах видеокарты. В тяжёлых режимах оценивали ещё и производительность в разгоне, чтобы вычислить выгоду, полученную от роста частот. Профиль тяжёлого режима – FSAA 4x, Anisotropic Filtering – 8x. 16-кратную фильтрацию текстур мы не активировали, поскольку выигрыш в качестве изображения малозаметен невооружённым глазом, а падение производительности при малых объёмах кадрового буфера просто огромно.
Начнём с синтетических тестов, которые покажут производительность GeCube Radeon X1600Pro при различных видах нагрузок.
Вершинные и пиксельные процессоры
Графическое решение канадской компании располагает 5 вершинными процессорами, которые построены по схеме 3+1, т.е. Arithmetic Logic Unit вершинного процессора выполняет две разные операции одновременно над тремя компонентами вектора и четвертой компонентой. Похожую организацию вершинных процессоров имеет последнее поколение графики NVIDIA. Однако вершинный процессор G70 за один такт обрабатывает четырёхкомпонентный вектор и скаляр (схема 4+1) и не имеет возможности выборки значений из текстур.
Количество пиксельных процессоров равняется 12, однако архитектура ATI RADEON X1600 XT не предполагает 12 отдельных процессоров – последние сгруппированы по 4. Таким образом, 12 пиксельных процессоров образуют три так называемых квада, каждый из которых включает несколько блоков:
- Branch Execution Unit;
- Scalar Arithmetic Logic Unit 1;
- Scalar Arithmetic Logic Unit 2;
- Vector Arithmetic Logic Unit 1;
- Vector Arithmetic Logic Unit 1.
Они, в свою очередь, могут выполнить за такт над четырьмя пикселями несколько операций:
- операцию условного или безусловного перехода (Branch);
- Scalar ADD+модификация компонентов (Scalar Arithmetic Logic Unit 1);
- Scalar ADD/MUL/MAD и другие операции (Scalar Arithmetic Logic Unit 2);
- VEC3 ADD+модификация и перестановка компонентов (Vector Arithmetic Logic Unit 1);
- VEC3 ADD/MUL/MAD и другие операции (Vector Arithmetic Logic Unit 2);
- запрос данных из TMU (происходит параллельно с одной из вышенаписанных операций).
Итого, 6 операций за такт, что очень хорошо для mainstream-решения.
Для организации деятельности распределения работы между разными исполнительными устройствами используется специальная архитектура Ultra-Threaded Architecture. В её цели входит максимально возможное сокращение времени простоя исполнительных устройств (например, текстурных модулей и квадов пиксельных процессоров) и более эффективная организация вычислительных мощностей процессора. Ultra-Threaded Architecture присутствует в виде специального блока-коммутатора Ultra-Threading Dispatch Processor, который оптимально распределяет нагрузку между текстурными модулями и квадами пиксельных процессоров. Алгоритм технологии достаточно прост: Ultra-Threading Dispatch Processor анализирует работу пиксельных процессоров в составе каждого квада, и если какой-либо из них не загружен работой, он моментально получает выполнение новой задачи. Однако не исключены случаи, когда свободный пиксельный процессор попросту не получится загрузить из-за того, что не получены данные для выполнения шейдера. В таком случае деятельность пиксельного процессора приостанавливается до момента получения данных. По заявлению компании ATI, такой подход позволяет добиться 90% эффективности загруженности пиксельных процессоров при обработке любых шейдеров.
Помимо этого, взаимодействие текстурных модулей и блоков адресации текстур происходит не напрямую, а через Ultra-Threading Dispatch Processor. Это позволяет скрыть латентность вызова текстур.
В ATI RADEON X1600 XT в полной мере реализованы шейдеры, соответствующие стандарту Shader Model 3.0. Процессор RV530 производит вычисления в формате 128-bit FP, что способствует исключению накопления ошибок. Благодаря flow control, поддерживаются шейдеры практически неограниченной длины.
Ещё одной интересной особенностью архитектуры ATI RADEON X1600 XT является наличие branch execution unit – блока по выполнению ветвлений, который выполняет по одной инструкции управления потоком. Применение branch execution unit более чем оправданно – благодаря данному блоку очень сильно разгружаются основные ALU графического решения, что приводит к увеличению производительности, например, при обработке пиксельных шейдеров.
Конфигурация тестового оборудования
Тестирование проходило на стенде следующей конфигурации:
- CPU: AMD Athlon64 X2 4800+ (DualCore, 2×2.4GHz, 2x1024Kb L2 Cache)
- RAM: 2x512MB PC3200 Kingston
- MainBoard: MSI K8N Neo4 Diamond SLI (NVIDIA nForce4 SLI)
- HDD: 40Gb Seagate Barracuda ATA IV
- PSU: PowerMan Pro 420W
При использовании основного программного обеспечения, описанного ниже:
- Microsoft Windows XP Professional Service Pack 2
- Microsoft DirectX 9.0c
- NVIDIA ForceWare 81.84 Beta
- ATI CATALYST 5.10 Beta
- FutureMark’s 3DMark05 v1.20
- Id’s DOOM3
- Valve’s Half-life2
- Crytek’s FarCry 1.3
- Monolith’s F.E.A.R. Multiplayer Demo
- Croteam’s Serious Sam 2 Demo1
- Epic’s Unreal Tournament 2004
- Raven’s Return to Castle Wolfenstein
Итоговые выводы
Вот и подошло к своему логическому завершению исследование новых флагманов линейки видеоплат от ATI. Теперь мы можем констатировать, что оба производителя графических чипов поддерживают пиксельные и вершинные шейдеры версии 3.0, следовательно, для разработчиков игр облегчается оптимизация своих будущих продуктов: общий знаменатель между ATI и NVIDIA – это именно SM3.0, который, благодаря текущей ситуации, будет внедряться в новые приложения с гораздо большей скоростью.
Кроме того, отдельно стоит отметить и улучшения в области анизотропной фильтрации и антиалиасинга, а также технологию ATI AVIVO, которой ещё предстоит показать себя в сравнении с NVIDIA PureVideo.
Ситуация с присуждением «царя горы» не позволяет выявить однозначного победителя между ATI Radeon X1800 XT и NVIDIA GeForce 7800 GTX, но пока у ATI не появится CrossFire Edition вариант на базе R520, в абсолютных лидерах будут находиться SLI-системы на базе GeForce 7800 GT/GTX.
Что же касается самих карт, то по результатам рассмотрения можно сказать следующее:
ATI Radeon X1800 XT очень неплохо показала себя при использовании API DirectX: разумеется, были и поражения от NVIDIA GeForce 7800 GTX, однако небольшое преимущество в «F.E.A.R.» и в целом чуть более высокая скорость за счёт мощной памяти делают продукт ATI Radeon X1800 XT вполне достойным конкурентом для NVIDIA GeForce 7800 GTX.
Немного огорчает тот факт, что пока мы не можем увидеть работу эффекта High Dynamic Range на новых картах ATI, в том числе и совместно с антиалиасингом, но остаётся надеяться, что это будет оперативно исправлено.
Но в OpenGL ситуация уже совершенно иная: даже высокая пропускная способность памяти не спасает Radeon X1800 XT от малоприятных результатов, и следствие этого – поражение даже от GeForce 7800 GT. И если с HDR ситуацию можно выправить сравнительно безболезненно, то для полноценной конкуренции в OpenGL потребуется подвергнуть драйвер более существенной доработке.
Окончательный вердикт Radeon X1800XT 512MВ можно будет вынести тогда, когда продукт станет доступен на прилавках – при условии адекватной цены уровня GeForce 7800 GTX 256МB он будет востребован.
С ATI Radeon X1800 XL ситуация неоднозначная: с одной стороны, неплохая производительность в DirectX – почти на уровне 7800GT – и просто никакой OpenGL, с другой стороны, этот продукт, в отличие от Х1800 ХТ, пойдёт в продажу сразу после анонса и первые цены на него не так сильно отличаются от рекомендованных.
Продукт будет очень неплохим выбором для оверклокеров, которым наверняка понравится потенциал 1.4 нс памяти, особенно если цена будет на 15% ниже, чем у GeForce 7800 GT. Так что при соблюдении грамотной ценовой политики можно получить и неплохие результаты для такой карты, как Radeon X1800 XL. По последним данным, цены на немногочисленные карты из первых партий X1800XL оставляют желать лучшего: цена плат серьёзно превышает уже установившийся уровень на GeForce 7800GT и находится в районе 600 долларов, что соответствует GeForce 7800 GTX.
Разумеется, в этой ситуации разумному пользователю остаётся два варианта: или подождать снижения цен к Новому году, или обратить своё внимание на другие решения – увы, текущая ситуация ни к чему другому не располагает. В целом, несмотря на её неоднозначность, язык не поворачивается назвать новую линейку ATI плохой
Да, можно было бы сэкономить какое-то количество транзисторов и выпустить карты на более высоких частотах, но не стоит забывать о том, что, в любом случае, требуются и переходные продукты, на которых можно обкатывать технологии для следующих поколений карт. Вспомните, каким «гадким утенком» был NV3x по сравнению с R3x0, и каким «прекрасным лебедем» стала серия GeForce6/7. Кто знает, может через какое-то время мы увидим «прекрасного лебедя» и от ATI, в котором будут полноценно востребованы возможности, заложенные в R520 уже сейчас?
В целом, несмотря на её неоднозначность, язык не поворачивается назвать новую линейку ATI плохой. Да, можно было бы сэкономить какое-то количество транзисторов и выпустить карты на более высоких частотах, но не стоит забывать о том, что, в любом случае, требуются и переходные продукты, на которых можно обкатывать технологии для следующих поколений карт. Вспомните, каким «гадким утенком» был NV3x по сравнению с R3x0, и каким «прекрасным лебедем» стала серия GeForce6/7. Кто знает, может через какое-то время мы увидим «прекрасного лебедя» и от ATI, в котором будут полноценно востребованы возможности, заложенные в R520 уже сейчас?
Впрочем, это уже совсем другая история.