Nvidia turing geforce rtx технологии и архитектура

Технические характеристики

Процессор
TU116 (Turing)
Техпроцесс
 12 н.м
 Частота GPU 

1530 — 1860 МГц

 Потоковые процессоры (Shading Units)
1408
 Текстурные блоки(TMUs)
88
 Конвейеры растровых операций (ROPs)
48
 Тип памяти
GDDR5
Ширина шины памяти
192 Бит
Объем памяти
6 ГБ
 Частота памяти
2000 МГц (8000 МГц ) 
 DirectX
 12
 Интерфейсы
1x DVI, 1x HDMI, 1x DisplayPort
Потребляемая мощность(TDP)
120 Вт
Цена

Далее перейдем непосредственно к участникам нашего тестирование их сегодня будет три, это MSI GeForce GTX 1660 GAMING X 6G, GIGABYTE GeForce GTX 1660 OC  и  ZOTAC GAMING GTX 1660 Twin Fan  две первые имеют заводской разгон а последняя работает на рекомендованных Nvidia частотах.

MSI GeForce GTX 1660 GAMING X 6G

  • стоимость:от 19000 руб.
  • длина видеокарты:247 мм.
  • частоты GPU:1530-1860 МГц

GIGABYTE GeForce GTX 1660 OC

  • стоимость:от 18200 руб.
  • длина видеокарты:226 мм.
  • частоты GPU:1530-1830 МГЦ

 ZOTAC GAMING GTX 1660 Twin Fan

  • стоимость:от 17990 руб.
  • длина видеокарты:173 мм.
  • частоты GPU:1530-1785 МГЦ

The Witcher 3: Wild Hunt

Год выпуска – 2015; API – DirectX 11; движок – REDengine 3

The Witcher 3: Wild Hunt – одна из самых ярких игр 2015 года в жанре RPG-экшн. Вы – Геральт (Geralt), ведьмак, который занимается поисками своей пропавшей соратницы Цири (Ciri); в ходе этого квеста вам предстоит исследовать огромный внутриигровой мир. Игра насыщена дополнительными сюжетными линиями, которые, несмотря на обманчивое впечатление, никак не связаны с основными поисками, хотя какие-то неожиданные вещи действительно могут произойти с вами в том мире, частью которого являетесь и вы в образе Геральта.

The Witcher 3 представляет игровой движок REDengine 3, который был разработан специально для жанра RPG в открытом мире. В игре используется интерфейс DirectX 11 с тесселяцией и некоторыми эффектами постобработки. Из соображений сохранения нейтральных условий тестирования в этой игре мы отключили опцию HairWorks.

Характеристики и особенности GeForce RTX 3090, RTX 3080 и RTX 3070

Начнем с того, что все представленные видеокарты имеют достаточно компактную печатную плату, за счет чего на ней не хватило места для нескольких стандартных разъемов питания 8-pin. В связи с этим было принято решение заменить их одним разъемом на 12-pin. Сразу уточним, что переживать по этому поводу не стоит, такие разъему будут использоваться исключительно в референсных картах Founders Edition, в комплекте с которыми к тому же идет переходник с 12-pin на 2x 8-Pin.

GeForce RTX 3090

Флагманом новой линейки видеокарт является NVIDIA GeForce RTX 3090. В ее основе лежит графический чип GA102. Его размер составляет 628 мм2, что делает его вторым по величине игровым графическим процессором среди всех когда-либо созданных. Он идет сразу после TU102 (RTX 2080 Ti), размер которого составлял 754 мм2.

В RTX 3090 установлено в общей сложности 82 SM модуля, что в итоге дает 10496 ядер CUDA. Тактовая частота графического процессора составляет 1,70 ГГц. Это дает колоссальный прирост производительности по сравнению с текущим флагманом Turing. На презентации было продемонстрированно, что RTX 3090 в разрешении 8K при включенном DLSS 2.0 выдает плавную картинку в играх, с частотой кадров в районе 60 FPS.

Что касается памяти, то здесь GeForce RTX 3090 также делает большой скачек вперед, предлагая 24 Гб памяти GDDR6X, частота которой составляет 19,5 Гбит/с. С учетом шины 384 бита, общая пропускная способность карты составляет 936 Гбит/с.

За охлаждение RTX 3090 отвечает алюминиевый радиатор, в котором используется гибридная испарительная камера с двумя вентиляторами, один из которых располагается сзади, а другой спереди. Радиатор имеет наноуглеродное покрытие, что также должно способствовать лучшему рассеиванию тепла. Как сообщает Nvidia, данная система охлаждения работает тише и в то же время она вдвое эффективнее по сравнению с решениями предыдущего поколения.

С учетом системы охлаждения GeForce RTX 3090 будет занимать 3 слота расширения.

GeForce RTX 3080

В основе NVIDIA GeForce RTX 3080 лежит все тот же чип GA102, но немного урезанный. В общей сложности он включает в себя 68 SM модулей, что дает нам 8704 ядра CUDA. Тактовая частота графического процессора составляет 1,71 ГГц.

Здесь также используется новый тип памяти GDDR6X, работающей на скорости 19,0 Гбит/с, но ее объем уже составляет 10 Гб. Вместе с 320-битным интерфейсом шины это обеспечит совокупную пропускную способность 760 Гбит/с.

Судя по презентации Nvidia, RTX 3080 в два раза производительнее, чем RTX 2080.

Что касается системы охлаждения, то здесь она аналогична с RTX 3090, но более компактна, благодаря чему видеокарта занимает два слота расширения.

GeForce RTX 3070

Перейдем, пожалуй, к самому интересному из представленных решений, а именно к RTX 3070. В первую очередь интересна она тем, что по производительности она немного лучше RTX 2080 Ti, но при этом в несколько раз ее дешевле.

В основе видеокарты NVIDIA GeForce RTX 3070 лежит графический процессор GA104. Он является вторым по быстродействию в линейке Ampere. Данный чип содержит 46 SM модулей, что дает в общей сложности 5888 ядер CUDA. Тактовая частота графического процессора составляет 1,73 ГГц.

В отличие от старших моделей, RTX 3070 использует более медленную GDDR6 память, скорость которой составляет 16 Гбит/с. Это с учетом шины 256-бит обеспечивает пропускную способность в размере 512 Гбит/с.

Что касается системы охлаждения, то здесь используется более привычное всем решение с двумя вентиляторами, схожее с тем, что используется в поколении Turing. Занимает RTX 3070 два слота расширения.

Все основные характеристики представленных видеокарт в одной таблице

Наименование NVIDIA GeForce RTX RTX 3090 NVIDIA GeForce RTX 3080 NVIDIA GeForce RTX 3070
Графический чип Ampere GA102-300 Ampere GA102-200 Ampere GA104-300
Техпроцесс 8 нм 8 нм 8 нм
Ядра CUDA 10496 8704 5888
Базовая частота 1400 МГц 1440 МГц 1500 МГц
Максимальная частота 1700 МГц 1710 МГц 1730 МГц
Объем памяти 24 Гб GDDR6X 10 Гб GDDR6X 8 Гб GDDR6
Скорость памяти 19,5 Гбит/с 19 Гбит/с 16 Гбит/с
Разрядность шины 384 бита 320 бит 256 бит
Пропускная способность 936 Гбит/с 760 Гбит/с 512 Гбит/с
TDP 350 Вт 320 Вт 220 Вт

На изображении ниже можно увидеть сравнение видеокарт поколения Turing и Ampere.

В каких играх используется RTX

Ошибается тот, кто говорит, что ray tracing в настоящее время поддерживает только пару проектов. Игр с этой технологией, возможно, не так много, но это качественные предложения. Если один раз сыграть в какую-либо игру с ray tracing, то после отключения графика кажется слегка неестественной. Нет, есть одно исключение: «Red Dead Redemption 2» – на персональных компьютерах выглядит феноменально даже без трассировки лучей.

Но вернемся к сути, вот игры с поддержкой ray tracing, которые доступны прямо сейчас:

  • «Battlefield V»;
  • «Control»;
  • «Deliver us The Moon»;
  • «Metro Exodus»;
  • «Quake II RTX»;
  • «Call of Duty: Modern Warfare»;
  • «Shadow of the Tomb Raider»;
  • «Stay in the Light»;
  • «Wolfenstein: Youngblood»;
  • «Bright Memory»;
  • «Assetto Corsa Competizione»;
  • «MechWarrior 5: Mercenaries».

Стоит также упомянуть еще не выпущенные игры, в которых подтверждено наличие трассировки лучей:

  • «Cyberpunk 2077»;
  • «Minecraft» (уже доступно в бете);
  • «Dying Light 2»;
  • «Vampire: The Masquerade-Bloodlines 2»;
  • «Watch Dogs: Legion»;
  • «Bright Memory: Infinite»;
  • «JX3 Online»;
  • «Convallaria»;
  • «F. I. S. T.»;
  • «Xuan-Yuan Sword VII»;
  • «Atomic Heart»;
  • «Enlisted».

Лимиты мощности

Все видеокарты NVIDIA имеют установленные лимиты мощности (энергопотребления), которые задаются в BIOS и определяются диапазоном соответствующих настроек Boost-частот. Второй лимит соответствует максимальному значению TDP, которое пользователь может задать в настройках оверклокинга, то есть максимально возможному перемещению ползунка мощности. На второй диаграмме значение в скобках показывает, на сколько процентов верхняя граница диапазона этой настройки у той или иной карты превышает установленный по умолчанию лимит мощности основной тестируемой карты (Gigabyte GTX 1650 OC GDDR6).

Энергопотребление

Энергопотребление в неигровых режимах по сравнению с исходной версией 1650 немного выросло, вероятно, из-за перехода на GDDR6. Хотя на диаграмме эта разница может показаться существенной, с точки зрения абсолютных значений она минимальна – всего 2 Вт, что не отражается в сколько-нибудь значительной мере ни на нагреве карты, ни на счете за электричество. В режиме включения медиапроигрывателя энергопотребление карты 1650 GDDR6 – одно из самых низких, всего 8 Вт, что актуально для пользователей компактных (SFF) компьютеров, заинтересованных в минимизации нагрева.

Поскольку карта не имеет дополнительных входных разъемов питания, потребляемая ею мощность ограничивается значением 75 Вт – в противном случае возникает перегрузка цепей питания слота PCIe. Поэтому плата видеокарты имеет установленный лимит мощности – 75 Вт, который соблюдается практически всегда: хотя мы зарегистрировали несколько пиков более 75 Вт, они были очень кратковременными и превышали значение 75 Вт не намного, так что все в порядке.

Рекомендуемая мощность блока питания: 300 Вт.

MSI GeForce GTX 1660 GAMING X 6G

Внешне данная GeForce GTX 1660 полностью идентична старшей видеокарте GeForce GTX 1660 Ti линейки Gaming.  Длина изделия составляет 25 см, а системе видеокарта занимает два слота. Печатная плата длиной 20 см. Дизайн полностью совпадает с PCB GeForce GTX 1660 Ti от MSI. Графический процессор запитан от четырех фаз, питание памяти двухфазное.Пластиковый кожух выполнен в узнаваемом стиле Gaming с броским дизайном. Задняя часть печатной платы закрыта металлической пластиной, которая несет защитную и декоративную функции. На боковой грани кулера есть белое окошко с логотипами и подсветкой. В углу присутствует один восьмиконтактный разъем питания. Базовая частота ядра 1530 МГц, средний Boost Clock повышен до 1860 МГц, эффективная частота памяти составляет 8000 МГц.

Для охлаждения используется конструкция под названием MSI Twin Frozr 7. Это охлаждение состоит из двух вентиляторов MSI Torx 3.0, которые оснащены двумя различными типами лопастей вентилятора для улучшения воздушного потока и повышения статического давления. Эти вентиляторы располагаются на вершине большого радиатора с тремя большими 6-миллиметровыми тепловыми трубками, которые непосредственно соприкасаются с графическим процессором. Благодаря Twin Frozr 7 MSI достигла 13% лучшей эффективности охлаждения, чем предыдущее поколение. Освещением на карте можно управлять с помощью приложения MSI Mystic Light, которое можно найти в программном пакете Dragon Center. Есть довольно много различных световых эффектов на выбор, а также возможность изменять яркость и скорость эффектов. На задней панели три разъема DisplayPort и один HDMI.

Тестовая конфигурация системы

Состав тестовой конфигурации
Процессор Intel Core i9-9900K 5.0 ГГц (Coffee Lake, кэш 16 МБ)
Материнская плата EVGA Z390 DARK (чипсет Intel Z390)
Память 16 ГБ DDR4 3867 МГц 18-19-19-39
Накопитель два SSD 960 ГБ
Блок питания Seasonic Prime Ultra Titanium 850 Вт
Кулер Cryorig R1 Universal (два вентилятора 140 мм)
Операционная система Windows 10 Professional 64-разрядная,
версия 1903 (май 2019)
Драйвера RX 5600 XT: Radeon 20.1.1 Jan13 RC5
RX 5500, RX 5700, RX 5700 XT: Radeon 20.1.1 Beta
GTX 1650 Super: 441.20 WHQL
Остальные карты AMD: Radeon 19.10.1 WHQL
Остальные карты NVIDIA: 436.48 WHQL
Дисплей Acer CB240HYKbmjdpr 24″ 3840×2160

Сравнение аналогичных результатов бенчмарков с результатами, приведенными в данном обзоре, корректно только при условии полного совпадения тестовых системных конфигураций.

  • Все игры и все видеокарты тестировались с драйверами, указанными в таблице выше; состав тестовой конфигурации не изменялся.
  • В ходе тестирования для всех видеокарт использовалась одна и та же версия каждой игры.
  • Во всех играх, если не указано иное, были установлены максимальные настройки качества изображения.
  • Настройки антиалиайзинга (AA) и анизотропной фильтрации (AF) устанавливались через меню игры, а не через панель управления драйвера.
  • Снятие показаний в каждом тесте производилось после перехода видеокарты в равновесный температурный режим, во избежание фиксирования завышенных результатов первых нескольких секунд (до нагрева карты).

Каждая игра тестировалась при следующих разрешениях экрана:

  • 1920×1080 – разрешение большинства популярных мониторов;
  • 2560×1440 – средний вариант между Full HD и 4K, предъявляет достаточно высокие требования к производительности.
  • 3840×2160: разрешение 4K Ultra HD, доступно на последних моделях мониторов класса high-end.

Термические и акустические характеристики

Видеокарта Простой Гейминг
Температура GPU, °C Уровень шума, дБА Температура GPU, °C Уровень шума, дБА
ASUS GTX 1650 STRIX 44 Fan Stop 64 28
EVGA GTX 1650 SC Ultra Black 33 Fan Stop 66 36
Gigabyte GTX 1650 OC GDDR6 33 30 74 34
MSI GTX 1650 Gaming X 48 Fan Stop 63 29
Palit GTX 1650 KalmX 38 N/A 83 N/A
Palit GTX 1650 StormX 35 28 68 34

К сожалению, выключение вентилятора в режиме простоя и слабой нагрузки (Fan Stop) у карты Gigabyte GTX 1650 OC GDDR6 не предусмотрено, что делает ее практически непригодной для использования в бесшумных компьютерных медиасистемах. В режиме простоя вентилятор работает сравнительно тихо, но его определенно слышно. Здесь немного поможет небольшое снижение скорости вращения вентилятора, которое не будет заметно отражаться на температуре видеокарты.

Уровень шума в игровом режиме в целом приемлемый: хорошо слышно, как карта работает под полной нагрузкой, но, поскольку температура GPU при этом составляет около 75°C, можно понять, почему в Gigabyte выбрали такие настройки вентилятора. Просто радиатор кулера слабоват для графического чипа TU117.

Сравнение технических характеристик RTX и GTX видеокарт без учета трассировки лучей

Во время запуска карт серии GeForce RTX, Nvidia практически ни слова не посвятила сравнению их игровой производительности с предыдущим поколением

Основное внимание было сосредоточено только на трассировке, полностью игнорируя вещи, которые вызывают наибольший интерес у игроков. Это вызвало волну слухов, будто Nvidia не было чем похвастаться

Позже появилась утечка с презентации, которую Nvidia, вероятно, подготовили для СМИ. Там была приведена диаграмма, в которой производительность последней карты – GeForce RTX 2080 сравнивалась с GeForce GTX 1080. Из диаграммы следовало, что новая видеокарта будет примерно на 50 % эффективнее, чем ее предшественник. Все зависит, конечно, от конкретной игры, в которой проводится сравнение. Однако есть один факт, этот график касался разрешения 4K.

Выбор GPU

Три основные ошибки, которые обычно делаются при выборе видеокарты:

  • высокая цена/низкая производительность;
  • недостаточый объем памяти;
  • плохое охлаждение.

В целом, требования к памяти следующие:

  • Для исследования, в котором нужна максимальная производительность: > = 11 ГБ
  • Для поиска новых архитектур: > = 8 ГБ
  • Любое другое исследование: 8 ГБ
  • Kaggle: 4 — 8 ГБ
  • Стартапы: 8 ГБ (но проверьте конкретную область применения для размеров модели)
  • Компании: 8 ГБ для прототипирования, > = 11 ГБ для обучения

Другая проблема, на которую стоит обратить внимание, особенно если вы покупаете несколько RTX-карт, это охлаждение. Если вы хотите вставить GPU в слоты PCIe, которые расположены рядом друг с другом, вы должны убедиться, что получаете GPU с вентилятором

В противном случае процессоры будут перегреваться, работать медленнее (примерно на 30%) и умирать быстрее.

Стоимость новых видеокарт

Стоимость, как обычно, не радует никого, кроме самой Nvidia. Но это не помешало раскупить самую дорогую версию еще на стадии предзаказа.
Для майнеров ценник получается невыгодным. Ведь прирост вычислительной мощности в топовой видеокарте составил около 30%, а цена на стадии предзаказа увеличилась вдвое в сравнении с 1080Ti.

Цена большая, но она оправдывается сложностью новых чипов. Площадь старого кристалла Pascal cоставляет 471 кв.мм, в сравнении с новым 754 кв.мм, такие большие кристаллы трудоемки в производстве да и степень брака увеличивается. Разработка новой архитектуры тоже недешевое занятие. Ко всему этому в новых видеокартах Нвидиа внедрили новые чипы памяти GDDR6, которые естественно дороже нынешних.

GTX 1070

$449

RTX 2070

$599 (+20%)

GTX 1080

$699

RTX 2080

$799 (+14%)

GTX 1080 Ti

$699

RTX 2080 Ti

$1199 (+71%)

Возможно цену взвинтили для разграничения, на складах ещё много нераспроданных чипов старого поколения. Можно было бы снизить цену, но это вызовет слишком большие потери. Nvidia поступила по другому, что бы заказать новые чипы, нужно вдобавок прикупить старых.

Metro: Exodus

Год выпуска – 2019; API – DirectX 12; движок – 4A Engine

В последнем выпуске культовой игры на выживание в жанре FPS от 4A Games – Metro: Exodus – наш герой Артём (Artyom) отправляется в путешествие по бескрайним российским просторам, на поиски действующего паровоза, на котором он должен возглавить массовый исход оставшихся в живых людей из московского метро; они поедут по Транссибирской магистрали на восток – на поиски других уцелевших после апокалипсиса. Эта игра – не просто шедевр класса AAA, но еще и наглядный пример реализации амбициозных технологий NVIDIA – RTX (рейтрейсинг в реальном времени) и DLSS (суперсэмплинг на основе глубокого обучения). Игра поддерживает DirectX 12 и DXR, но в этом тесте мы отключили опцию DXR/RTX, чтобы можно было корректно сравнивать результаты всех видеокарт.

Техпроцесс и другие нововведения Ampere

За производство графического процессора Ampere отвечает компания Samsung. Выполнены чипы на новом техпроцессе – 8 нм. Это достаточно сильный скачок по сравнению с предыдущим поколением на техпроцессе 12 нм, производства TSMC, который сам по себе был оптимизированной версией 16 нм техпроцесса все той же TSMC. Таким образом, плотность транзисторов значительно выросла, что в первую очередь отражается в сильно возросшем количестве ядер CUDA.

Рекомендуем к ознакомлению:Партнеры Nvidia представили видеокарты серии GeForce RTX Ampere

В то время как решения на базе Turing и Maxswell добились большей части своих успехов за счет оптимизации на архитектурном уровне, Ampere (как и Pascal до него) значительно выигрывает от сильного скачка в процессе литографии. Единственная загвоздка во всем этом заключается в том, что за счет возросшего количества транзисторов увеличилось энергопотребление, что отражается на возросшем TDP видеокарт.

Nvidia заявляет, что ее новые графические процессоры Ampere предлагают вдвое большую энергоэффективность, чем Turing, при этом шейдерные ядра стали в 2,7 раза быстрее, аналогичных в 20-й серии GeForce RTX. Помимо этого, обновленные ядра RT и Tensor будут в 1,7 и 2,7 раза быстрее, чем их предшественники, соответственно, это должно помочь обеспечить весомый прирост производительности в играх с включенной трассировкой лучей и/или DLSS 2.0.

Также была анонсирована новая технология NVIDIA RTX IO. Она позволяет более эффективно использовать скорость интерфейса PCIe 4.0, направляя через него часть данных игры, благодаря чему удалось многократно повысить производительность ввода/вывода, по сравнению со стандартными накопителями. Это позволит разгрузить центральный процессор и обеспечит практически мгновенную загрузку игры.

Помимо новой архитектуры в основу видеокарт Ampere легла память GDDR6X, производства Micron. За счет нового типа памяти удалось добиться более высоких скоростных показателей шины и, следовательно, большей пропускной способности. Как заявляет Nvidia, GDDR6X может передавать вдвое больше данных, чем традиционная память GDDR6 за тот же промежуток времени.

Сравнение архитектур Nvidia Ampere и GPU Turing

Быстрое и краткое сравнение архитектур графических процессоров Ampere и Turing от Nvidia.

Архитектура GPU Ampere Turing
Производитель Nvidia Nvidia
Процесс изготовления 8 нм (Samsung) 12 нм (TSMC)
Версия CUDA 8 7,5
RT ядра 2-е поколение 1-е поколение
Тензорные ядра 3-е поколение 2-е поколение
Потоковые мультипроцессоры 2x FP32 1x FP32
DLSS DLSS 2.0 DLSS 1.0
Поддержка памяти HBM2, GDDR6X GDDR6, GDDR5, HBM2
Поддержка PCIe PCIe Gen 4 PCIe Gen 3
Кодировщик NVIDIA (NVENC) Gen 7 Gen 7
Декодер NVIDIA (NVDEC) Gen 5 Gen 4
DirectX 12 Ultimate да да
VR технология да да
Поддержка нескольких GPU NVLink 3.0 NVLink 2.0
Энергоэффективность Лучше, чем Turing Лучше, чем Volta
Видео порты HDMI 2.1, DisplayPort 1.4a HDMI 2.0b, DisplayPort 1.4a
Графические карты RTX 30 серии Серия RTX 20, серия GTX 16
Приложения Игры, домашний пк, искусственный интеллект (AI) Игры, домашний пк, искусственный интеллект (AI)

Заключение

Я вижу две основные стратегии, которые имеют смысл: выбрать графический процессор серии RTX 20, чтобы получить быстрое обновление, или выбрать дешевый графический процессор серии GTX 10 и обновить его, как только RTX Titan станет доступен.

Если вы менее серьезно относитесь к производительности или она просто не нужна вам, например, в случае с Kaggle и прототипированием, вы можете значительно выиграть от дешевых графических процессоров серии GTX 10. При этом, если вы выбираете графический процессор серии GTX 10, будьте осторожны, чтобы объем памяти графического процессора соответствовал вашим требованиям.

Читайте: Как попасть в топ 2% соревнования Kaggle

Рейтинг
( Пока оценок нет )
Понравилась статья? Поделиться с друзьями:
Онлайн
Добавить комментарий

;-) :| :x :twisted: :smile: :shock: :sad: :roll: :razz: :oops: :o :mrgreen: :lol: :idea: :grin: :evil: :cry: :cool: :arrow: :???: :?: :!: