Выбор оптимального напряжения, частот памяти и графического процессора видеокарт amd polaris (rx480, rx580) для майнинга ethereum видеокарты

Сравнение характеристик

AMD Radeon RX 580	NVIDIA GeForce GTX 1060 6 GB

Архитектура	GCN 4.0	Pascal
Кодовое имя	Polaris 20	GP106
Дизайн	Radeon RX 500 Series
Поколение GCN	4th Gen
Дата выпуска	18 April 2017	19 July 2016
Цена на дату первого выпуска	$229	$299
Место в рейтинге	169	178
Цена сейчас	$169.99
Тип	Desktop	Desktop
Соотношение цена/производительность (0-100)	76.21

Частота ядра в режиме Boost	1340 MHz	1709 MHz
Количество конвейеров Compute	36
Частота ядра	1257 MHz	1506 MHz
Производительность с плавающей точкой	6.2 TFLOPs	4,375 gflops
Технологический процесс	14 nm	16 nm
Количество шейдерных процессоров	2304	1280
Pixel fill rate	42.88 GP/s
Render output units	32
Stream Processors	2304
Скорость текстурирования	192.96 GTexel/s	136.7 GTexel / s
Texture Units	144
Энергопотребление (TDP)	185 Watt	120 Watt
Количество транзисторов	5,700 million	4,400 million

Видеоразъёмы	1x HDMI, 3x DisplayPort	1x DVI, 1x HDMI, 3x DisplayPort
Поддержка DisplayPort
Поддержка Dual-link DVI
HDMI
VGA

CrossFire без мостика
Интерфейс	PCIe 3.0 x16	PCIe 3.0 x16
Длина	241 mm	250 mm
Рекомендованный блок питания	500 Watt
Дополнительные разъемы питания	1x 8-pin	1x 6-pin

DirectX	12	12.0 (12_1)
OpenCL	2.0
OpenGL	4.5	4.6
Vulkan

Максимальный размер памяти	8 GB	6 GB
Пропускная способность памяти	256 GB/s	192.2 GB / s
Ширина шины памяти	256 bit	192 Bit
Частота памяти	8000 MHz	8008 MHz
Тип памяти	GDDR5	GDDR5

Инструкция по прошивке в HiveOS:

Останавливаем работу майнера в HiveOS.
Скачиваем софт для модификации VBIOS здесь
Скачиваем БИОС на , в выпадающем меню — Скачать.
При помощи PolarisBiosEditor в прописываем соответствующей вашей памяти страп в 2 последние строчки своего биоса. Сохраните полученный БИОС обязательно в НОВЫЙ файл.
Закачиваем БИОС в видеокарту , в выпадающем меню — Загрузить. Можно загрузить сразу на все карты. Пробуйте каждый страп из списка, чтобы найти оптимальный для своей карты.
После получения нотификации что БИОС прошит необходимо перезагрузить HiveOS.
После того как риг вновь загрузился, нужно пробовать разные разгоны и гонять карту в разных режимах, чтобы найти оптимальный режим при котором минимальный % не корректных шар.
Вернуться на стоковый БИОС можно повторив вышеуказанную операцию с сохраненным оригинальным БИОСом.

Сравнение бенчмарков

GPU 1: AMD Radeon RX 580 GPU 2: NVIDIA GeForce GTX 1060 6 GB

PassMark — G3D Mark	GPU 1
GPU 2

8803

9999

PassMark — G2D Mark
GPU 1

GPU 2

755

730

Geekbench — OpenCL
GPU 1

GPU 2

45038

35852

CompuBench 1.5 Desktop — Face Detection (mPixels/s)
GPU 1

GPU 2

116.142

119.051

CompuBench 1.5 Desktop — Ocean Surface Simulation (Frames/s)
GPU 1

GPU 2

1022.932

1376.407

CompuBench 1.5 Desktop — T-Rex (Frames/s)
GPU 1

GPU 2

9.235

8.694

CompuBench 1.5 Desktop — Video Composition (Frames/s)
GPU 1

GPU 2

84.034

21.452

CompuBench 1.5 Desktop — Bitcoin Mining (mHash/s)
GPU 1

GPU 2

607.721

456.147

GFXBench 4.0 — Car Chase Offscreen (Frames)
GPU 1

GPU 2

11285

12442

GFXBench 4.0 — Manhattan (Frames)
GPU 1

GPU 2

3524

3691

GFXBench 4.0 — T-Rex (Frames)
GPU 1

GPU 2

3364

3340

GFXBench 4.0 — Car Chase Offscreen (Fps)
GPU 1

GPU 2

11285

12442

GFXBench 4.0 — Manhattan (Fps)
GPU 1

GPU 2

3524

3691

GFXBench 4.0 — T-Rex (Fps)
GPU 1

GPU 2

3364

3340

3DMark Fire Strike — Graphics Score
GPU 1

GPU 2

4327

4187

Название	AMD Radeon RX 580	NVIDIA GeForce GTX 1060 6 GB
PassMark — G3D Mark	8803	9999
PassMark — G2D Mark	755	730
Geekbench — OpenCL	45038	35852
CompuBench 1.5 Desktop — Face Detection (mPixels/s)	116.142	119.051
CompuBench 1.5 Desktop — Ocean Surface Simulation (Frames/s)	1022.932	1376.407
CompuBench 1.5 Desktop — T-Rex (Frames/s)	9.235	8.694
CompuBench 1.5 Desktop — Video Composition (Frames/s)	84.034	21.452
CompuBench 1.5 Desktop — Bitcoin Mining (mHash/s)	607.721	456.147
GFXBench 4.0 — Car Chase Offscreen (Frames)	11285	12442
GFXBench 4.0 — Manhattan (Frames)	3524	3691
GFXBench 4.0 — T-Rex (Frames)	3364	3340
GFXBench 4.0 — Car Chase Offscreen (Fps)	11285	12442
GFXBench 4.0 — Manhattan (Fps)	3524	3691
GFXBench 4.0 — T-Rex (Fps)	3364	3340
3DMark Fire Strike — Graphics Score	4327	4187

Тестовая конфигурация компьютера и набор тестов

Наша тестовая подборка включает в себя самые разнообразные сценарии – от рендеринга до вычислительных задач – и содержит как синтетические бенчмарки, так и примеры из реальных приложений, в частности, от Adobe и Autodesk.

В большинстве тестов участвовали вышеупомянутые 12 видеокарт, но в CUDA-тестах мы добавили к заглавным картам NVIDIA не-SUPER версии 2060/2070/2080, а также 2080 Ti, чтобы немного разбавить результаты. Ограниченное время не позволило нам включить эти карты в остальные тесты, но и результаты CUDA-тестов в любом случае повышают репрезентативность нашего обзора.

К сожалению, эта статья получилась не такой однородной, как нам хотелось бы. Мы столкнулись с рядом нестыковок, связанных со спецификой используемых программ; эти проблемы описаны непосредственно перед результатами соответствующих тестов. В частности, карты AMD Navi не работали с программами MAGIX Vegas Pro и SiSoftware Sandra, хотя мы уверены, что это скоро исправят. Вдвойне досадно, что тест в AMD Radeon ProRender у нас тоже полетел из-за бага, о котором мы еще поговорим, а этот рендерер мог бы стать третьим для карт AMD; зато у карт NVIDIA был дополнительный бонус в виде четырех тестов для CUDA.

Но ничто не идеально. Когда будет время, мы проведем повторное тестирование, а на данный момент у нас все-таки есть достаточное количество результатов для разбора. Для начала – состав тестовой конфигурации.

Тестовая конфигурация рабочей станции
Процессор	Intel Core i9-9980XE (18 ядер, 3.0 ГГц)
Материнская плата	ASUS ROG STRIX X299-E GAMING
Память	G.SKILL Flare X (F4-3200C14-8GFX) 4x 8 ГБ; DDR4-3200 14-14-14
Графика	AMD Radeon VII (16 ГБ, Adrenaline 19.7.1) AMD Radeon RX 5700 XT (8 ГБ, Adrenaline 19.7.2) AMD Radeon RX 5700 (8 ГБ, Adrenaline 19.7.2) AMD Radeon RX 590 (8 ГБ, Adrenaline 19.7.1) AMD Radeon Pro WX 8200 (8 ГБ, Enterprise 19.Q2.1) NVIDIA TITAN RTX (24 ГБ, GeForce 431.36) NVIDIA GeForce RTX 2080 SUPER (8 ГБ, GeForce 431.56) NVIDIA GeForce RTX 2070 SUPER (8 ГБ, GeForce 431.36) NVIDIA GeForce RTX 2060 SUPER (8 ГБ, GeForce 431.36) NVIDIA GeForce GTX 1080 Ti (11 ГБ, GeForce 431.56) NVIDIA GeForce GTX 1660 Ti (6 ГБ, GeForce 431.56) NVIDIA Quadro RTX 4000 (8 ГБ, Quadro 431.02)
Аудиосистема	Встроенная
Накопитель	SSD Kingston KC1000 960 ГБ M.2
Блок питания	Corsair 80 Plus Gold AX1200
Корпус	Corsair Carbide 600C Inverted Full-Tower
Охлаждение	Жидкостный кулер NZXT Kraken X62 AIO
Операционная система	Windows 10 Pro, версия 18362 (1903)

Все бенчмарки мы разделили на четыре группы. В первую группу вошли «нейтральные» рендереры Blender и LuxMark. Во вторую – программы только для CUDA: V-Ray, Arnold, Redshift и Octane.

В третью группу мы включили кодировочные тесты: Adobe Premiere Pro, MAGIX Vegas Pro и – новое слово в нашей подборке тестов для GPU – Agisoft Metashape. Metashape – это приложение для фотограмметрии, но, пока мы не добавим в наш тестовый арсенал другие аналогичные приложения (например, Reality Capture, которое скоро выйдет), чтобы можно было выделить их в отдельную группу, Metashape будет числиться в категории кодировочных тестов. И, наконец, четвертую группу составили популярные программные пакеты с визуализацией моделируемых объектов.

PlaidML: кроссплатформенность во главе угла

TensorFlow служит бэкэндом для Keras, интерпретируя его синтаксис и преобразуя его в инструкции, которые могут выполняться на процессоре или GPU. К сожалению, он поддерживает только видеокарты с технологией Nvidia CUDA.

PlaidML — альтернативный бэкэнд для Keras с поддержкой OpenCL. Его можно использовать для обучения моделей Keras на встроенной графике процессора, дискретном или даже внешнем графическом процессоре AMD. Он работает на Windows, Linux и Mac.

UPD: В своём комментарии пользователь MikeLP указал, что:

По моему мнению, PlaidML ещё актуален, т.к. включение Keras в Tensorflow произошло недавно и API не успел существено поменяться. Однако дальшейшие перспективы Keras+PlaidML выглядят туманно.

Установка PlaidML очень проста. Нужно поставить Python-пакет и выбрать устройство в пошаговом конфигураторе:

В коде нужно прописать использование PlaidML как бэкэнда:

После этого все вычисления будут выполняться на видеокарте. Запустим бенчмарк:

Сравним результаты нашего видеоадаптера с некоторыми другими. RX 580 и Ryzen 2600 я тестировал локально, результаты остальных устройств взяты от других пользователей:

Устройство	Время компиляции	Время исполнения
Radeon RX 580	6.14s	6.51s
Radeon Vega Frontier Edition	4.56s	5.50s
GeForce GTX 1080 TI	2.52s	4.83s
Intel HD Graphics 5500	36.64s	755.23s
AMD Ryzen 2600 (CPU)	5.04s	254.70s

Видеоадаптеры AMD показывают себя ощутимо медленнее видеокарт Nvidia. Впрочем, разрыв между видеокартами на порядок меньше пропасти между видеокартами и процессорами. Исключением выступает Intel HD Graphics: PlaidML совершенно не оптимизирован для видеокарт Intel и их использование не имеет особого смысла.

Преимущества

Причины выбрать AMD Radeon RX 580

Видеокарта новее, разница в датах выпуска 8 month(s)
Скорость текстурирования в 1411.6 раз(а) больше: 192.96 GTexel/s vs 136.7 GTexel / s
Количество шейдерных процессоров на 80% больше: 2304 vs 1280
Более новый технологический процесс производства видеокарты позволяет её сделать более мощной, но с меньшим энергопотреблением: 14 nm vs 16 nm
Максимальный размер памяти примерно на 33% больше: 8 GB vs 6 GB
Производительность в бенчмарке PassMark — G2D Mark примерно на 3% больше: 755 vs 730
Производительность в бенчмарке Geekbench — OpenCL примерно на 26% больше: 45038 vs 35852
Производительность в бенчмарке CompuBench 1.5 Desktop — T-Rex (Frames/s) примерно на 6% больше: 9.235 vs 8.694
Производительность в бенчмарке CompuBench 1.5 Desktop — Video Composition (Frames/s) в 3.9 раз(а) больше: 84.034 vs 21.452
Производительность в бенчмарке CompuBench 1.5 Desktop — Bitcoin Mining (mHash/s) примерно на 33% больше: 607.721 vs 456.147
Производительность в бенчмарке GFXBench 4.0 — T-Rex (Frames) примерно на 1% больше: 3364 vs 3340
Производительность в бенчмарке GFXBench 4.0 — T-Rex (Fps) примерно на 1% больше: 3364 vs 3340
Производительность в бенчмарке 3DMark Fire Strike — Graphics Score примерно на 3% больше: 4327 vs 4187

Характеристики
Дата выпуска	18 April 2021 vs 19 July 2016
Скорость текстурирования	192.96 GTexel/s vs 136.7 GTexel / s
Количество шейдерных процессоров	2304 vs 1280
Технологический процесс	14 nm vs 16 nm
Максимальный размер памяти	8 GB vs 6 GB
Бенчмарки
PassMark — G2D Mark	755 vs 730
Geekbench — OpenCL	45038 vs 35852
CompuBench 1.5 Desktop — T-Rex (Frames/s)	9.235 vs 8.694
CompuBench 1.5 Desktop — Video Composition (Frames/s)	84.034 vs 21.452
CompuBench 1.5 Desktop — Bitcoin Mining (mHash/s)	607.721 vs 456.147
GFXBench 4.0 — T-Rex (Frames)	3364 vs 3340
GFXBench 4.0 — T-Rex (Fps)	3364 vs 3340
3DMark Fire Strike — Graphics Score	4327 vs 4187

Причины выбрать NVIDIA GeForce GTX 1060 6 GB

Частота ядра примерно на 20% больше: 1506 MHz vs 1257 MHz
Частота ядра в режиме Boost на 28% больше: 1709 MHz vs 1340 MHz
Производительность с плавающей точкой в 705.6 раз(а) больше: 4,375 gflops vs 6.2 TFLOPs
Примерно на 54% меньше энергопотребление: 120 Watt vs 185 Watt
Производительность в бенчмарке PassMark — G3D Mark примерно на 14% больше: 9999 vs 8803
Производительность в бенчмарке CompuBench 1.5 Desktop — Face Detection (mPixels/s) примерно на 3% больше: 119.051 vs 116.142
Производительность в бенчмарке CompuBench 1.5 Desktop — Ocean Surface Simulation (Frames/s) примерно на 35% больше: 1376.407 vs 1022.932
Производительность в бенчмарке GFXBench 4.0 — Car Chase Offscreen (Frames) примерно на 10% больше: 12442 vs 11285
Производительность в бенчмарке GFXBench 4.0 — Manhattan (Frames) примерно на 5% больше: 3691 vs 3524
Производительность в бенчмарке GFXBench 4.0 — Car Chase Offscreen (Fps) примерно на 10% больше: 12442 vs 11285
Производительность в бенчмарке GFXBench 4.0 — Manhattan (Fps) примерно на 5% больше: 3691 vs 3524

Характеристики
Частота ядра	1506 MHz vs 1257 MHz
Частота ядра в режиме Boost	1709 MHz vs 1340 MHz
Производительность с плавающей точкой	4,375 gflops vs 6.2 TFLOPs
Энергопотребление (TDP)	120 Watt vs 185 Watt
Частота памяти	8008 MHz vs 8000 MHz
Бенчмарки
PassMark — G3D Mark	9999 vs 8803
CompuBench 1.5 Desktop — Face Detection (mPixels/s)	119.051 vs 116.142
CompuBench 1.5 Desktop — Ocean Surface Simulation (Frames/s)	1376.407 vs 1022.932
GFXBench 4.0 — Car Chase Offscreen (Frames)	12442 vs 11285
GFXBench 4.0 — Manhattan (Frames)	3691 vs 3524
GFXBench 4.0 — Car Chase Offscreen (Fps)	12442 vs 11285
GFXBench 4.0 — Manhattan (Fps)	3691 vs 3524

Инструкция по прошивке в MinerOS:

Останавливаем работу майнера в MinerOS.
Скачиваем софт для модификации VBIOS здесь
Скачиваем БИОС на , в выпадающем меню — Скачать.
При помощи PolarisBiosEditor в прописываем соответствующей вашей памяти страп в 2 последние строчки своего биоса. Сохраните полученный БИОС обязательно в НОВЫЙ файл.
Закачиваем БИОС в видеокарту , в выпадающем меню — Загрузить. Можно загрузить сразу на все карты. Пробуйте каждый страп из списка, чтобы найти оптимальный для своей карты.
После получения нотификации что БИОС прошит необходимо перезагрузить MinerOS.
После того как риг вновь загрузился, нужно пробовать разные разгоны и гонять карту в разных режимах, чтобы найти оптимальный режим при котором минимальный % не корректных шар.
Вернуться на стоковый БИОС можно повторив вышеуказанную операцию с сохраненным оригинальным БИОСом.

Технические характеристики (спецификация)

Параметр	Radeon RX 580 XTR	GeForce GTX 970

Производитель GPU	AMD	Nvidia
Название графического процессора	Polaris 20	GM204
Тактовая частота	1,257 MHz	1,050 MHz
Тактовая частота в режиме Turbo	1,340 MHz	1,178 MHz
Два процессора	Нет	Нет
Референс карта	Нет	Нет

Количество шейдерных блоков	2,304	1,664
Количество текстурных блоков (TMU)	144	104
Количество блоков растеризации (ROP)	32	56
Пиксельная скорость заполнения	42.88 GPixel/s	58.8 GPixel/s
Текстурная скорость заполнения	193 GTexel/s	109.2 GTexel/s
Количество операций с плавающей запятой (FLOPS)	6,175 GFLOPS	3,494 GFLOPS

Тактовая частота памяти	2,000 MHz	1,753 MHz
Эффективная частота памяти	8,000 MHz	7,012 MHz
Разрядность шины памяти	256 bit	256 bit
Объем видеопамяти	8,192 MB	4,096 MB
Тип памяти	GDDR5	GDDR5
Пропускная способность памяти	256 GB/s	224.4 GB/s

FAQ (ответы на частые вопросы)

Моя память гонится до 2100 МГц. Будет ли после прошивки она работать на тех же частотах
Скорее всего нет. Будет работать на 1950-2050. Агрессивные тайминги уменьшают максимальную рабочую частоту.
У моей карты после прошивки вырос результат добычи, но так же увеличилось энергопотребление. Это нормально?
Да, карта работает быстрее, потребляет несколько больше.
В. На каких частотах начинать проверку после прошивки.
Можно начать на частоте Мах-200. Далее двигаться вверх для нахождения предельной стабильной частоты по 20-25 МГц. Max — это максимальная частота работы памяти до прошивки. Перед каждым прибавлением частоты нужно выключать майнер, иначе система может зависнуть!
Я прошил тайминги, но после запуска майнера система зависает.
Значит набор таймингов не подходит к Вашей карте. Можно так же попробовать уменьшить частоту памяти.
Зачем шить страпы 1750 и выше?
Это делается для того, что бы карта не превратилась в кирпич. Если между 1750 и 2000 есть еще страпы, то в них тоже. В случае, если Вы зашиваете только в эти страпы, то карта стартует в любом случае, даже если тайминги не подошли. И Вы можете вернуть оригинальный биос.
Я прошил биос, драйвера не ставятся.
В драйверах АМД стоит защита от неоригинального БИОС. Нужно установить драйвера. Перезагрузить ПК. Далее использовать патчер. atikmdag-patcher-1.4.5.zip
Будет 2 окошка. В первом нажать да, во втором ОК. Перезагрузить — работает.
Почему тайминги из темы чаще всего быстрее родных? Даже если родные от более низкого страпа.
Как правило, тайминги из темы лучше, чем родные даже из более низких страпов. Дело в том, что эти тайминги отредактированы вручную и часть таймингов очень занижены. Заводские страпы никогда не занижаются так. Даже от самых низких частот.
Почему производитель не занижает?
1) Вся память немного разная.Какая-то на более чистых кристаллах, какая-то на менее. Т.е. на неудачных. Производителю надо, чтоб основная масса памяти нормально работала. Поэтому делают запас по таймингам.
2) если тайминги занизить, то растет потребление карты в целом. Производителю нужно уложить потребление в определенные рамки. Поэтому это вторая причина, почему производитель делает «щадящие» тайминги.
Насколько сильно отличаются результаты в майнинге эфира у RX460 с разблокированными конвейерами и обычной RX460
При зашитых настроенных таймингах результат отличается в 0,5 Мх. Т.е., если карта не разблокируется, то не стоит отчаиваться.
Какой результат на RX470/570/480/580/590 можно считать хорошим? Т.е. хорошие ли я подобрал тайминги?
Если при настроенных таймингах RX470/570 при частоте ядра/памяти 1167/2000 приближается к 29Мх — это хорошие тайминги. У 480/580 результат должен быть 29,5-29,7 При тех же частотах.
Влияет ли частота ядра на результат майнинга ETH?
Да, влияет. Если у Вас с быстрыми таймингами память берет 2050 и более, то можно задуматься о разгоне ядра. Разгон ядра с 1170 до 1200 даст еще 0,3-0,5Мх. Если же Ваша память едва едва берет 1900, то так разгонять ядро не имеет смысла.
У меня биос на 2 типа памяти. Куда шить тайминги?
О. Если знаете, где какая память — то шить те страпы, которые относятся к вашему типу памяти. Если нет, можно прошить оба типа памяти. Главное условие шить только страпы 1750 и выше.
Где взять правильные драйвера под виндовс
Вот ссылка на драйвера с сайта АМД. Берите для своей версии ОС.
О доходах.
Допустим вы добывали в месяц 25000 руб. При скорости карт 25Мх/с. После твика карты стали добывать 27,5Мх/с. Т.е. +10%. Это значит что и Ваш заработок вырос до 27500. Т.е. 10%. Не поскупитесь на небольшую благодарность. Скажем 10% от 10%)))

Подбор таймингов занимает очень много времени. Буду рад Вашим пожертвованиям, ведь каждый труд должен оплачиваться.

ЮMoney: 410014851652678https://www.donationalerts.com/r/maxoperatorhttps://donate.qiwi.com/payin/maxoperatorhttps://donatepay.ru/d/maxoperator
BTC ► 1EawCW5jaNzzqgzQz8mXtnEqoJvmqFx38C
ETH ► 0x98d13b7b67276fb2cf4783e3c8ac07ca702b152d
XRP ► rEb8TK3gBgk5auZkwc6sHnwrGVJH8DuaLh

Перекодирование: Adobe Premiere Pro, MAGIX Vegas и Agisoft Metashape

Adobe Premiere Pro CC 2019

Мы неоднократно обещали усовершенствовать наши тесты в Adobe Premiere Pro, но приоритет получила другая аналогичная работа (тест DaVinci Resolve вышел раньше обновленного PP). На данный момент у нас есть пара базовых кодировочных тестов, которые, может быть, и не являются образцово-показательными, но все-таки достаточно показательны.

Разрешение 8K – вещь трудоемкая, но в то же время не требующая каких-то сверхресурсов, если использовать простые способы перекодирования (по крайней мере, в случае RED). С реальными проектами дела обстоят по-другому, но, в конечном счете, топовые видеокарты и здесь показывают близкие результаты, причем Radeon VII подтягивается к картам NVIDIA SUPER.

Результаты карт Navi в обоих тестах сложно назвать блестящими, но, тем не менее, мы видим заметный прогресс относительно карты RX 590 на базе Polaris. Будет ли этот прогресс наблюдаться в Vegas? Вполне возможно, если карты Navi будут там работать. Давайте это обсудим.

MAGIX Vegas Pro 16

Vegas – это еще одна программа, которую мы задействовали в полном объеме, но вообще-то она не входит в число наших любимых тестов, поскольку дает совершенно непредсказуемые результаты на видеокартах NVIDIA.

Проще говоря, пользователям карт NVIDIA по-прежнему нужно подключать на панели управления NVIDIA специальный профиль для Vegas – чтобы получить возможность выйти на полную скорость, хотя слово “полная” здесь не совсем точно отражает действительность, так как есть ощущение, что во всей цепочке оптимизаций тут самое слабое звено. И благодаря этому видеокарты AMD в этом состязании победили, если не считать серию Navi.

После положительных результатов видеокарт серии RX 5700 в Adobe Premiere Pro тот факт, что они не работают в Vegas, не может не расстраивать. Причем из него следует, что эти карты не будут там работать совсем (ошибка выдается уже на старте). Мы предполагаем, что решать эту проблему должны в MAGIX, а связана она может быть с новым движком AMD Radeon Media Engine. Мы будем наблюдать за дальнейшим развитием событий, самым значимым из которых должен стать скорый выход VP17.

Agisoft Metashape

Metashape – это новый бренд в нашей библиотеке тестов для видеокарт, который поможет нам выявить производительность GPU в задачах фотограмметрии. При этом Metashape – не единственный подобный инструмент, и мы планируем в скором времени добавить к нему Reality Capture. Мы уже использовали Metashape в качестве бенчмарка для CPU, но в последних версиях была добавлена поддержка GPU, и мы – с некоторым опозданием – начали использовать эту опцию в соответствующих тестах.

Для наших нужд достаточно двух первых стадий всего процесса. Первая стадия включает в себя первичную обработку фото и осуществляется настолько быстро, что зафиксировать результаты для последующего сравнения очень сложно. А вторая стадия, на которой создаются «карты глубины» (Depth Maps Generation), как раз и показывает производительность графического процессора.

Когда мы используем новые бенчмарки, то никогда не беремся заранее предугадать итоговое распределение мест, но здесь мы видим вполне закономерные результаты: TITAN RTX занимает свое законное первое место, ниже располагаются все остальные в соответствии со своей квалификацией. И мы видим, что карты AMD Navi с этой программой справляются явно с большими затруднениями: новая карта RX 5700 XT не смогла превзойти старую RX 590. Мы не уверены на 100%, что в будущем производительность карт Navi здесь будет улучшена, но повторное тестирование все-таки проведем – когда выйдет или новая версия Metashape, или новый драйвер AMD с соответствующими оптимизациями.

Общее сравнение

Показатели в играх

Тестирование проводилось на: Battlefield 3, Battlefield 4, Bioshock Infinite, Crysis 2, Crysis 3, Dirt3, FarCry 3, Hitman: Absolution, Metro: Last Light, Thief, Alien: Isolation, Anno 2070, Counter-Strike: Global Offensive, Diablo III, Dirt Rally, Dragon Age: Inquisition, The Elder Scrolls V: Skyrim, FIFA 15, FIFA 16, GRID Autosport, Grand Theft Auto V, Sleeping Dogs, Tomb Raider, The Witcher 3: Wild Hunt.

Radeon RX 580	нет данных
GeForce GTX 1060	нет данных
GeForce GTX 1050 Ti	6.9 из 10

Работа с графикой

Тесты видеокарты выполнялись на: T-Rex, Manhattan, Cloud Gate Factor, Sky Diver Factor, Fire Strike Factor.

Radeon RX 580	6.5 из 10
GeForce GTX 1060	5.4 из 10
GeForce GTX 1050 Ti	6.3 из 10

Вычислительная мощность

Для тестов использовались: Face Detection, Ocean Surface Simulation, Particle Simulation, Video Composition, Bitcoin Mining.

Radeon RX 580	7.2 из 10
GeForce GTX 1060	6.8 из 10
GeForce GTX 1050 Ti	6.7 из 10

Производительность из расчета на 1 Вт

Для тестов использовались: Battlefield 3, Battlefield 4, Bioshock Infinite, Crysis 2, Crysis 3, Dirt3, FarCry 3, Hitman: Absolution, Metro: Last Light, Thief, Alien: Isolation, Anno 2070, Counter-Strike: Global Offensive, Diablo III, Dirt Rally, Dragon Age: Inquisition, The Elder Scrolls V: Skyrim, FIFA 15, FIFA 16, GRID Autosport, Grand Theft Auto V, Sleeping Dogs, Tomb Raider, The Witcher 3: Wild Hunt, T-Rex, Manhattan, Cloud Gate Factor, Sky Diver Factor, Fire Strike Factor, Face Detection, Ocean Surface Simulation, Particle Simulation, Video Composition, Bitcoin Mining, TDP.

Radeon RX 580	7.2 из 10
GeForce GTX 1060	7.1 из 10
GeForce GTX 1050 Ti	8.0 из 10

Шум и мощность

Видеокарта тестировалась на: TDP, Idle Power Consumption, Load Power Consumption, Idle Noise Level, Load Noise Level.

Radeon RX 580	8.5 из 10
GeForce GTX 1060	9.1 из 10
GeForce GTX 1050 Ti	9.5 из 10

Выводы

В 2021 году в сфере машинного обучения становится всё менее и менее важно, какая у вас видеокарта. Видеокарты AMD всё ещё ощутимо отстают в производительности от собратьев из Nvidia, однако при этом и стоят дешевле

Тем не менее, поддержка видеокарт Radeon далека от идеальной, и необходимая настройка для них сложнее и дольше.

Если у вас уже есть видеокарта от AMD, то возможно для целей разработки вам не понадобится менять её на видеокарту Nvidia. Оптимальным выбором для машинного обучения на видеокартах Radeon я считаю фреймворк ROCm. Он обеспечивает приличную производительность, и позволяет запустить TensorFlow 2.2.0 и Keras.