Sapphire radeon hd 2900 xt 512 мб: особенности архитектуры, производительность, процессорозависимость

Какова цель прохождения стресс-теста графического процессора?

Многие думают, что проверка стабильности или стресс-тестирование графического процессора работает, только если у вас есть разогнанный , чтобы вы могли проверить, стабильно ли работает графический процессор. Это действительно полезно для этого, но использование, которое мы можем дать этому типу тестов, идет гораздо дальше; Его цель — заставить видеокарту работать в максимуме своих возможностей , с уровнем стресса, который намного выше, чем тот, которому мы подвергаемся, например, во время игры.

Однако наличие инструмента, который позволяет нам максимально нагружать графический процессор, может также служить нам для других целей, помимо проверки стабильности разгона, например:

  • Проверьте, есть ли проблемы с графикой или нет ли повреждений, например, есть ли артефакты или компьютер выдает BSOD при максимальной нагрузке на графический процессор.
  • Проверьте, какое максимальное потребление видеокарты.
  • Проверьте, какой максимальной температуры достигает график, чтобы увидеть, не пора ли сменить термопасту или подвергнуть ее хорошей очистке радиатора.
  • Проверьте его уровень шума при максимальной нагрузке.
  • Если ваш компьютер издает какой-то странный шум, например свист катушки, вы можете проверить, действительно ли он исходит от вашей видеокарты.

Как видите, существует множество утилит, которые проводят стресс-тесты видеокарты, хотя правда, что все они предназначены для проверки ее правильной работы. Теперь с этим дополнением к программному обеспечению AMD у нас есть то преимущество, что мы можем делать это напрямую из собственного программного обеспечения бренда и без необходимости прибегать к сторонним инструментам, в некоторых случаях за плату.

Как использовать этот тест с драйверами AMD

Очевидно, что для того, чтобы этот тест появился в ваших драйверах AMD, у вас должна быть видеокарта этой марки, а также установлены драйверы Radeon Software Adrenalin Edition версии 21.3.1 или выше. После этого перейдите на вкладку «Производительность» вверху, а затем выберите параметр «Настройка» в подменю, которое появляется чуть ниже. Вы увидите, что теперь появляется возможность запустить стресс-тест.

Помимо возможности запустить стресс-тест, здесь вы найдете метрики, указывающие на некоторые рабочие параметры графического процессора, такие как тактовая частота, Оперативная память скорость, энергопотребление, скорость вращения вентилятора, температура перехода (температура перехода) и температура графического процессора. Таким образом, с помощью этого теста AMD предоставляет нам все необходимые инструменты для выполнения проверок работоспособности, о которых мы упоминали в предыдущем разделе.

Вам не нужно ничего делать, получить доступ к этому инструменту так же просто, как открыть программное обеспечение AMD Radeon и запустить тест, поэтому, если у вас есть графика AMD, теперь вам проще, чем когда-либо, проверить правильность его работы. и даже следить за его параметрами. Помните, что этот тест позволяет максимально использовать график и что это не обычная ситуация.

Все в небо! Ближе к облакам!

  • При этом обучение нейросети относительно слабо масштабируется горизонтально. Т.е. мы не можем взять 1000 мощных компьютеров и получить ускорение обучения в 1000 раз. И даже в 100 не можем (по крайней мере пока не решена теоретическая проблема ухудшения качества обучения на большом размере батча). Нам вообще довольно сложно что-то раздавать по нескольким компьютерам, поскольку как только падает скорость доступа к единой памяти, в которой лежит сеть — катастрофически падает скорость ее обучения. Поэтому если у исследователя будет доступ к 1000 мощных компьютеров на халяву, он, безусловно, скоро их все займет, но скорее всего (если там не infiniband + RDMA) обучаться там будет много нейросетей с разными гиперпараметрами. Т.е. общее время обучения будет лишь в несколько раз меньше, чем при 1 компьютере. Там возможны и игра с размерами батча, и дообучение, и прочие новые модные технологии, но основной вывод — да, при увеличении количества компьютеров эффективность работы и вероятность достичь результата будут расти, но не линейно. Причем сегодня время исследователя Data Science стоит дорого и часто если можно потратить много машин (пусть неразумно), но получить ускорение — это делается (см. пример с 1, 2 и 4 дорогими V100 в облаках чуть ниже).

Неисправности, вызванные поломками электронных компонентов видеокарты

Большинство неисправностей электронных приборов и любой другой электротехники вызвано отсутствием нужных или появлением ненужных/паразитных контактов (коротких замыканий). Самыми опасными при этом являются случаи, когда появляется пробой какого-нибудь элемента, приводящий к короткому замыканию, что обычно приводит к выгоранию большого количества электронных элементов и частей платы. Такие неисправности можно определить невооруженным глазом при визуальном осмотре платы неисправной видеокарты.

Если не удается визуально найти сгоревшие части, то проблема может быть локализована с помощью омметра (тестера в режиме измерения сопротивления).

С помощью тестера нужно измерить сопротивление предохранителей (должно быть около нуля ом), наличие КЗ и обрывов в цепях между массой видеокарты (землей, обычно это «минус») и контрольными точками.

При контрольной проверке черный провод от прибора подключают к массе, а красный – к плюсу измеряемой цепи. Сопротивления должны быть в пределах:

  • на чипе видеокарты – несколько (1-2) Ом;
  • на видеопамяти и на контроллере видеопамяти – десятки Ом;
  • на линии питания контроллеров PCI-E – десятки Ом;
  • сопротивление по линии питания PCI-E 3,3 вольта – сотни Ом/килоомы.

Если в какой-то точке есть КЗ или обрыв, то неисправность находится именно в этой цепи.

При выявлении КЗ обычно осуществляется проверка подачей низкого напряжения с ограниченным током с лабораторного блока питания для выявления греющихся неисправных компонентов. Исправный чип в норме должен греться очень умеренно. Элементы системы питания в норме также должны быть холодными.

ВНИМАНИЕ:

ВСЕ ЧТО ВЫ БУДЕТЕ ДЕЛАТЬ СО СВОЕЙ ВИДЕОКАРТОЙ, ВЫ ДЕЛАЕТЕ ИСКЛЮЧИТЕЛЬНО НА СВОЙ СТРАХ И РИСК! НИ АВТОР ДАННОГО МАТЕРИАЛА, НИ РЕСУРС UmTale Lab НЕ НЕСУТ ОТВЕТСТВЕННОСТЬ ЗА ВАШЕ ИМУЩЕСТВО!

Для начала запустите информационную программу GPU-z и (надежно) сохраните стоковый биос с помощью кнопки, на которую указывает стрелочка на скриншоте ниже:

Далее, скопируйте (именно скопируйте, а не вырезайте, чтобы у вас сохранился бекап заводской прошивки!) получившийся файл в любую папку и запустите редактор VBE7.

С помощью кнопки «Open» откройте скопированный файл и убедитесь что на той же первой вкладке программы, напротив «VRM» у вас показывает один из следующих контроллеров CHL822x, CHL8214, UP1637, UP1801, ST6788A, или VT1556M.

В моем случае это CHL822x. Если вашего контроллера в списке нет, то выставить точное напряжение не удастся, и придется довольствоваться лишь выпадающей таблицей напряжений. Что в целом, тоже не особо плохо, но поле для маневра сильно сужается.

Теперь переходим во вкладку «Power Play» и ОБЯЗАТЕЛЬНО редактируем нижние две (в случае видеокарт HD 7000 одну, #3) позиции #3 и #0 (позиция #0 это частота турбо-буста которая появилась в линейке R9):

Позиции #0 и #3 должны полностью совпадать.

Здесь все зависит от ваших предпочтений: можно выбрать стоковое значение частоты (строка Core Clock) и подбирать под него напряжение (строка VDDC) (тогда лучше не опускать вольтаж ниже 1.1 вольта), либо, можно выбрать конкретное напряжение (тогда лучше не опускать ниже 0.900 вольт) и подбирать частоту под него (в этом случае лучше серьезно занизить частоту до 700-900МГц и уже отталкиваться от нее).

Лично я, выбрал второй вариант и выставил ровно 1000 милливольт (1 вольт VDDC), а так же, минимально безопасные для этого напряжения 900МГц (Core Clock), после чего нажал на кнопку «Save» и сохранил новую прошивку в отдельный файл:

Далее я запустил программу для прошивки биоса ATI ATIFlash (AMD VBFlash), загрузил с помощью кнопки «LoadImage» только что сделанный файл биоса:

И зашил ее на карту с помощью кнопки «Program«:

Если все прошло успешно, программа попросит вас перезагрузиться, чтобы внесенные изменения вступили в силу. Если же она выдаст ошибку с надписью «Fail!» — просто нажмите еще раз кнопку «Program».

Далее я перешел к тестированию в стресс-тесте для видеокарт FurMark: Повышая в MSI Afteburner частоту чипа на ~15МГц каждые 5 минут (пристрелочное время), я выяснил, что при напряжении 1000мв мой GPU способен стабильно функционировать на частоте 950МГц:

Под нагрузкой напряжение довольно существенно проседает: выставленные мной 1000мв превратились в 959мв. Это нормальное явление, переживать не стоит.

При 1000МГц FurMark моментально зависал намертво, что очевидно говорило о нехватке питающего напряжения. Поэтому, я решил слегка приподнять напряжение до 1.05 вольт.

В итоге, видеокарта смогла стабильно отработать 38 минут в «бублике», после чего, я был уверен что дальнейший тест банально не принесет никаких сюрпризов:

Максимальная температура снизилась на 16 градусов, вместе с чем и ощутимо снизился уровень шума издаваемой немолодой системой охлаждения. Параллельно, энергопотребление GPU упало с 94, до 62 ватт! На мой взгляд, лишь из-за этого стоит проводить процедуру андервольтинга.

Кроме FurMark, в качестве интенсивной 3D-нагрузки я использовал игры The Witcher 2/3 и Destiny 2 запущенные в разрешении 2560×1440. XFX R9 270X с модифицированным биосом справилась с каждой игрой без всяких проблем.

Хотелось бы заметить, что в том же Ведьмаке температура не превышала 53 градусов, что на 8 градусов ниже показателей в «бублике». Соответственно, энергопотребление видеокарты так же будет немного ниже чем в стресс-тесте.

Ниже приведены ссылки на все используемые в этом руководстве программы, а так же, парочка модифицированных биосов с пониженным энергопотреблением для видеокарты XFX Radeon R9 270X:

Скачать редактор биоса VBE7 можно по данной ссылке.

Скачать программу для прошивки биоса ATI ATIFlash / AMD VBFlash можно по этой ссылке.

Биос для видеокарты XFX Radeon R9 270X с напряжением 1000mv и частотами 900/1400МГц:

Биос для видеокарты XFX Radeon R9 270X с напряжением 1050mv и частотами 1000/1400МГц:

Если у вас остались вопросы, или какие-либо пожелания — милости прошу в комментарии.

Янв 12, 2021

Что делать, если ваша система нестабильна?

Как мы уже упоминали ранее, этот инструмент драйверов AMD используется для максимальной загрузки видеокарты из того, что она дает, но вы должны иметь в виду, что это не будет реальной рабочей ситуацией, даже в требовательных играх, где хотя графический процессор можно поставить на 100%, редко память тоже на максимум выставить.

Это может вызвать нестабильность в системе, что может быть нормальным при разгоне, но не так, если график был со стандартными значениями. Следовательно, если, например, вы получали синие экраны во время игры, и вы все еще получаете их при использовании этого теста AMD, тогда вы будете знать, что что-то не работает на вашем графике, и вы уже будете знать, с чего начать исследование проблемы … и именно для этого вы всегда будете иметь в виду значения температуры и скорости вентилятора, например.

Также с помощью этого теста вы сможете увидеть, является ли шум, излучаемый вентиляторами, нормальным, или если график достигает опасной температуры … снова это признак того, что либо он не работает должным образом, либо пришло время провести некоторое обслуживание, Начните с полной очистки и, при необходимости, даже смены термопасты, поскольку это то, что вам придется делать, если вы используете устройство в течение многих лет.

В любом случае, с этим дополнением к набору драйверов AMD компания упростила, как никогда ранее, проверку рабочего состояния видеокарты, а также избавилась от необходимости прибегать к стороннему программному обеспечению, что до сих пор мы всегда использовали. Должен сделать. В любом случае также помните, что это доступно только для видеокарт AMD и с программным обеспечением бренда; на данный момент ни Intel Ни NVIDIA, ни NVIDIA не создали ничего подобного, хотя, как всегда бывает в таких случаях, есть большая вероятность, что они скоро интегрируют это и в свое программное обеспечение.

Поиск обрывов на предохранителях в цепях питания видеокарты

В норме сопротивление предохранителя должно быть около нуля Ом. Их проверяют, замеряя омметром сопротивление между контактами.

Предохранитель в цепи питания 12 вольт по линии PCI-Express:

Сопротивление между правым/левым контактом этого предохранителя и пинами 1,2,3 разъема PCI-E (питание 12 вольт от материнской платы/райзера) также должно быть равным нулю:

Предохранители возле разъемов питания видеокарт Sapphire AMD серии RX580 Nitro Plus:

Видеокарты с одним разъемом питания обычно имеют по два предохранителя (например, у RX470 Nitro есть два fuse по питанию 12 V):

Обычно это предохранители на 10 ампер, которые можно легко заменить аналогами.

При выявлении сгоревшего предохранителя и его замене нужно не спешить включать карту. Прежде всего, нужно разобраться, что вызвало его выход из строя.

Если кратко

Тип Что ускоряет Комментарий
CPU В основном выполнение Обычно худшие по скорости и энергоэффективности, но вполне пригодны для выполнения небольших по размеру нейросетей
GPU Выполнение+
обучение
Наиболее универсальное решение, но довольно дорогое, как по стоимости вычислений, так и по энергоэффективности
FPGA Выполнение Относительно универсальное решение для исполнения сетей, в некоторых случаях позволяет кардинально ускорить выполнение
ASIC Выполнение Наиболее дешевый, быстрый и энергоэффективный вариант исполнения сети, но нужны большие тиражи
TPU Выполнение+
обучение
Первые версии использовались для ускорения выполнения, сейчас используются для весьма эффективного ускорения выполнения и обучения
IPU, DPU… NNP В основном обучение Много маркетинговых букв, которые благополучно забудут в ближайшие годы. Основной плюс этого зоопарка — проверка разных направлений ускорения DNN
Analog DNN / RPU Выполнение+
обучение
Потенциально аналоговые ускорители могут произвести революцию в скорости и энергоэффективности выполнения и обучения нейросетей

Неисправности, вызванные окислением контактов из-за вытекшей жидкости из термопрокладок

Вытекшая из термопрокладок жидкость — это не только безвредное загрязнение видеокарт, но и потенциальная возможность получить замыкание из-за налипшей токопроводящей грязи, а также ухудшение проводимости на участках, окисленных вытекшей субстанцией. Так как при обычной установке карт в риге жидкость вытекает в основном на контакты видеокарты, вставляющиеся в райзер, то начинаются проблемы, связанные с тем, что материнская плата не может определить видеокарту и подвисает на этапе определения устройств PCI-E в BIOS. Иногда из-за плохих контактов появляются ошибки с кодом 43, операционная система после загрузки часто подвисает, даже при отсутствии разгона появляются ошибки с определением температуры и т.д.

Обычно такая неисправность вызывается использованием некачественных термопроводящих прокладок (серые) и слишком высокой температурой при эксплуатации видеокарт (более 70 градусов).

Проверка на наличие коротких замыканий в контрольных точках на плате видеокарты в этом случае показывает нормальное сопротивление, BIOS у видеокарт также в норме. Контакты разъемов при этом покрыты окислами, имеют следы коррозии.

Устранение неисправности в этом случае заключается в очистке/восстановлении контактов. Очистку контактов можно делать спиртом (медицинским или изопропиловым), бензином «Калоша».

Для профилактики таких неисправностей не стоит превышать рабочую температуру видеокарты выше 65 градусов, при проведении профилактической чистки менять засохшие серые термопрокладки на более качественные.

Рейтинг
( Пока оценок нет )
Понравилась статья? Поделиться с друзьями:
Онлайн
Добавить комментарий

;-) :| :x :twisted: :smile: :shock: :sad: :roll: :razz: :oops: :o :mrgreen: :lol: :idea: :grin: :evil: :cry: :cool: :arrow: :???: :?: :!: