Рассказываем, как работает AMD FSR, для чего он нужен и чем отличается от NVIDIA DLSS. Как известно в прошлом году продажи графических процессоров компаниями Nvidia и AMD стремительно росли, рост продаж частично был связан с майнерами, которые покупали процессоры для добычи криптовалют. В производительности трассировки лучей Nvidia напротив обходит AMD примерно на одно поколение. США ограничили экспорт продвинутых чипов искусственного интеллекта американских технологических компаний Nvidia и Advanced Micro Devices (AMD) в ряд стран Ближнего Востока, передает агентство Рейтер.
Рейтинг видеокарт - таблица производительности
AMD расширила линейку видеокарт Radeon среднего уровня двумя новыми моделями RX 7800 XT и RX 7700 XT. В God of War связка Intel/NVIDIA вновь оказалась чуть лучше: 130 fps против 116 fps у AMD; в 4K — 86 и 74 fps у Intel/NVIDIA и AMD соответственно. Да-да, Nvidia, AMD и Intel представили целый ворох новых процессоров и видеокарт на выставке CES 2023 Ты заинтересован? тогда читай дальше, и мы расскажем, чем именно показали эти гиганты.
Видеокарты от Nvidia и AMD – рейтинг лучших GPU 2024 года для игр и работы
И именно для последних производители видеочипов — Nvidia и AMD — придумали технологии, которые позволяют существенно улучшить картинку в разрешении FHD, даже если у вас и так настройки в играх выкручены на ультра. В первую категорию входят видеокарты от производителей, которые напрямую сотрудничают с NVIDIA, AMD и Intel. Что такое Nvidia DLSS и DLSS 2.0, и когда AMD выпустит свой аналог глубокого машинного обучения для увеличения частоты кадров, без которого ей не выжить на рынке видеоускорителей? Генеральный директор AMD Лиза Су подчеркнула более высокий потенциал производительности чипа по сравнению с «конкурентами» — не слишком завуалированная отсылка к Nvidia.
В AMD и Nvidia ожидают снижения продаж на графические процессоры
Но прежде чем мы разрешим вечный спор между Nvidia и AMD, давайте разберемся, что вообще такое видеокарта и каковы ее функции в игровом ПК. Рассказываем, как работает AMD FSR, для чего он нужен и чем отличается от NVIDIA DLSS. Компании NVIDIA и AMD договорились к концу года решить проблему с ценами на видеокарты. В производительности трассировки лучей Nvidia напротив обходит AMD примерно на одно поколение. Нынешнее поколение AMD и NVIDIA начинается от 28.000 ₽. Но в нижнем ценовом сегменте прирост производительности по сравнению с предыдущим поколением наблюдается не всегда.
По следам CES 2023: важнейшее из презентаций NVIDIA, AMD и Intel
Поскольку различия между чипами с каждым поколением становятся все меньше, выбор графического процессора зависит не столько от самого производителя, сколько от ваших предпочтений и вычислительных потребностей, а также от того, какой из лучшие видеокарты могут удовлетворить это. Несмотря на это, у каждой марки есть свои сильные и слабые стороны. Вот почему мы сравнили AMD и Nvidia друг с другом, чтобы увидеть, кто лидирует на рынке графических процессоров с точки зрения цены, производительности и возможностей. В то время как в последнем поколении конкуренция между Nvidia и AMD привела к созданию одних из лучших и самых доступных графических процессоров за последние годы, этому поколению в этом отношении явно не хватает.
Важно отметить, что точная модель карты AMD, участвующей в тесте, не сообщается.
Так что не исключено, что сравнение не совсем корректно, поскольку это может быть как RX 6800, так и 6900 XT. Остаётся ждать новых тестов.
Технология никогда не ограничивается только новейшими и лучшими поддерживаемыми разработками. Покупка оборудования для ПК больше похожа на покупку обуви из-за функциональности, чем из-за эстетики, даже если то, что вы делаете на своём ПК, работает на эстетику!
Хотя я собираюсь сосредоточиться на положительных моментах, важно отметить, что встроенные кодеки графических процессоров AMD слабее по сравнению с кодеками Nvidia и Intel. Это несвязанно с поддержкой форматов, скорее, встроенные медиакодеры Nvidia GPU и Intel просто лучше работают с более низкими битрейтами, чем кодировщик AMD. Другими словами, если ваша основная проблема с видеокартой AMD связана с кодировщиком мультимедиа… вы можете просто увеличить битрейт на рендеринге AMD, чтобы достичь паритета с другими кодировщиками. Однако, если вы транслируете в прямом эфире , это также означает, что для более качественного потока с кодировкой AMD GPU может потребоваться более высокая скорость загрузки, чем для одного запуска на кодировщике Intel или Nvidia.
Конечно, прямые трансляции и большинство размещенных в Интернете видео в любом случае будут сжаты в той или иной форме… Производительность в играх при разрешении до 4K Еще одна область, в которой AMD преуспевает, — игровая производительность при разрешениях ниже 4K. Хотя у Nvidia может быть небольшое преимущество в общей игровой производительности при разрешении 4K особенно с учетом таких технологий, как DLSS , 1080p и 1440p по-прежнему остаются невероятно популярными разрешениями для игр. Нельзя забывать, что AMD более конкурентоспособна по цене в этих разрешениях по всем направлениям, особенно с учетом их собственного масштабирования изображения. В моем текущем игровом опыте.
Две современные функции «разрушители игр» — это «глобальное освещение» и «локальное затемнение». Некоторые дисплеи, такие как OLED-дисплеи, имеют встроенное локальное затемнение, в то время как панели TN или IPS должны использовать сертификаты HDR и высокие настройки яркости, чтобы обеспечить просмотр с широкой цветовой гаммой. Однако, он может выглядеть более серым, чем вы ожидаете, даже после калибровки хороших цветов в SDR. Я разобью их на следующие пункты: Потоковая трансляция игр.
Помимо того, что AMD положительно влияет на игровую производительность, прежде чем использовать искусственный интеллект или трассировку лучей, у AMD также есть собственный удивительно эффективный и простой в использовании набор для потоковой передачи. По сравнению с использованием OBS или его вариаций, когда у меня были 5600 XT и RX580, я обнаружил, что пакет потоковой передачи игр AMD был потрясающе функциональным и работал более плавно для потоков, которые я запускал, чем на моей предыдущей, надёжной GTX 760.
Драйверы, которые AMD и Nvidia пишут для своих чипов, фактически являются конвертерами: преобразуют процедуры, поступающие от API, в последовательность операций, понятную их графическим процессорам. Дальнейшее управление находится под контролем аппаратного обеспечения: определение приоритета команд, их адресация соответствующему узлу чипа, и так далее. Эта первичная обработка команд осуществляется набором модулей, резонно размещаемым в центре чипа. В RDNA 2 графические и вычислительные шейдеры маршрутизируются через отдельные конвейеры, которые контролируют последовательность отправляемых команд остальной части чипа. Nvidia же просто использует одно имя для описания всего набора таких блоков управления — движок GigaThread Engine.
В Ampere он выполняет ту же задачу, что и RDNA 2, хотя Nvidia не слишком много информирует нас о подробностях работы этого модуля. В целом, эти командные процессоры работают как диспетчеры или как руководители производства на заводе. Производительность GPU определяется их многозадачностью, поэтому следующий уровень организации — дублирование блоков на чипе. Если придерживаться аналогии с заводом, это будет похоже на бизнес, в котором есть центральный офис и несколько производственных площадей. Причина такой организации проста: блоки обработки команд просто не могут эффективно выполнять всё сразу. Поэтому резонно распределить задачи между разными блоками. Каждый отдельный блок может выполнять что-то совершенно независимое от других — например, один может заниматься обработкой множества графических шейдеров, в то время как другие обрабатывают длинные сложные вычислительные шейдеры.
В случае RDNA 2, каждый SE содержит свой собственный набор фиксированных функциональных модулей: схем, которые обычно не регулируются программно и предназначенны для выполнения одной конкретной задачи. Модуль Primitive Setup модуль настройки примитивов — подготавливает вертексы к растеризации, а также генерирует дополнительные тесселяция и удаляет лишние Растеризатор — преобразует трехмерный мир треугольников в двухмерную пиксельную сетку Выводы рендеринга модули ROP — считывают, записывают и смешивают пиксели Модуль настройки примитивов обрабатывает 1 треугольник за такт. Может показаться, что это немного, но не забывайте, что эти чипы работают на частотах от 1,8 до 2,2 ГГц, так что настройка примитивов вряд ли может стать причиной боттлнека в GPU. В Ampere блок примитивов находится на следующем уровне организации, и мы скоро к нему подойдём. Ни AMD, ни Nvidia не дают подробной информации о своих растеризаторах. Последние называют их Raster Engines растровый движок , и мы лишь знаем, что они обрабатывают 1 треугольник за такт и генерируют сколько-то пикселей, но нет никакой дополнительной информации, такой как их субпиксельная точность, например. Может показаться, что AMD имеет преимущество, ведь большее количество ROP означает, что за такт может обрабатываться больше пикселей.
Однако такие модули нуждаются в хорошем доступе к кэшу и локальной памяти, и ниже мы затронем эту тему. А сам кластер TPC содержит в себе нечто под названием Polymorph Engine — по сути, те же модули настройки примитивов Ampere. Таким образом, если GA102 дать ту же тактовую частоту, то он должен иметь заметное преимущество, поскольку весь чип содержит 42 модуля настройки примитивов, в то время как у нового RDNA 2 от AMD их всего 4. Но поскольку на один Raster Engine приходится по шесть TPC, получается, что GA102 фактически имеет 7 полных модулей примитивов против 4 аналогичных у Navi 21. Это довольно широкопрофильные «цеха», поскольку они содержат все программируемые блоки, используемые для обработки графики, вычислений, а теперь ещё и шейдеров рейтрейсинга. Как вы можете видеть на изображении выше, каждый из них занимает очень небольшую часть площади кристалла, но они чрезвычайно сложны и непосредственно влияют на общую производительность чипа. До сих пор принципиальной разницы между двумя GPU мы не наблюдали.
Пока речь шла об общей компоновке и организации элементов на чипе, серьезных разногласий не было — номенклатура и терминология элементов разнятся, но их функции во многом схожи. И поскольку по большей части эти функции ограничены их программируемостью и гибкостью, то любые сравнения одного GPU с другим сводятся по сути просто к оценкам масштаба. То есть к тому, какой из них имеет больше какой-то конкретной вещи. В чём-то у них много общего, но есть множество моментов, где их пути существенно расходятся. Если Turing привнёс довольно кардинальные изменения по сравнению со своим десктопным предшественником Pascal вместо блоков и регистров FP64, получив тензорные ядра и трассировку лучей , то Ampere выглядит довольно легким апгрейдом — по крайней мере, на первый взгляд. В Turing потоковые мультипроцессоры SM содержат четыре раздела иногда называемые блоками обработки — processing blocks , в каждом из которых находятся логические блоки 16x INT32 и 16x FP32. Эти схемы предназначены для выполнения очень специфических математических операций с 32-битными данными: блоки INT обрабатывают целые числа, а блоки FP работают со значениями с плавающей точкой, то есть десятичными числами.
Nvidia заявляет, что SM в Ampere имеет в общей сложности 128 ядер CUDA, что, строго говоря, неправда — либо же, если это действительно так, то и в Turing столько же. Блоки INT32 в Turing действительно могли обрабатывать значения с плавающей точкой, но только в очень небольшом количестве простых операций. В Ampere Nvidia ввела ряд поддерживаемых математических операций с плавающей точкой, чтобы обеспечить совместимую работу с другими блоками FP32. Это означает, что общее количество ядер CUDA на один SM в действительности не изменилось, просто половина из них теперь имеет больше возможностей. В Turing был возможен только второй вариант. Таким образом, новый GPU потенциально может удвоить производительность FP32 по сравнению с его предшественником. Для вычислительных рабочих нагрузок, особенно в профессиональных приложениях, это большой шаг вперед, но для игр польза от этого невелика.
Так почему же вся эта вычислительная мощность тратится зря? Ответ прост: нет, не зря, просто игры не всегда используют инструкции FP32. Эти вычисления обычно выполняются для определения адресов памяти, сравнения двух значений и диспетчеризации логических потоков. Так что для этих операций функция двойной скорости FP32 не работает, поскольку блоки с поддержкой двух типов данных могут работать либо только с целыми числами, либо только с плавающей точкой. SM-раздел переключится на эту функцию лишь в том случае, когда все 32 потока, обрабатываемые им в данный момент, имеют одну и ту же операцию FP32, выстроенную в очередь для обработки. Во всех остальных случаях разделы в Ampere работают так же, как и в Turing. Вот почему реальный прирост производительности в играх не столь значителен, как можно было бы предположить.
Какие есть ещё улучшения? На каждый SM-раздел теперь приходится меньше тензорных ядер, но каждое из них намного более функционально, чем в Turing. Эти схемы выполняют очень специфические вычисления например, умножают два значения FP16 и складывают ответ с другим числом FP16 , и теперь каждое ядро выполняет 32 таких операций за цикл. Кроме того, представлена новая функция под названием Fine-Grained Structured Sparsity «тонкоструктурированная разреженность» , и, если не вдаваться в подробности, то по сути это означает, что математическая скорость может быть удвоена путем удаления данных, не влияющих на ответ. Опять же, это хорошая новость для профессионалов, работающих с нейронными сетями и искусственным интеллектом, но для разработчиков игр это не особо погоду меняет. RT-ядра также были доработаны: теперь они могут работать независимо от ядер CUDA, поэтому, пока они работают с алгоритмом BVH или вычисляют пересечения лучей и примитивов, остальная часть SM может продолжать обрабатывать какие-то шейдеры.
Сотрудник AMD сравнил цены на видеокарты его кампании и Nvidia
Даже в новом поколении графических ускорителей инженеры «красных» не решили эту проблему. Так что технология трассировки лучей очень плохо работает на видеокартах AMD. Оно увеличивает частоту кадров в играх без ухудшения качества картинки. Повышение производительности возможно потому, что DLSS — это не только сглаживание, но еще и алгоритм по масштабированию изображения. Предположим, вы играете на мониторе с разрешением 1440p 2К. При этом нейросеть будет дорисовывать пиксели до разрешения вашего монитора. Это позволяет повысить FPS без ухудшения картинки. Сглаживание DLSS оказалось очень удачным, и сегодня его можно встретить в графических настройках почти любой игры.
Оно особенно помогает владельцам 4К мониторов, так как даже современные видеокарты с трудом вытягивают разрешение Ultra HD. Она называется инпут лаг или задержка ввода. Чем ниже ее значение, тем отзывчивее геймплей. Вам легче целится, стрелять и замечать врагов в соревновательных играх. Чтобы снизить задержку ввода, геймеры проводят качественный интернет, покупают девайсы с низким временем отклика и устанавливают в свои системные блоки мощные комплектующие. Ведь чем больше FPS, тем меньше инпут лаг. При ее включении инпут лаг снижался на десятки миллисекунд.
Появился прогноз на 2024 год касательно рынка ускорителей для ИИ Nvidia пока будет безраздельно доминировать Компания Nvidia безусловно является лидером на рынке ускорителей для ИИ. Но каких-то точных данных о её доле в Сети пока найти сложно. Теперь вот появились прогнозы, касающиеся итогов текущего года, которые позволяют понять распределение сил на рынке. Итак, Nvidia, согласно этим прогнозам, за год заработает около 40 млрд долларов от продаж ускорителей для ИИ.
С процессорами все понятно — там все будет без изменений, особенно учитывая увеличение популярности сборок на Xeon. Нас больше волнует очередное наступление Intel на видеокарты. Производитель готовит огромную линейку карточек от флагманских монстров до бюджетных встроек. О картах Arc почти нет информации , кроме того, что Intel готовит альтернативу для практически каждой популярной карты и технологии.
Предполагается, что в семействе окажется 7 моделей: три бюджетные A310, A350 и A380, промежуточная A580, стандартная A770, улучшенная A770 и флагманская A780. Удар в спину от Китая Оказывается, китайские магазины торгуют не только сомнительными сборками из бывших в употреблении материнок и процессоров. Недавно китайские производители представили новые видеокарты собственного производства! Карты основаны на графическом профессоре Fantasy One от Innosilicon.
Учитывая проблемы с поставками и желание властей Китая наладить собственное производство полупроводников, вполне возможно, что к 2030 году графики в Steam получат новый цвет и четвертого конкурента за ПК пользователей. Или нет — производители новых карточек поднялись за счет ASIC-оборудования, и, вероятно, ориентируются на майнеров. Впрочем, к лету 2022 года у нас есть две альтернативы: беседовать на кухнях о флагманских картах или копить на GTX 1660 и набор с AliExpress под нее. И в Беларусь тоже....
Более того, единственный чипсет на данный момент, поддерживающий PCIe 4. Так что пока нет смысла гнаться за PCIe 4. Разгон видеокарты даст существенный прирост производительности К сожалению, прошли те славные времена, когда видеокарты гнались так, что зачастую достигали уровня производительности более старшей модели в линейке. Так что можно смело говорить, что разгон видеокарт умер. За приростом в пару процентов просто нет смысла гнаться, и единственное, что даст вам монструозное водяное охлаждение GPU, так это низкие температуры и не более того. Что Nvidia, что AMD наловчились выбирать почти весь частотный потенциал на заводе: с одной стороны, это на руку обычным пользователям, но с другой слегка грустно, что эра оверклокеров клонится к закату. Производительность мобильных и десктопных видеокарт с одинаковым названием сравнима Начиная с видеокарт Pascal, они же GTX 1000, Nvidia использует одинаковые названия для мобильных и десктопных GPU.
Поэтому кажется, что RTX 2080 в тонком ноутбуке и в громоздком ПК — это одно и тоже, и невольно удивляешься тому, насколько продвинулся прогресс. Однако на деле физику не обманешь: видеокарта, для охлаждения которой в ПК используется пара вентиляторов и пяток тепловых трубок, уж точно не сможет работать на тех же частотах в ноутбуке с толщиной меньше 2 см. Насколько же будет ниже производительность? Ответ может шокировать — до 2 раз. Как итог, реальный ее уровень производительности в играх может быть лишь около десктопной GTX 1660 Ti. А с учетом того, что никто не заставляет производителей ноутбуков писать, что в их решении стоит урезанная Max-Q версия, без тестов абсолютно непонятно, на что реально способен каждый из игровых лэптопов.
Digital Foundry похвалили AMD FidelityFX. Это аналог DLSS от NVIDIA
крупнейший информационный сайт России посвященный компьютерам, мобильным устройствам, компьютерным играм. Согласно сообщениям, MSI полностью отказалась от производства пользовательских видеокарт AMD Radeon, и компания подтвердила это решение сайту HardwareLuxx. После почти десятилетия довольно значительных проблем с качеством кодер AMD AMF получил обновление, которое кардинально изменило качество изображения благодаря B-фреймам в AMF 1.4.24. Согласно сообщениям, MSI полностью отказалась от производства пользовательских видеокарт AMD Radeon, и компания подтвердила это решение сайту HardwareLuxx.
Сравнение лучших видеокарт в 2024 году
Непрекращающаяся битва между AMD и Nvidia продолжается уже несколько десятилетий на аппаратном уровне. Обзор видеокарт от NVIDIA и AMD: сравнение, характеристики, рейтинг на основе отзывов покупателей. Разумеется, в 2020 году что AMD, что Nvidia активно тестируют драйвера перед релизом, однако, как это обычно бывает, ошибки встречаются у всех.