Обзоры
Обзор MSI Radeon RX 5700 XT Evoke -Архитектура: Navi и RDNA
16.08.2019 в 03:43
Stilet
184

Архитектура: Navi и RDNA

 Мы слышали прозвище «Navi» уже много лет, и AMD бросила в нас еще один Computex, «RDNA», так что давайте сначала проясним. «Navi» — это кодовое имя семейства кремния, на котором основан графический процессор. RDNA — это новая архитектура, представленная AMD для замены Graphics Core Next (GCN). Он предписывает иерархию компонентов GPU и, что более важно, его основной механизм обработки чисел, вычислительные блоки.

Другим примером этого различия будет «»Vega»». Vega 10, Vega 20 и Vega 12 представляют собой кусочки кремния из одного семейства, а графический процессор соответствует архитектуре Graphics Core Next 5-го поколения, которая управляет даже его вычислительными устройствами. В течение многих лет AMD производила постепенные обновления GCN, но на этот раз заявляет, что RDNA достаточно отличается от GCN, чтобы не считаться новой версией, а скорее новым аппаратным компонентом, который приносит с собой значительные преимущества IPC по сравнению с предыдущим поколением.

Серия Radeon RX 5700 построена вокруг «Navi 10», элегантного маленького кусочка кремния, созданного по 7 нм процессу в TSMC с 10,3 миллиардами транзисторов, втиснутых в кристалл размером всего 251 мм². Чип имеет интерфейс шины PCI-Express 4.0 x16 и интерфейс памяти GDDR6 шириной 256 бит. Infinity Fabric, дебютировавшая на процессорах AMD Ryzen, широко используется в качестве встроенного межсоединения, связывающего различные основные компоненты.

Основная часть усилий AMD по разработке RDNA заключалась в увеличении количества выделенных ресурсов во избежание истощения благодаря меньшему количеству компонентов, ожидающих доступа к ресурсу. Кремний Navi 10 имеет два шейдерных движка, совместно использующих центральный командный процессор, который распределяет рабочие нагрузки, Geometry Processor и ACE (асинхронные вычислительные машины).

Каждый шейдерный движок делится на два графических движка. Графический движок разделяет рендеринг, Rasterizer и Prim Unit среди пяти процессоров рабочих групп. Вот где начинается ядро ​​RDNA. AMD полагала, что может объединить два вычислительных блока (CU) для совместного использования планировщиков, скалярных модулей, обмена данными, кэшей инструкций и данных, а также TMU. Процессор рабочей группы, или «модуль с двумя вычислениями», как показано на блок-схеме архитектуры, для всех целей и задач неделим, поскольку отдельные CU не могут быть отключены.

Вычислительный блок RDNA объединяет 64 потоковых процессора для векторных операций и удваивает количество скалярных модулей для локализованной последовательной обработки. Потоковые процессоры в CU разделены на две группы, каждая из которых оснащена скалярным модулем. По словам AMD, это значительно снижает задержки и улучшает общий IPC вычислительного блока. Это также более эффективно использует локальные кэши.

Векторные исполнительные блоки или потоковые процессоры — это то место, где происходит большая часть параллельной обработки GPU. Из-за перепроектированного вычислительного блока два скалярных процессора извлекают два векторных модуля SIMD32, состоящих из 32 потоковых процессоров каждый, вместо одного скалярного процессора, тянущего четыре векторных модуля SIMD16. Как это важно? В GCN, как размещены блоки SIMD, все элементы в операции Wave64 выполняют работу один раз каждые четыре такта из-за аппаратного перемежения. С помощью RDNA рабочие элементы Wave32 могут выполнять работу каждый тактовый цикл. В целом, RDNA минимизирует потерянные тактовые циклы за счет более эффективного и равномерного использования аппаратных ресурсов.

AMD проверила предыдущие поколения своей графической архитектуры, чтобы найти узкие места в графическом конвейере. Помимо увеличения количества выделенных ресурсов, компания переработала иерархию кэша чипа, упрощая передачу данных на различных этапах. Каждый процессор рабочей группы имеет выделенные 32 КБ инструкций и 16 КБ кэшей данных, которые записывают обратно в 128 КБ L1-кэш, выделенный для каждого графического ядра.

Эти кэши L1 взаимодействуют с 4 МБ кэша L2. Введение кэш-памяти L1 и удвоение пропускной способности между различными кэшами вносит большой вклад в IPC, поскольку он минимизирует доступ к памяти, который намного медленнее, чем доступ к кэшу. AMD также использует более быструю (более низкую задержку) SRAM, которая уменьшает задержки кэш-памяти примерно на 20 процентов на кристалле и на 8 процентов на уровне памяти. AMD также представила новые функции для ACE, которые включают асинхронное вычисление туннелирования.

AMD суммирует преимущества RDNA в 25-процентном усилении IPC по сравнению с последней версией GCN и эффективном 50-процентном выигрыше производительности для GPU с учетом IPC, 7-нм процесса и преимуществ от управления частотой и энергопотреблением.

В другом месте на кремнии AMD обновила Display Engine и Multimedia Engine, чтобы соответствовать последним стандартам отображения и видео. Механизм отображения теперь поддерживает DSC 1.2a (сжатие потока отображения) наряду со стандартами вывода HDMI 2.0 и HDR DisplayPort 1.4 для поддержки форматов отображения с такой интенсивной полосой пропускания, как 4K 240 Гц или 8K 60 Гц по одному кабелю, и поддержкой 30 бит. Мультимедийный движок поддерживает декодирование VP9 и H.265 с частотой до 8K 24 Гц или 4K 90 Гц, а также аппаратное кодирование H.265 с частотой до 4K 60 Гц.

Особенности: FidelityFX и Anti-Lag

 С каждой новой графической архитектурой геймеры ожидают новых возможностей улучшения качества изображения. NVIDIA представила DLSS, и AMD отреагировала на это FidelityFX, комбинацией улучшений качества, специфичных для контента и изображений. Первая часть этого — контрастно-адаптивная резкость, которая выявляет детали в сцене, усиливая их контраст. Для лучшей работы требуется, чтобы разработчики игр объявляли, какие части изображения должны быть обострены (например, HUD и тексты на экране). Такие детали, как линии износа на гладких шинах гоночного автомобиля или шестиугольные узоры на стене, оживают. Мы протестируем эту функцию позже в отдельной статье
   
AMD хочет улучшить свое признание профессиональными геймерами в киберспорте, решив проблему с современной высокопроизводительной графикой: отставание мыши. Это будет количество времени, необходимое для регистрации клика, и ответа, который будет обработан графическим процессором. Radeon Anti-Lag — это улучшение CTR (click-to-response), которое сократило отставание мыши примерно на треть среди различных популярных киберспортивных игр. Этот параметр фактически идентичен «предварительно отрендеренным» кадрам на NVIDIA. Современные графические процессоры рассчитывают один или два кадра впереди, поэтому они могут лучше посылать их на монитор, чтобы избежать заикания. Конечно, это приводит к задержке ввода, потому что любая входящая информация поступает на экран только через один или два кадра.

Читаем далее…

Яндекс.Метрика