Blog Personal.

AMD, Especulación, Futuro, Radeon

Especulación: Navi 21, Nvidia Killer.

Por lo visto la llamada «Big Navi» o más conocida como Navi 21 se ha filtrado de mano del leaker rogame en un artículo que ha realizado para Hardware Leaks, sus especificaciones serian:

  • Hasta 80 Compute units.
  • Un chip que mide unos 505mm²
  • 50% mejor rendimiento por watt que RDNA 1.

Su tamaño y la cantidad de Compute Units nos da una idea acerca de lo que podemos esperar, se trata de una GPU que va a ir en rendimiento de tu a tu contra la TU102, aka GeForce RTX 2080 Ti pero que gracias al nodo de 7nm de TSMC va a tener un tamaño y por tanto un coste algo menor que el del TU104 de Nvidia que es el de las GeForce RTX 2080.

A partir de aquí todo va a ser especulación por mi parte.

Pero su configuración nos da algunas pistas, para empezar hemos de tener en cuenta que en las arquitecturas RDNA las Compute Units se organizan a través de la cantidad de particiones de Cache L1 y existe un ratio de 4 particiones de Cache L2 por cada partición de cache L1.

Por ejemplo Navi 10 tiene unas 16 particiones de Cache L2 y 4 particiones de Cache L1.

En cambio Navi 14 tiene 8 particiones de Cache L2 y unos 2 particiones de Cache L1,

Esto es debido a que entre la cache L1 y la cache L2 ha de existir siempre un ratio de 4:1 en cualquier chip de la arquitectura RDNA.

La idea es que la cantidad de WGP/Dual Compute Units en el sistema ha de ser directamente divisible por la cantidad de particiones de Cache L1 en el sistema. Tenemos dos posibilidades con Navi 21:

  • Una configuración GDDR6 de 384 bits como la que tiene la RTX 2080 Ti.
  • Una configuración HBM2 de 4096 bits como la de Radeon VII.

En el primer caso y extrapolando el ratió de la GDDR6 con las caches L2 y L1 de la RX 5700 y la RX 5600 entonces tendríamos una supuesta GPU con GDDR6 de 384 bits con 24 particiones de cache L2 y 6 de Cache L1. ¿El problema? 80 no es un múltiplo de 6 por lo que la opción más clara es la de una GPU con una configuración de memoria HBM2 de 4096 bits como la que tiene la casi inédita Radeon VII, la cual por cierto es la actual gama alta de AMD por lo que es posible que en cuanto a precio AMD la ponga en el mismo espacio, pero si he de ser realista creo que estamos ante una tarjeta de $800.

El otro motivo por el cual pienso que es una GPU con memoria HBM2 son los modelos para Apple, la cual prefiere utilizar memoria HBM2 para sus diseños.

Todo esto es lo que me hace pensar que estamos ante una GPU con memoria HBM2 en vez de GDDR6.

En cuanto al tamaño del chip (505mm2), la GPU mide casi exactamente el doble que Navi 10, hay que tener en cuenta que hay partes de la GPU que no aumentan con el tamaño como son las unidades especializadas en el Northtbridge de la propia GPU (unidad sDMA, codificador y descodificador de vídeo, controlador de pantalla) y tampoco aumenta el tamaño la parte correspondiente a los que son los Procesadores de Comandos (Gráfico y ACEs) por lo que de alguna manera el chip ha de justificar sus 505mm2 de tamaño.

La novedad más importante son las unidades de intersección para el trazado de rayos como bien sabemos por la confirmación de AMD sobre estas.

¿Pero cuanto ocuparían estas en el chip? Dichas unidades son muy parecidas por no decir clavadas a los RT Cores de Turing, los cuales tienen un tamaño de 0.7mm2 por TPC (el equivalente a una Dual Compute Unit en Nvidia) en a TU106 que tiene una densidad de 24.3 millones de transistores por mm2 . Suponiendo la misma densidad para RDNA 2 que para RDNA 1 (41 millones) esto serían unos 0.42mm2 para el hardware de intersección y tenemos unos 40 Dual Compute Units por lo que este serían unos unos 16.8mm2 en total que deberíamos sumar de manera adicional, pero tened en cuenta que esto es un supuesto basado en una aproximación y es posible que AMD haya mejorado la densidad en RDNA2.

Lo que creo es que AMD va a vender Big Navi como una GPU para Cloud Gaming principalmente, una de las cosas que AMD no ha comentado todavía de manera oficial es acerca de una tecnología nueva que tiene que ver con el streaming de contenido para el Cloud Gaming y que no tiene que ver con la velocidad de codificación y descodificación sino la forma en la que los datos son enviados a memoria para ser codificados y enviados a través de la red en forma de paquetes de video. Pues bien, no os voy a explicar como funciona porque nos haríamos todos un lió.

El caso es que dicha tecnología reduce la latencia de envió al codificador para el Cloud Gaming gracias a tomar un camino más corto, pero no me preguntéis tecnicamente como funciona porque es algo que solo he escuchado de oidas, nada más. El hecho de que la GPU se vaya a lanzar para el Cloud Gaming no significa para nada que no vaya a venderse como tarjeta gráfica dedicada para los PCs de gaming de toda la vida. Pero desde el año pasado que sabemos que existe una GPU bajo RDNA para el Cloud Gaming y tiene sentido que sea esta Navi 21 por lo que si Stadia no se va al garate podriamos ver un hardware Gen2 de Stadia basado en esta tarjeta, la cual aumentaría realmente el rendimiento del servició y podría dar por fin la capacidad de 4K nativo en el servició para muchos de los juegos de este.

Es más, y esto es algo que me saco de la chistera, creo que AMD va a incluir una interfaz Infinity Fabric para la comunicación directa de tu a tu con la GPU para reemplazar el PCI Express de cara al Cloud Gaming. El uso de esta interfaz no lo veremos en las tarjetas dedicadas de PC pero con ello AMD puede montar una solución integrada entre sus CPUs y GPUs al 100%. La idea sería utilizar el mismo mecanismo que permite comunicar varios AMD Epyc entre si pero para comunicar CPU y GPU.

Es el mismo concepto que el del NVLink de Nvidia pero con la ventaja en el caso del IF de tener una orden de magnitud menor en consumo que el PCI Express, algo que es muy importante en este tipo de sistemas. Obviamente he de aclarar que esta interfaz no se utilizaría pero estaría presente en la gama doméstica.

El siguiente punto es el rendimiento, es un 50% más eficiente por Watt que la RX 5700 XT que es una GPU que consume unos 225W y tiene una potencia de 9.75 TFLOPS, esto son unos 43.3 FLOPS/W por lo que una eficiencia del 50% serían unos 65 FLOPS/W, a partir de ahí podemos extrapolar dos versiones distintas de Navi 21.

Característica Navi 21 225WNavi 21 300W
TFLOPS FP3214,6119,49
TFLOPS FP1629,2338,97
TOPS Int858,4677,94
TOPS Int4116,91155,88
Compute Units8080
ALUs x CU6464
Clock Speed1427,121902,83
Texture Units320320
Gtexels456,68608,91
ROPS128128
GPixels182,67243,56

Es decir, Nvidia con esta GPU va a ir directamente de tu a tu contra la GeForce 2080 Ti y vendría a ser la rumoreada Nvidia Killer, pero la cosa no termina aquí, hace poco se filtraron las IDs de las tarjetas y tenemos 4 de ellas y por tanto 4 modelos de tarjeta.

La versión XTX sería solo para aquellas GPUs que alcanzaran la velocidad más alta y por tanto estarían limitadas en la distribución. Tanto el modelo XT como el XTX tendran la configuración completa, mientras que el XL tendía 2 Dual Compute Units (1 por Shader Engine) desactivadas por lo que tendría unos 76 CUs aparte d ser un poco más lenta. En cuanto al chip XE creo que va a salir con una configuración HBM2 de 3072 bits (1 pila HBM2 menos), una configuración de 72 CUs y esta si que estaría pensada para 225W de consumo.

Esto es todo, tenéis el Discord y los comentarios de esta entrada para comentarla.

0 0 vote
Article Rating
11 Comments
Oldest
Newest Most Voted
Inline Feedbacks
View all comments
Ger

No habías dicho en otra entrada que AMD llamaba internamente nvidia killer a la navi23?

Ger

Era en tu entrada del upstreaming de amd que decías lo siguiente…

«Los rumores hablan de Navi 23 pero lo van a hacer también con la actual Navi 14 pero ese es el motivo por el cual AMD llama internamente a Navi 23 como Nvidia Killer.»

Solo te lo preguntaba porque me creaba confusión pero aclarado. De todas formas me resulta curioso como va a remolque AMD con respecto a Nvidia, sacar casi 3 años más tarde gráficas para competir con la gama alta cuando la serie 3000 está a la vuelta de la esquina

Ger

Sin fallo, no hay problema 👍

Steven

Hola me la duda como las cu afecta el tipo de memoria a elegir gracias cor el tiempo

Set

En mi opinion viendo los movimientos de Ampere con Nvidia y su ultimo rumor de 375w para la 3080ti creo que Big Navi no viene a competir con las 2080ti dare algunos puntos por cual creo que sera competencia de Ampere. – Rumor mas reciente sitúava a un Sample de Big Navi 10% mas potente que una 2080ti, los samples sulen tener una muy baja frecuencia como los reciente de Ampere que rondaban los 1 ghz. – La Xbox series X con 52CU ronda un rendimiento superior a una 2080 acercandose a una 2080ti, segun el analisis de Gear of… Read more »

Daniel

Hola, supongo que ya te habrás enterado de que han soltado el código fuente del sistema operativo de 3ds.
Hay cosas curiosas como que hicieron algún prototipo con tecnología de nvidea, pero lo descartaron muy temprano

Lalala

De hecho él informó de ese prototipo con nvidia por su colega insider hace años, y dijo que nintendo les dio la patada por culpa de un directivo bocazas de nvidia que no había respetado el secreto y lo iba diciendo a la prensa o en público.

Juan

Gracias Urian x estas entradas q son muy interesantes y tus especulaciones son muy razonables! A lo q tengo miedo x parte de AMD es a los consumos y el calor q esto genera, aunq hay rumores de q NVIDIA serían iguales en este apartado, pero los 1eros irían a lo básico y x poder puro, en cambio los 2dos tienen su visión en optimizaciones y refinamiento. Me gustaría ver, aunq no se soporte en todos los juegos q pasaría si una RTX 3060 con su DLSS 2 o 3.0 esté a la par o con un rendimiento superior en… Read more »