Blog Personal.

Ampere, Especulación, GeForce, Nvidia

Especulación: GeForce Ampere… ¡Again!

He decidido esperar unos días para comentar las nuevas filtraciones acerca de la gama GeForce Ampere de los últimos días para no iros mareando continuamente con dicha información, especialmente porque ya he hecho una cantidad enorme de entradas sobre estas y al final me vais a decir eso de que soy muy pesado.

Lo primero es el hecho que toda la gama GA10x va a ser fabricada por Samsung en su proceso de 8nm, el cual es un derivado de su proceso de 10nm.

Antes de que la gente se escandalice por eso, hemos de tener en cuenta que los nodos de fabricación en su nomenclatura son puro marketing ya que el tamaño del transistor no es el dicho por el nodo y por otro lado no siempre se utiliza toda la densidad del nodo y aquí tenemos que hablar de algo importante para que la gente se coloque en situación. Nvidia para la A100 presentada hace unas semanas decidió utilizar el nodo de 7nm de TSMC en su versión de alto rendimiento que tiene una densidad menor que el de 7nm para bajo consumo, la cual tiene unos 54k millones de transistores en su interior y una densidad de 65.6 millones de transistores/mm2 pero hay que tener en cuenta que la SRAM tiene una densidad mucho mayor que la lógica y que dicha GPU para computación de alto rendimiento tiene una friolera de… ¡40MB de Cache L2! Esto hace que la media de la densidad aumente en el caso del chip A100.

¿Entonces como es que Nvidia no escoge a TSMC y se ha ido con Samsung? Basicamente porque Samsung ha conseguido atraer a empresas como Qualcomm y Nvidia prometiendo el coste de las obleas mucho más bajo. Pero claro, son 8nm vs 7nm… ¿Cierto? Pues bien, el chip más avanzado que conocemos por parte de la competencia (AMD) es el SoC de la Xbox Series X con unos 360mm2, 15.3K millones de transistores y una densidad por tanto de 42,5 millones de transistores/mm2… ¡Y eso bajo el mismo proceso que la A100! Es decir, AMD que es la competencia tiene margen para mejorar la densidad y no hemos de olvidar que RDNA/Navi 10 tiene una densidad de 41.5 millones, apenas ha aumentado.

La gracia es que el proceso de 8nm de Samsung puede dar el mismo nivel de densidad que tiene AMD en sus productos pero por un coste por oblea mucho más bajo que el de TSMC por lo que esto para Nvidia significan precios más bajos o en su defecto unos márgenes más altos que es lo que necesita Nvidia para competir en una guerra de precios, en un océano rojo contra AMD.

En Turing con el Trazado de Rayos en exclusiva, Nvidia tuvo que escoger la diferenciación y no ir a por coste, pudo hacerlo por una falta de competencia directa por parte de AMD, pero son conscientes que con RDNA2 las cosas son distintas por lo que tienen que ir a precio. Si nos vamos a la actual gama Turing veremos que su densidad media de toda la gama es de 25 millones de transistores/mm2 pero con el nodo de 8nm de Samsung se pueden colocar a una cifra similar que la de AMD en lo que densidad se refiere. Dicho de otra manera, Nvidia no puede sacar una GPU más cara que de casi la misma cantidad de fotogramas y justifique el sobreprecio.

Como curiosidad, el tope de gama de las GeForce Maxwell (El chip GM200) tenia una densidad de 8K millones de transistores, el de las GeForce Pascal (El chjp GP102) tenía una densidad de 12k millones de transistores, el de las GeForce Turing (TU102) de unos 18.6k millones de transistores. ¿Veis un patrón aquí? Cada nueva generación son unos 1.5x la cantidad de transistores en el tope de gama aproximadamente por lo que Ampere en su tope de gama de las GeForce (GA102) debería tener un total de 28k millones de transistores.

Unos 627mm2 de tamaño nos dan unos 44.6 millones de transistores/mm2 que esta en la orbita de la densidad de AMD en los 7nm de TSMC. Podemos suponer que la gama entera va a tener dicha densidad ya que lo mismo ocurrió con Turing y que es muy posible que esta sea algo más barata que Turing.

Ahora bien, hay una cosa que aclarar sobre las nomenclaturas. Nvidia no ha dicho todavía cual es la nomenclatura entera de toda la gama, personalmente pienso que Kopite no conoce cuales son los nombres comerciales definitivos y ha hecho una lista colocando los nombres que a él le parecen que tienen más lógica pero no tienen porque ser los definitivos.

Lo que hace tiempo que hace que mi cabeza de vueltas y este completamente…

… no es otra cosa que la configuración de la RTX 3080 que todo el mundo insiste en que es el mismo GA102 de la RTX 3090/RTX 3080 Ti pero con una configuración menor y un bus de 320 bits. ¿De verdad que me tengo que creer semejante recorte cuando para Nvidia le sale más a cuenta sacar un chip intermedio entre la GA104 y la GA102?

Os lo explico, la GA102 seguramente tendrá 6 GPC para un total de 84 SM, esto hacen un total de 14 SM por GPC o 7 TPC por GPC. Si las especificaciones de la GA102-200 son ciertas no solo es dejar inactiva unos 64 bits de la interfaz con la GDDR6 sino también todo un GPC entero así como sus conexiones con la Cache L2. No digo que no sea posible pero… ¿No hubiese sido mejor otro chip? Obviamente Nvidia puede desactivar 1/6 del chip para la RTX 3080, en todo caso no creo que Nvidia utilice el nombre de RTX 3090, sobretodo desde que se filtro recientemente una tarjeta de ASUS con la serigrafía de RTX 3080 Ti.

Pero nos queda hablar de lo que son los dos modelos en la parte baja de la gama, rl RTX 3070 Ti y el RTX 3070.

Lo primero que llama la atención es que el número de unidades CUDA la RTX 3070 Ti tenga la misma cifra que la RTX 2080 y por tanto 48 SM, claro esta que tenemos que esperarnos una mayor velocidad de reloj y el añadido del Tensor Cores de tercera generación en las unidades SM. Si Nvidia hiciese un tick-tock sin cambios a la TU104 (GeForce RTX 2080) utilizando la misma densidad que hemos comentado antes de 44.6K millones de transistores y supuestamente utiliza para RDNA 2 entonces la densidad de esta pasaría de los 545mm2 a los 293mm2 por lo que paradójicamente colocaría esa TU104 en un tamaño incluso por debajo de la de la GP104 de la ya mitica GeForce 1080. Pero obviamente sabemos que van a haber cambios pero al mismo tiempo esto significan que obviamente el chip estará >300mm2 .

Lo otro es el tema de la velocidad de reloj, no me voy a meter a especular pero un problema que tiene Turing es el hecho que se ve limitada por el ancho de banda de la GDDR6. ¿Cómo lo sabemos esto? Pues por el hecho que aumentando el ancho de banda sin cambiar las velocidades de los chips aumenta el rendimiento de estos, por eso es una tontería pensar que mientras se utilice la GDDR6 a velocidades estándar subir la velocidad de la GPU servirá para algo, de ahí a que Nvidia haya optado por un tipo de GDDR6 más avanzada, que no sigue un estandar de la JEDEC pero cuyo fabricante es Samsung.

Sabemos que Samsung tiene una versión de hasta 22Gbps de su GDDR6, a la que seguramente llamarán GDDR6X para diferenciarla del estándar y que Nvidia colocará en su gama alta, mientras que la gama media ira con GDDR6. Tened en cuenta que cuanto más rápido en velocidad de reloj es un chip menos unidades hay y por tanto tiene sentido que la GDDR6X vaya a parar a la gama alta mientras que la gama media-baja se tenga que conformar con al GDDR6 estándar, y creedme que la velocidad de la la memoria va a hacer que en los benchmarks se note la diferencia entre la RTX 3070 Ti y la RTX 3070.

¿Mi opinión personal? No creo que los tres chips tope de gama sean más baratos que los 3 chips tope de gama de Turing o al menos no creo que inicialmente Nvidia los haya planteado para hacerlos más baratos sino para poder bajar el precio de estos rapidamente si AMD les come el mercado en lo que a calidad/precio se refiere y creo que es algo que se esperan pero van a intentar adelantar el lanzamiento en la gama alta con 3 tarjetas como ocurrió con Turing.

El caso es que el uso de un nodo más barato se puede ver descompensado por el uso de una GDDR6X mucho más cara que haga que la GPU de Nvidia sea igual o incluso más cara que su equivalente de AMD en cada gama. Pero si la estrategia de utilizar RAM a mucho mayor ancho de banda funciona y Nvidia se queda la exclusiva de la GDDR6X entonces habrán hecho un excelente movimiento en la gama alta que se perdería en la gama media por el uso de la GDDR6 pero a cambio la gama media ganaría algo con el rendimiento de una RTX 2080 Super en forma de una posible RTX 3070.. ¿a 499?

Esto es todo, tenéis los comentarios de esta misma entrada para comentar y no olvideis que tenemos Discord.

5 1 vote
Article Rating
2 Comments
Oldest
Newest Most Voted
Inline Feedbacks
View all comments
Juan

Gracias x la entrada Urian! Estoy con muchas ganas de jubilar mi GTX 1080, y quiero algo q mueva raytracing, pero q no se me dispare mucho el consumo, mi monitor soporta G-Sync y me interesa alguna de las futuras serie 30XX, más q nada x el monitor y la frequencia en la nvidia optimiza y saca drivers, pero la verdad es q poco o casi nada se conoce de RDNA2 (bueno, nvidia son puras suposiciones) viendo lo anterior expuesto tendría sentido a esperar a tener ambos exponentes en la calle para ver cuánto se ajustan los precios del equipo… Read more »

Set

No entendí bien el tema de densidad, no se si me equivoco:

Pero si la la xbox tiene 41 millones de transistores en 360mm2 y Ampere 41millones en 600mm2.

Esta claro que los 7nm son superiores en densidad a los 8nm de Samsung y no iguales, o eso entiendo yo.

Last edited 26 days ago by Set