Blog Personal.

Ampere, Especulación, GeForce, Nvidia

RTX 3080, Las multiples GA102 y GDDR6X.

Hace poco se han filtrado fotos de una muestra de ingenieria (Engineering Sample aka ES) de lo que sería la RTX 3080.

Al mismo tiempo, la gente ha rescatado las especificaciones que dio Kopite7Kimi por el hecho que la acertó con el chip A100 esclusivo para computación de alto rendimiento que Nvidia presento hace unas semanas y las especificaciones que da son ciertamente…

El motivo de ello es que nombra como «GA102» unos dos chips distintos y de diferentes configuraciones dentro de la gama, a uno de ellos le da el nombre de GA102-300 y GA102-400 y al otro le da el nombre de GA102-400. Lo cual es un sinsentido, además, que el segundo número marca una versión más avanzada del mismo chip.

Unos 10GB de VRAM nos marcan un bus de 320 bits y por tanto unos 10 chips en total, me chirría que no sean 20GB ahora que el coste de los chips de 2GB va a bajar en picado pero bueno, el hecho de que sean 320 bits nos indica el hecho de que Nvidia habría decidido hacer un cambio respecto a Turing donde tanto la TU104 como la TU106 tenían una interfaz de 256 bits mientras que la TU102 una de 384 bits, aquí lo más lógico sería pensar que:

  • Reemplazo de la TU102: Bus de 384 bits.
  • Reemplazo de la TU104: Bus de 320 bits.
  • Reemplazo de la TU106: Bus de 256 bits.

Luego tenemos la cantidad de GPCs, creo que lo que vamos a ver es lo siguiente:

  • Reemplazo de la TU102: 6 GPC
  • Reemplazo de la TU104: 5 GPC
  • Reemplazo de la TU106: 4 GPC

Si cogemos la TU104 de la RTX 2080 y le añadimos un GPC pasamos de una GPU de 48SM a una de 60SM sin cambios, lugo por el salto generacional hacemos lo mismo que hizo Nvidia con el salto de la serie 9×0 a la seria 10×0 en su día, añadimos un TPC adicional por GPC, esto son 5 TPC más y como cada TPC incluye 2 SM ahora pasamos a tener unos 70 SM, cercano a los 72 SM de la TU102 pero lo que nos importa son esos 4532 núcleos CUDA que haciendo la simple división por 64 son unos 68 SM, por lo que podemos deducir que el reemplazo de la RTX 2080 (la RTX 3080) tiene 2 unidades SM inactivas.

¿Y que hay de la memoria? Bueno, comercialmente y en masa ahora se encuentra disponible la GDDR6 a 16Gbps, por lo que esa será la velocidad de reloj que podemos esperar de la RTX 3080. ¿Y que significan a nivel comercial estas configuraciones? Nvidia va a lanzar este chip al mismo precio que la RTX 2080, el salto de una a la otra es remarcable y no creo que veamos una RTX 3080 a $500 porque eso será trabajo de la RTX 3070 más bien e incluso esa será más cara, es decir, Nvidia mantendrá la estructura de precios que cuando lanzo Turing.

Esta RTX 3080 iría en contra de como llame AMD a «Big Navi» en cuanto al mercado, no se cual de ellas va a ser más potente, pero si utilizamos un poco la cabeza tiene sentido que reemplacen la RTX 2080 de 48 SM por algo como la RTX 3080 con 68 SM por el hecho de que esto sería para AMD un camino de rosas. En realidad los rumores apuntan que para la generación que se viene que RDNA 2 es mejor que Ampere y si, ya se como se van a poner los fanboys de Nvidia…

Pero de tanto en cuando ocurre que el otro lado acaba sacando una generación de productos mejor. ¿Que se le va a hacer? La vida es así y el mercado de las gráficas también es así. Es por ello que Nvidia anda desesperada entre bambalinas hablando con los desarrollaodres para que adopten el DLSS 2.0 que le da la vuelta a la tortilla, pero el DLSS 2.0 es la trampa de renderizar a menos resolución para luego reescalar via IA. En el fondo es hacer trampas pero es una trampa aceptable y Nvidia hará mucha presión para que el DLSS 2.0 salga en los benchmarks.

Pe… pero Urian… ¿Que es eso de la memoria GDDR6X?

Pues es algo que si seguimos los estandares de la JEDEC no existe, aunque se sabe que la GDDR6 puede alcanzar velocidades de hasta 22Gbps en laboratorio, supuestamente Samsung hablo de ello durante al año pasado durante su TechDay donde hablan de memoria GDDR6 de hasta unos 22Gbps, por lo visto utilizando el mismo proceso de fabricación que sus DDR4 fabricados a 10nm, por lo que esa GDDR6X no sería más que una GDDR6 distinta, posiblemente algo sacado de la manga de Samsung con la capacidad de alcanzar mayores velocidades con el mismo consumo energético, dicha memoria sería una variación propietaria fuera del estandar GDDR6 de la JEDEC que Samsung a falta de la existencia de una GDDR6X como estandar de la JEDEC.

Al igual que con los microprocesadores, la cantidad de chips buenos disminuye con la velocidad de reloj y esto aumenta los costes por chip. La GDDR6 estandar puede llegar a los 18Gbps pero la cantidad de chips que lo hacían en la primera generación era tan bajo que no salieron a catalogo. Deberiamos ver alguna tarjeta con RAM a 18Gbps en los proximos meses pero dudo mucho que veamos una a 20Gbps y aún menos a 22Gbps. Lo que creo es que veremos memorias a 16Gbps>18Gbps haciendo underclock a los de 18Gbps, truco que ya ha hecho Nvidia con la gama Super de las RTX 20×0.

Si nos vamos al GA102 veremos que la RTX Titan Ampere va a tener la configuración completa. Creo que será por su baja disponibilidad la que lleve la GDDR6X a 21Gbps y tendra la configuración completa.

¿Y que hay del tercer chip?

Bueno, debido a que históricamente todos los chips con un bus de 256 bits han sido los x104 de las gamas vamos a suponer que el tercer chip de la lista tiene un bus de 256 bits y lo vamos a llamar GA104 pese a reemplazar en la gama a la TU106. Este chip va a competir de tu a tu contra el modelo de 56 CUs de AMD si se confirman los rumores por lo que aplicarle la regla de tres al TU106 para que tenga 48 SM me parece insuficiente, pienso que lo que veremos será eso aplicado a la TU104 que tiene 48 SM por lo que pasar a tener 56 SM de configuración máxima del chip y si aplicamos la misma regla de quitar 2 SM de la RTX 3080 y la RTX 3090/RTX 3080 Ti entonces tendremos una configuración de 54 SM.

Al final la gama inicial de la gama GeForce Ampere podría quedar de la siguiente manera:

Graphics CardGPU Codename#1GPU Codename#2SMCUDA CoresMemoryBW per bitConfiguration
RTX TitanGA102GA102-400845376GDDR6X21Gbps384 bits
RTX 3090/RTX 3080 TiGA102GA102-300825248GDDR6X21Gbps384 bits
RTX 3080¿GA103?GA102-200684352GDDR616Gbps>18Gbps320 bits
RTX 3070¿GA104?GA102-100543456GDDR616Gbps>18Gbps256 bits

Esto es todo, tenéis los comentarios de esta misma entrada para comentar y no olvideis que tenemos Discord.

5 1 vote
Article Rating
1 Comment
Oldest
Newest Most Voted
Inline Feedbacks
View all comments
Juan

Gracias x la entrada Urian! Todas estas son muy interesantes! Y me permito especular un poco también, si todo se basa en un GA-102 con varias versiones debido a los recortes, no podría ser q no sólo se aumenten los GPC, sinó también su ancho de banda al añadir un controlador más con respecto a lo q fué Turing? No tiene sentido ya q el chip dispone de ellos utilizarlos para mejorar aun más el rendimiento e ir de los 384 a los 352 y finalmente a los 320 con la 3080 y dejar los 256 para una 3070. Yo… Read more »