Blog Personal.

Ampere, Especulación, Futuro, GeForce, Nvidia

Cositas varias sobre Nvidia.

Quienes hayáis estado al tanto estos días sabréis que la RTX 3090 hará uso de un conector de 12 pines por lo que su consumo energético será cuanto menos bastante alto.

Hace unos días y por falta de tiempo para informarme bien pensaba que el enorme consumo energético por parte de la gama alta de las RTX 30×0 era por el uso de memoria GDDR6X, la cual erróneamente entendí como GDDR6X con una subida de velocidad de reloj (y voltaje) que colocaba el consumo energético de la tarjeta por las nubes, pero la G6X no es una G6 subida de vueltas realmente y su consumo a igualdad de ancho e banda debería ser menor.

Entonces apareció otra explicación de la necesidad del consumo energético, no por mi parte sino en foros de tecnología y no es otra que esto era debido a que Nvidia había decidido tirar del nodo de «8nm» de Samsung en toda la gama, ya que esto es lo que decía el leaker Kopite7Kimi quien había filtrado correctamente las especificaciones del chip A100.

Pero el sitio web Videocardz dejo ir hace unos días que no, que el proceso son los 7nm de TSMC y por tanto una fundición diferente.

Y claro, la situación es bastante confusa en ese aspecto. El motivo de ello es que el alto consumo de la RTX 3090 se explicaba para muchos por la menor eficiencia energética del proceso de Samsung pero después de reflexionarlo mucho he llegado a la conclusión de que la gama RTX 30×0 basada en los chips GA10x no va a ser fabricada por Samsung sino por TSMC.

¿En que me baso? Si eres una empresa que diseña chips y no tiene fundición propia el hecho de firmar con una fundición a día de hoy te ata de pies y manos a esa fundición por «secretos industriales» referentes a esa fundición. Por lo que a día de hoy no vais a ver un solo chip siendo fabricado en dos fundiciones distintas, otra cosa son diferentes chips de diferentes gamas de una misma arquitectura o variaciones de la misma, Es decir, para evitar el «espionaje industrial» en el contrato el mismo equipo de diseño no puede diseñar el mismo chip para TSMC y Samsung sino que lo tienen que hacer equipos distintos y por tanto estaríamos hablando de diseños distintos.

Creo empezar a entender cual es el juego de Nvidia de cara a tener dos fundiciones y es posible que me equivoque al 100% pero he llegado a una conclusión concreta y es que al igual que en Turing vamos a tener dos gamas de GeForce en el mercado, solo que esta vez ambas van a ser RTX y por tanto tener soporte para trazado de rayos pero con una sutiles diferencias.

  • Los chips GA10x van a tener el set de caracteristicas completo: Tensor Cores (3.0), una enorme cantidad de Cache L2 incluidos y memoria G6X en algunos modelos.
  • Los chips GA11x van a tener el set reducido: No tendrán Tensor Cores (serán como las TU11x), la cantidad de cache L2 será menor y todos los modelos soportando memoria G6.

Y si, se muy bien lo que muchos estáis pensando pero por el momento en la API DX12 Ultimate y equivalentes la étapa de Denoising que se hace en los Tensors no es obligatoria, de ahí a que las RDNA2 de AMD carezcan de arrays sistolicos en las CUs (Tensor Cores) y creo que de nuevo va a ser un factor diferencial y ventaja de las RTX 30×0 sobre las ¿RTX 26×0? con tal de justificar un precio más alto de las primeras.

Y si, se que muchos de vosotros estaréis pensando…

Pero tened en cuenta que esto es una especulación, pero no me extrañaría ver una gama Sub-$300 en precio de venta basada en ese supuesto chip GA11x como reemplazo a las TU11x. No me atrevo a especular sobre las especificaciones técnicas de dicho modelo y no creo que lo veamos hasta 2021 realmente. y recordad, esto no es más que una especulación.

Volviendo al tema principal, nos encontramos con que la explicación al consumo energético podría no venir del nodo. ¿Entonces? Creo que el problema viene por el hecho que Ampere al igual que Turing tienen el problema de estar limitadas por ancho de banda con la memoria. Para Nvidia no le sirve de nada aumentar la velocidad de reloj si existe el efecto del Memory Wall con la memoria externa. Dicho efecto se produce cuando existe una disparidad de la evolución entre la velocidad de un procesador y la memoria que se encuentra fuera de este.

Es decir, es igual la velocidad de reloj en una GPU que puedas alcanzar con un nuevo nodo que si no tienes la memoria suficientemente rápida que lo acompañe entonces acabarás teniendo un problema de rendimientos decrecientes que por falta de ancho de banda cada nuevo ciclo de reloj por encima del anterior escalará menos y menos hasta que subir la velocidad de reloj no merezca la pena por lo que tienes que asegurarte tener una memoria con un ancho de banda que vaya acorde con la velocidad de reloj de tu diseño.

De ahí el uso de memoria GDDR6X ya que por mucho que el uso de un nuevo nodo permita una mayor velocidad de reloj en consecuencia la GDDR6 es un enorme cuello de botella para escalar en velocidad de reloj el diseño. ¿Pero de que nos suena todo esto? Es lo mismo que hicieron el lanzar las GeForce 10×0 con memoria GDDR5X, la velocidad de reloj de la GPU respecto a sus equivalentes de anterior generación aumento una barbaridad y Nvidia lo pudo hacer al acompañar el chip con la nueva GDDR5X para evitar el cuello de botella.

Por lo que la conclusión que saco es que la RTX 3090 tiene una velocidad de reloj muy alta y que a muchos nos va a sorprender ya que es el motivo real de su alto consumo energético. ¿La RTX 3080? Es una version recortada y os voy a dar un aviso: ¡Creo que la RTX 3080 va a ser mucho más cara que la RTX 2080 y RTX 2080 Super! Y os dire el motivo:

  • Si el chip es el mismo (GA102) entonces hemos pasado de un chip de 545mm2 a otro de 627mm2, sumadle que las obleas son más caras y tenéis un chip más caro que el TU104 de las RTX 2080 y RTX 2080 Super.
  • Memoria GDDR6X, más cara de producir en estos momentos que la GDDR6.
  • 10 chips de memoria en placa en vez de 8.
  • El hecho que utilice la misma placa que la RTX 3090 me hace pensar que Nvidia también la va a colocar a una alta velocidad.

¿Y que hay de la RTX 3070? Utiliza un chip distinto y no hace uso de la GDDR6X sino de la GDDR6, eso si, un poco más rápida (16Gbps en vez de 15.5 Gbps) pero no pienso que sea un aumento en velocidad muy grande. Es el chip con el que más dudas tengo porque no se como lo va a plantear Nvidia. Precisamente es donde realmente esta el mercado y donde existe la lucha comercial por la cuota de mercado, en esa gama de precio. Tengo muy claro por mi parte que vamos a ver las GA11x pero lo que no se es como será la GA104 y si seguira la estela de la GA102 o va a ser un traslado de las TU104 a un nodo más avanzado sin mejoras. Esto significaría que al contrario de la GA11x que he comentado antes tendría los Tensor Cores para el DLSS pero no se si serán los mismos que los de la GA102 o serán los de la TU104 portados tal cual por lo que hasta la presentación…

Es más, os dire una cosa. Dudo y no tengo problemas en errar de que la GA104 utilice memoria GDDR6 estándar, creo que aparecerá con la GDDR6X pero en una configuración de 256 bits. Creo que toda la gama GA10x utilizará GDDR6X y la eventual gama GA11x si se cumple utilizará memoria GDDR6 estándar.

¿En que me baso? El hecho de cambiar el tipo de memoria externa y con ello su controlador significa cambiar toda la jerarquía de memoria y el diseño interno al cambiar la estructura de comunicación del chip aunque la arquitectura general (organización y conexión de los componentes entre si) sea la misma. Por eso para Nvidia tiene sentido que la GA104 sea GDDR6X también, pero puede que como el 99% de las veces me acabe equivocando.

PD: Solo faltan 3 días, por lo que este es el último post comentando rumores.

Esto es todo, tenéis los comentarios de esta misma entrada para comentar y no olvideis que tenemos Discord.

4 4 votes
Article Rating
6 Comments
Oldest
Newest Most Voted
Inline Feedbacks
View all comments
Nitupensis

hoy se han visto filtradas algunas custom rtx3080 y 3090, usando 2 conectores de 8 pines (incluso 3 conectores de 8 pines en las versiones con oc mas extremo) de gainward y zotac, parece que el conector este de 12 pines se va a quedar solo para las Founders Edition. Que por otro lado me parece un acierto por parte de los partners descartarlo, total nvidia ya habia dicho que con sus graficas vendran con el adaptador para 8 pines, que es lo que la mayoria tendra que usar. y los partner habran optado por dejarse de lios para que… Read more »

Last edited 29 days ago by Nitupensis
Nitupensis

se me olvida Urian, en las RTX de la serie 2000 inicialmente se fabricaron por dos fundiciones distintas, una estaba claramente identificada como fabricada en taiwan que era TSMC, pero otros chip venian identificados como fabricados en Corea mucho se estuvo especulando que se habían fabricado por samsung. Afectaba a toda la gama ya fuera 2060, 2070, 2080 o 2080ti te podía tocar una o bien fabricada en taiwan o en corea durante los 6 primeros meses, después paulatinamente se fueron detectado menos unidades con gpus de procedencia coreana. Que no pase lo mismo con las rtx3000, aunque me resultaria… Read more »

Front.jpg
Last edited 29 days ago by Nitupensis
Set

Yo no se si el consumo alto sea por frecuencias, el GA 100 era TDP de 400w y sus frecuencia era 1400mhz y tampoco tiene una cantidad excesiva de Cudas 6xxx.

Otra cosa que no cuadra es el tamaño 627mm2 es bastante grande para una GPU de 7nm y de solo 5248 SP, de 12nm a 7nm hay mas del doble de densidad, pero puede ser que algo crecio dentro de Ampere, alguna unidad tal vez.

A mi por consumo y tamaño me cuadra mas en 8nm Samsung, pero miraremos que pasa el martes.

steven

hola nadie piensa en la hbm3 que dicen tendra un precio mas bajo que la la hbm2

IntelCeleronMasterRace

Hombre, con respeto pero…USA PUNTOS Y COMAS POR EL AMOR DE TSMC.

AcheronViper

El dual sourcing no es común en la industria del semiconductor, pero no es la primera vez. El más sonado tal vez, es el del Apple A9 (el SoC de los Iphone 6S). No se suele hacer, no por posible secretos industriales de la fundición, si no, porque al pertenecer a diferentes foundries y procesos, tienen reglas de diseño diferentes, lo que implica que el layout que se manda a cada fab es diferente lo que duplica los costes del tape out del chip. Además del dolor de cabeza que supone la validación para que ambos diseños tengan exactamente las… Read more »