Blog Personal.

Ampere, Futuro, GeForce, Nvidia

Cositas de Ampere

Esto no es oficial de Nvidia sino que uno de los filtradores de información ha dejado ir lo siguiente:

Por lo visto Nvidia habría cambiado el ratio de unidades FP32 (ALUs en coma flotante de 32 bits) y unidades INT32 (ALUs de enteros de 32 bits) que son tradicionalmente las ALUs llamadas núcleos CUDA, estas en los diagramas de Nvidia a partir de Volta y Turing no como «Núcleo CUDA» sino como FP32 e Int.

SM de la arquitectura Volta.
SMs de Turing RTX y Turing GTX

Muchos han aparecido para decir que Nvidia ha duplicado la cantidad de unidades FP32 respecto a las Int pero se ha de entender los motivos detrás de ello, siendo el primero que dichas ALUs son del tipo Co-Issue, en el sentido de que cada ALU FP32 tiene su pareja en forma de ALU Int y comparten registro e hilo de ejecución, de tal manera que cuando este activo el otro se encuentra inactivo. A esto Nvidia lo llama ejecución concurrente.

Es decir, es un juego de suma 0 donde siempre tenemos unas 64 ALUs activas por SM pero estas son una suma del total de ALUs FP32 e Int activas en e ese momento y por mucho que haya 128 nunca se pasa más alla de las 64 activas por el hecho que el planificador y los registros están pensados solo para manejar 64 ALUs.

¿Entonces que ha hecho Nvidia? ¿Ha duplicado la cantidad de unidades FP32? Pues no, lo que ha hecho es reducir la cantidad de unidades Int a 16 por cada SM y el motivo de ello es el nivel de uso que tienen el 100% de los juegos de la unidades de enteros y esto lo sabe Nvidia a través de su aplicación NSight que analiza el rendimiento y uso de cada una de las partes de la GPU en los juegos. Por lo que con esta información puede optimizar los diseños de sus GPUs y entre las optimizaciones esta el reducir las unidades si estás están en desuso a cambio de dar espacio a las que tienen más utilidad dentro de la GPU.

Todo esto lo digo porque hay gente que dice que vamos a ver de repente unidades SM con 128 ALUs en FP32 en total duplicando la capacidad en coma flotante y os digo que una vez Nvidia presente las GeForce Ampere su reacción no será diferente a esto:

Es más, preparaos para ver a gente hablando de ALUs ocultas y potencia en coma flotante oculta por el hecho que leyeron en los medios una malinterpretación de un comentario de un filtrador de información.

Ya cambiando de tercio, parece que se «confirma» la tan rumoreada memoria GDDR6X, pero esta vez por parte de Micron.

Vamos a ver, la GDDR6X como memoria no existe en si misma porque no es un estándar diferente a la GDDR6 en lo que a su funcionamiento se refiere pero Nvidia que es muy buena en el marketing ha decidido ponerle esa nomenclatura a los chips GDDR6 que se mueven entre 19-21Gbps y no, no es lo mismo que la GDDR5X por el hecho que la organización de la GDDR5X no era la misma que una GDDR5 subida de vueltas.

Tened en cuenta que al igual que los procesadores el coste de las memoria depende de la velocidad de reloj que alcancen en los tests paramétricos, si el chip no funciona a una velocidad entonces esta es reducida hasta que pasa con soltura dichos tests. Esto en el caso de las memorias hace que las más rápidas sean las más caras, de las que hay menos producción y es normal que Nvidia supuestamente las asigne a su gama más alta y por tanto de menor producción y distribución como es la GeForce RTX 3090.

¿Es esto cosa de Nvidia solamente? Más bien de los fabricantes de chips que se han puesto de acuerdo para crear un nombre comercial común y es posible que la veamos en las GPUs de gama alta de AMD e Intel también.

Como curiosidad, los 84 SM que se ven en la tabla confirmarían que Nvidia habría hecho con Ampere respecto a Turing lo mismo que hizo en Pascal respecto a Maxwell, añadir una unidad TPC (2 SM) por GPC adicional pasando de 72SM de la GeForce RTX 2080 Ti a 84 SM de la GeForce RTX 3090.

Esto es todo, tenéis los comentarios de esta misma entrada para comentar y no olvideis que tenemos Discord.

5 2 votes
Article Rating
8 Comments
Oldest
Newest Most Voted
Inline Feedbacks
View all comments
Nicco

Lo 84 te refieres a la tabla de micron?
En esa tabla creo que los 76-84 creo que son los Gbps totales por módulo en modo QDR. 21 x4=84 que si se multiplica por la cantidad de módulos (12) son los 1008 que alardea tener en total como ancho de banda micron, no? Pregunto porque no estoy segura?

nolgan

muy intersante… a ver que nos dicen el 1 de septiembre… y asi a ver si despues de hablar nvidia amd habla, que joer que estamos ya casi a septiembre , que telita

Nicco

Urian no se a viste que ya hicieron la conferencia de Microsoft en el hotchips.

Te dejo galería con capturas, el video aún está resubiéndolo y el enlace del directo ya no vale.

https://imgur.com/a/G14mpYs

Nicco

Es curioso que quienes han hecho la presentación son el equipo de hardware de azufre, y por lo que han ido soltando durante y en el post casa, con lo que dijo Phil Spencer de que en esta consola había sido diseñada pensando antes en lo que querían para los Blade de azufe/Xcloud y que la consola es el subproducto de ello y parece que ciertamente fue así.

Nicco

Azufre, azufe jejeje Azure! joio corrector que hace lo que quiere xD

Nicco

Aclaracion… El video de la conferencia al parecer es en parte pregrabado y la sesión de preguntas y respuestas en directo, al parecer se ha colado el enlace y se a podido previsualizar durante un rato por error y por eso está bloqueado ahora, ya que la conferencia empieza dentro de unas 2h

Schneider

Estoy ansioso por esperar a que Urian nos destripe los datos.

Nicco