diciembre 4, 2020

Feedback: Tegra Orin en Nintendo y Nintendo en la nube

Comentario#1:

Urian-senpai, pero para QUE necesitaria dlss de todas formas?
El Orin S en dock (si no me equivoco) me da 2,25 Tflops en fp32 que es (teniendo en cuenta SOLO la arquitectura Turing) CASI lo que rinde una PS4 Pro, encima con una cpu DE VERDAD.

En portatil incluso con menos de la mitad de frecuencia, incluso con 1 jodido Tflops, alcanza la potencia de una PS4 (una 750ti mierdosa y de arquitectura Maxwell 1.0 le pasaba el trapo en muchos titulos, encima en un entorno de api a alto nivel)

ENCIMA (de nuevo) con una cpu MUCHISIMO mas potente que el mierdoso Jaguar.

No entiendo cuales estandares se buscan…si la switch con la potencia de una PS3 tiene las ventas que tuvo, que problema hay con una Switch 2 AKA «PS4 Portatil»? Los 7nm? Pues se espera medio año y ya tienen los 5nm….Ni hablemos del PROBLEMON que tendra la next-gen para aprovechar hardware tan bestias con mas de 9 Tflops rdna2….eso ironicamente hara que una «ps4 portable» no quede mal parada.

Orin no es Turing sino Ampere y Nvidia ha cambiado la configuración de los Tensor Cores, en el White Paper de A100 se puede leer:

Cada Tensor Core en la arquitectura Volta puede ejecutar 64 FP16
operaciones (FMA) con acumulación de FP32 por ciclo de reloj, lo que le permite calcular en precisión mixta. Puede multiplicar matrices de 4x4x4 ciclo de reloj. Dado que cada SM en Volta incluye ocho Tensor Cores, un
un solo SM ofrece 512 operaciones FP16 FMA por ciclo de reloj o 1024 operaciones individuales de coma flotante en FP16. Cada uno de los Tensor Cores de la A100 (Ampere) puede ejecutar 256 operaciones FPMA FMA
por reloj, lo que le permite calcular los resultados de una multiplicación de matrices de precisión mixta de 8x4x8 por ciclo de reloj. Cada SM en la GPU A100 incluye cuatro de los nuevos núcleos Tensor rediseñados y
por lo tanto, cada SM en A100 ofrece 1024 operaciones FMA FP16 por reloj (o 2048 operaciones individuales FP16 operaciones de coma flotante por reloj).

En Volta cada Tensor Core tiene una configuración de 4x4x4 ALUs por Tensor Core, esto se puede ver en el diagrama.

Esto son unas 64 ALUs por Tensor Core y 512 ALUs por SM. Debido a que pueden realizar la instrucción FMA que son dos operaciones entonces el pico máximo en FLOPS (que se alcanza solo con esta instrucción) es de 1024 operaciones en FP16 por SM. En el caso de Ampere los Tensor Core son de 8x4x8 por lo que estamos hablando de 256 ALUs en total por Tensor Core pero tenemos un total de 4, esto hacen unos 1024 ALUs en total y unas 2048 operaciones por ciclo en cada SM.

Pero los datos datos de la gama Orin son en Int8 y hemos de tener en cuenta que para Int8 e Int4 lo que hace Nvidia es utilizar el SIMD sobre registro que consiste en que una ALU de una precisión n se subdivide para obtener n ALUs de precisión m/n donde n es la cantidad de ALUs y m la precisión inicial de base, siendo FP16 la precisión de base de los Tensor Cores desde la que va escalando hacía abajo.

Luego tenemos el ratio, en Turing y Volta (ambas utlilizan la misma configuración en cuanto a Tensor Cores) el ratio para FP16 es de 8:1 respecto a FP32 (que se ejecutan en los núcleos CUDA) y de 16:1 para las operaciones en Int8. Pero en Ampere no han aumentado la cantidad de ALUs FP32 y las ALUs de los Tensor si por lo que los ratios son 16:1 para FP16 y 32:1 para Int8.

Los dos únicos Tegra basados en dicha arquitectura son el Tegra Xavier y su versión recortada que es el Tegra Xavier NX.

Xavier tiene una potencia de 30 TOPS, el ratio de 16:1 entre Int8 y FP32 por lo que hablamos de unos 1.875 TFLOPS en FP32. Pero en el caso de Orin S que es Ampere el ratio es de 32:1 por lo que el sistema aunque tiene más potencia en los Tensors resulta menos potente que el Xavier y estaríamos hablando de 1.125 TFLOPS en FP32, lo que es un salto que no llega a 3X respecto a la Nintendo Switch y se me antoja insuficiente para un salto ya que esa potencia sería para el modo Dock ya que en el modo portátil por consumo la potencia debería ser mucho menor y por tanto nos encontramos ante un enorme problema en este aspecto y esto es algo que

Nintendo podría lanzar sin problemas una Switch mejorada con pantalla a 1080P que se vería mucho mejor por el efecto pantalla retina, pero no sería una Switch Pro por el hecho que no veríamos juegos vitaminados por ningún lado y mucho menos sería una sucesora.

Luego tenemos el Orin estándar, tiene un consumo de 40W y esto le sitúa fuera de poder colocarse en un sistema portátil pero hablamos de unos 100 TOPS, que son unos 3.125 TFLOPS en FP32, esto son unas 8 veces la potencia de cálculo de Switch. Obviamente no puede competir contra PS5 y Xbox Series X pero hemos de tener en cuenta que ese no es el objetivo del sistema, es más, la versión de 100 TOPS es con la velocidad de reloj recortada ya que puede alcanzar los 200 TOPS por lo que la cifra se iría a los 6 TFLOPS bajo arquitectura GeForce Ampere, pero claro, esto es solo una especulación. Pero sería más que suficiente para mover los juegos de Switch a 4K y con una tasa de fotogramas mayor.

Aparte, que hemos de tener en cuenta que una de las ventajas que tienen los Tegra desde el Tegra Xavier (X2) es la capacidad de conectar una GPU de la misma familia via NVLink por lo que Nintendo si quisiera podría conectar una GeForce Ampere de gama baja haciendo tándem. El problema es que yo no veo a Nintendo lanzando este modelo al mercado de masas, no se porque pero me da que estamos ante un potencial servidor de Nintendo para el Cloud Gaming basado en Switch como parte del plan de futuro de Nintendo pero tened en cuenta que me puedo comer cuervo con esto.

Estamos hablando de la empresa que mantuvo la Game Boy una década entera estando ya desfasada, que ha ido sacando consolas técnicamente desfasadisimas durante su historia. Nintendo puede darle una vida de años perfectamente a la Switch y no preocuparse por ello y seguir vendiendo su portátil/sobremesa incluso con PS5 y Xbox Series X a mitad de su vida. Estamos asumiendo demasiado pronto que tendremos una Switch 2 a la vuelta de la esquina cuando Nintendo suele alaaaargaaaar muuuuchoooooo la vida de sus consolas que tienen éxito.

El motivo por el cual pienso que Nintendo podría ir a la nube es porque tienen un enorme potencial con su propiedad intelectual para mover juegos desde la nube y la baja potencia de Switch les permite tener una infraestructura mucho más barata que la competencia para conseguirlo pero es la propiedad intelectual el punto fuerte que tienen y solo hay que ver las ventas brutales que tienen para ver el alcance de sus franquicias.

El potencial es enorme, obviamente quien tenga una Switch no va a ver interesante esto porque ya tiene la consola y no me veo a Nintendo haciendo una especie de Game Pass, más bien creo que al igual que en Stadia los juegos se tendrán que comprar y quedaran asignados a nuestra cuenta. Si compramos una Switch entonces los podremos descargar para jugar offline, si no entonces tendremos permisos para jugarlo en la nube desde cualquier dispositivo desde el que tengamos la aplicación.

Comentario#2:

Vengo de mi autoexilio para decir: No, pero NOOOOO!!!!

Si bien no son lo mismo, la idea que me ronda la cabeza serán como los juegos que Nintendo está ofreciendo en su mugroso on-line de la consola Switch, una puta mierda que no puedes tener en tu memoria (al menos, en Wii, Wii U, DSi y 3DS puedes guardarlos en memorias) y sólo puedes jugar si pagas. Hay que conservar bien copias antiguas de los juegos, porque con esta mugre,pierdes acceso a tus juegos. Yo definitivamente me repele la idea, para mi los juegos de Switch on-line están descritos en esta imagen meme-grado 4chan autista poco políticamente correcta: rehenes de un terrorista que amenaza con matarlos si no les pagan.

Juegos rehenes.jpg

Bueno, pienso que en el caso del Nintendo Cloud ellos pueden evolucionar el servició online actual a eso. En todo caso uno de los puntos fuertes sería una idea que hace tiempo me ronda por la cabeza que es el Virtual Console Cloud pero añadiendo esta vez Gamecube a la ecuación, no en vano Dolphin funciona bien en el X1.

El Virtual Console Cloud se basa en el siguiente concepto, y no es la primera vez que hablo de ello:

  • Los videos actuales por streaming de Twitch y Youtube gastan más ancho de banda y RAM en el sistema cliente que una ROM no solo de N64 sino incluso de un Disco de Gamecube.
  • La idea sería una especie de Youtube de juegos donde los descargamos y se nos quedan en memoria (la RAM, no el almacenamiento masivo) incluyendo los de Gamecube, lo mismo que ocurre con los archivos de video de las plataformas de streaming.
  • Podemos descargar los juegos en la memoria Flash de la consola si estamos en una Switch, pero solo de manera temporal.

La ventaja del Virtual Console Cloud como parte del Nintendo Cloud es que podrías ejecutar los juegos clásicos de Nintendo desde cualquier otro sistema y no solamente desde los de Nintendo.

Esto es todo, tenéis los comentarios de esta misma entrada para comentar y no olvidéis que tenemos Discord.

4 3 votes
Article Rating
4 Comments
Oldest
Newest Most Voted
Inline Feedbacks
View all comments
Charli

No es mala idea, veremos que nos depara el futuro.

Pepelepew

Lo que yo vengo pensando, es que si, Nintendo está haciendo algo con Nvidia, algo que sea totalmente compatible con los cartuchos de switch y darle más vida a su consola. No me voy por el lado técnico, me voy por el lado de mercado, este trimestre Nintendo vio el salto más grande en venta de software digital, ahorrando/obteniendo un mayor margen sobre el físico tradicional. Es una buena excusa para su versión pro con un mayor almacenamiento interno, así mantiene viva a su consola por unos cuantos años más, y todos sabemos que Nintendo no es reacia a hacer… Read more »

IntelCeleronMasterRace

«Animales Cruzando» debe ser el mejor juego de la historia de la humanidad para vender MAS QUE EL MISMISIMO ZELDA en menos de 5 meses XD A ver a ver, entonces por los tensor cores Nvidia nos cago un futuro chip portatil? Puta madre…bueno, en mi «defensa» podria decir que se esperan los 5nm y ver de hacerle algo custom a Nintend-CARAJO NVIDIA, QUE SWITCH DEMOSTRO VENDER COMO CHURROS, ME IMPORTA UN CARAJO LA EXCUSA DE «pero no ezzzta en mi gama de chips» que no la tienen jodida como Intel (que ironia…) Cloud gaming para Gamecube y anteriores? No… Read more »

anon

Es Pase o Cruze de Animales, en español se da primero la accion, osea los animalitos cruzando la calle/pueblo, Paseo Animal tambien Podria ser una Traduccion Valida.

Nintendo Facilmente puede pedirle a AMD, Samsung o otros un Chip Portatil,eso es lo de menos