Blog Personal.

Especulación, Nintendo, Switch

El SoC de la sucesora de la Nintendo Switch.

Echadle un vistazo a la siguiente diapositiva de la presentación de hace uno meses por no decir del adelanto del Tegra «Orin» que Nvidia hizo el pasado mes de Diciembre.

El Orin S con 15W de consumo y una potencia de 36 TOPS es el chip ideal por dicho nivel de consumo para una eventual sucesora de la Nintendo Switch. ¿Pero que son los TOPS? Es lo mismo que los TFLOPS pero dado que se hacen con números enteros de 8 bits (Int8) la F y la L de «FLoating Point» o coma flotante desaparece.

por lo que no os preocupéis que aún falta para ello y no esta tan a la vuelta de la esquina pero ese Orin S tiene todos los números para haber sido diseñado para una eventual sucesora de la actual Switch.

Nvidia desde Volta (Xavier en Tegra) en adelante utiliza unidades aparte de los núcleos CUDA para los calculos en FP16 que como bien sabéis son los Tensor «Cores». Pus bien, esos Tensor Cores soportan SIMD sobre registro y cada ALU en FP16 puede actuar como 2 ALUs en Int8 o 4 ALUs en Int4.

Tengo muy claro que Ampere va a ser una versión a 7nm de Turing con algunas mejoras, en el caso de Turing hay que recordar que tenemos dos vertientes distuintas. En las TU 10x (RTX Turing) el ratio de las ALUs en FP16 es de 8:1 respecto a las ALUs en FP32, en las TU 11x (GTX Turing) el ratio de ALUs en FP16 es de 4:1.

Esto nos deja dos posibilidades.

  • Posibilidad#1: 36 TOPS en Int8 que son 18 TFLOPS en FP16 y con el ratio de 8:1 unos 2.25 TFLOPS en FP32.
  • Posibilidad#2: 36 TOPS en Int8 que son 18 TFLOPS en FP16 y con el ratio de 8:1 unos 4.5 TFLOPS en FP32.

En el primer caso es el que ganaría la contienda, la cantidad de unidades SM es menor que en l segundo caso y por tanto hablamos de un chip más barato para conseguir el mismo rendimiento teórico en cuanto a la cantidad de TOPS. No olvidéis que estamos hablando de lo que sería un dispositivo que va a poder utilizarse como consola portátil como la actual Switch y con unos niveles de consumo similares.

En realidad el Orin-S vendria a ser el sucesor del Xavier NX y por tanto dentro de la gama de los Nvidia Tegra de gama baja y de bajo consumo. Hay que tener en cuenta que el Tegra Xavier no-NX es una bestía de 360mm2 de tamaño, mide lo mismo que en mm2 que el SoC de Xbox One X y Xbox Series X en sus respectivos nodos y necesita un total de 8 chips de memoria LPDDR4X para alimentarlo.

Por lo que Nvidia decidió lanzar una versión recortada que es el Xavier NX.

Lo primero que llama la atención es ver que el Xavier NX tiene menos chips de memoria que su hermano mayor, en la placa solo se ven 2 pero realmente son unos 4 chips ya que el bus ha ido de los 256 bits LPDDR4X a los 128 bits utilizando el mismo tipo de memoria y con un ancho de banda de 51.2 GB/s.

En cuanto a especificaciones Nvidia curiosamente del Xavier NX nos da dos especificaciones distintas:

  • Una con un consumo de 10W
  • La otra con un consumo de 15W

Ambas son el mismo chip con la siguientes especificaciones:

  • Una GPU de arquitectura Volta con 6 SM
  • Una CPU Nvidia Carmel (ARMv8) de 6 núcleos.
  • La versión de 10W funciona a 800Mhz, la de 15W a unos 1100Mhz.
  • 14 TOPS para la versión de 10W y 21 TOPS para la de 15W.

Pensad que no hablo del Orin-S, ahora bien, supongamos que Nintendo quiere construir una nueva Nintendo Switch con dicho chip, dada la compatibilidad de binarios, una eventual Switch 2 basada en el Xavier NX se encontraria con los mismos problemas que se van a encontrar tanto Sony como Microsoft y si me permitis me voy a autocitar porque esto es importante.

… puedes tener un sistema que sea binariamente compatible pero que de problemas con los algoritmos de ciertos juegos que dependen del timing y de la sincronización, no solo por las velocidades de reloj dispares sino también por los ciclos por instrucción que pueden ser distintos y que las instrucciones tarden más o menos de una variante a otra. El truco para conseguir la compatibilidad no se basa unicamente en el hecho de igualar la velocidad de reloj sino los ciclos por instrucción, lo que lleva a tener que colocar la CPU del sistema anterior para tener 100% de compatibilidad hacia atrás. El otro mecanismo es añadir ciclos de instrucción adicionales para emular el sistema menos potente en su timing exacto cuando ejecuta en modo retrocompatible de tal manera que no se den problemas en esos escenarios.

Tomemos por ejemplo un hardware concreto con con compatibilidad hacía atrás, por ejemplo 3DS…

El sistema de video de 3DS es diferente al de DSi por tanto se ha de implementar el de DSi al completo dentro del nuevo SoC. También se han de tener en cuenta las velocidades de reloj anteriores que son 66Mhz para DS y 133Mhz para DSi por lo que la velocidad de reloj de todos los componentes tiene que ser un múltiple de todas ellas. El problema viene cuando miramos la CPU, tenemos un ARM11, tecnicamente es un conjunto de registros e instrucciones ARM pero resuta que el CPI es distinto en cuanto a estas instrucciones y Nintendo opto por colocar el ARM9 de DSi para el modo de compatibilidad hacía atrás por el hecho que Nintendo no quiso realizar los cambios pertinentes al ARM11 para asegurarse un timing exacto y tener el 100% de compatibilidad hacía atrás.

Un truco para mantener el timing es tener el hardware antiguo en el SoC pero esto significa que las velocidades de reloj han de estar en sincronía y ser un múltiple de los del antiguo hardware. En realidad adaptar el Xavier NX a Switch significa que Nvidia para Nintendo debería crear un modo legado donde para tener 100% de compatibilidad con los juegos el nuevo SoC debería funcionar bajo especificaciones de timing identicas a las de la Switch original.

¿Pero tiene Nintendo este problema como Sony? No, porque han sido precavidos y la mayoría de juegos soportan resolución dinámica que se basa en variar la resolución pero manteniendo la tasa de fotogramas fija según la cantidad de recursos disponibles en cada momento. Esto significa que si colocas un juego en un hardware binariamente compatible pero más potente el mismo juego escalará en resolución y efectos de manera automática con el nuevo hardware y el 99% del catálogo del software de Nintendo Switch utiliza resolución dinámica por lo que reproducirlos en una Switch más potente debería mejorar automáticamente la calidad visual de los juegos o como mínimo aumentar la resolución.

Sinceramente pienso que Nintendo si quisiera podría utilizar el Xavier NX y construr una eventual Switch Pro, con la capacidad de reproducir los juegos de Switch con la resolución del modo sobremesa en modo portáti. La gran ventaja que tendría esa Switch es que al utilizar una pantalla de 1080P pasaría a superar los 300 pixeles por pulgada y la nitidez y calidad de imagen en los juegos respecto a la Switch original se haría notar.

Todo el mundo sabéis que personalmente apuesto por dicho concepto y lo mejor es que un Xavier NX tendria la suficiente potencia como para hacerlo posible pero… ¿No sería mejor un Orin-S que tiene una mayor capacidad de cálculo y es compatible con la LPDDR5 que es un memoria más rápida? Vamos, digo yo.

Int8 (TOPS)FP16 (TFLOPS)FP32 (TFLOPS)TFLOPS/W
Xavier NX 10W1470,8750,0875
Xavier NX 15W2110,51,31250,0875
Orin-S 15W36182,250,15
Orin-S 10W24121,50,15

¿De donde saco el Orin-S a 10W? Pues fácil, extrapolando el Xavier NX y los consumos.

En realidad el Orin-S tiene el doble de rendimiento por W que el Xavier NX y dado lo bien que le va a Switch en el mercado tengo muy claro que Nintendo habría descartado el Xavier NX como potencial SoC para tomar el Orin-S de cara a la sucesora directa de Switch, el hecho que de el doble de rendimiento bajo las mismas condiciones de consumo ya es un punto. El otro punto es que al ser un chip a 7nm en vez de los 12nm del Xavier NX va a ser más pequeño incluso siendo un poco más complejo y por tanto en teoría más barato de producir que el Xavier NX.

Por el momento a Nintendo le van las cosas excelentemente bien con la Switch actual y no creo que veamos una Switch Pro a corto plazo, en realidad pienso que vamos a ver un salto generacional en cuanto a rendimiento de Switch a su sucesora y el Orin-S que estará disponible en masa para 2022 es el chip ideal para ello.

Esto es todo, tenéis el Discord y los comentarios de esta entrada para comentarla.

0 0 vote
Article Rating
12 Comments
Oldest
Newest Most Voted
Inline Feedbacks
View all comments
Big crunch

Yo me imagino una switch pro que sólo sea +30% más potente, con DLSS 2 cuadruplicando la resolución viéndose mejor que a resolución nativa x4 como pasa en Control. Tendría la pantalla de Rift S, 2560×1440 LED de baja persistencia y 80 Hz y unas 5,7″ También usaría IA con el tracking como hace Oculus Tendría 2 cámaras de ojo de pez en blanco y negro para el tracking. Podrían estar en vertical en el centro trasero apuntando en direcciones opuestas. Así no se enguarrarían con los dedos sujetando la consola. Con una tercera cámara en color sin ojo de… Read more »

N-LL-M

¿Qué opciones reales crees que hay de que Nintendo pusiera memoria equivalente a la SSD en la consola? ¿Y teóricas en cuánto viabilidad? Hemos visto que, sufriendo como les pasaba a GameBoy y GameGear, la switch podía recibir juegos de sobremesa. Pero igual para ciertos juegos una memoria lenta podría ser el mayor handicap para un port tipo Star Citicen.

Me pareció leer hace unos meses que se había anunciado unas SD con controladora del tipo que se usan en discos ssd, pero no encuentro nada.

N-LL-M

Tenía entendido que era EMMC lo que lleva Switch

Snake128

Bufff pues si llega a esos 2’25 tf será imposible que pueda ejecutar los juegos de las sobremesa, pero bueno, pqra ejecutar los juegos current gen mejor si le sirve.

Isaac

Pero las sobremesa, supuestamente, van a correr juegos a 4K/60, y 1080p es 1/4 de 4K. Asi que si PS5 con 10TF=4K/60 => 2.5TF=2K/60
Ya sé que no es así de fácil la escalabilidad,la CPU es un problema a parte,etc., solo digo que tal vez no sea tan imposible.

Aunque siguiendo mi logica sería posible la Xbox 4TF y Urian dijo que no, así que no me hagas mucho caso

IntelCeleronMasterRace

Otra vez con los Tflops, se ve que no entienden…

Hombre, 2,25TF ARQUITECTURA AMPERE con un ancho de banda adecuado estoy seguro que estan a la altura de los 4,2 de una PS4 Pro, te parece poco potente para un dispositivo de 15w que tambien es pòrtatil? Encima con una cpu muy superior, vamos…

Snake128

Ya comparando tf con la pro, las nuevas consolas seran de 14 y 16 tf de potencia, vamos que sigue sin llegar.

No digo que sea poco potente, digo que no podra tener ports de las mayores, obviamente indies y productos de la actual generación si.

Total la gente que ha estado siempre en Nintendo está jugando a juegos de la current y pasada gen y están supercontentos.

IntelCeleronMasterRace

Por el amor de….estas mas perdido que Nolgan, que tenga X potencia una «PS5 Pro» NO QUIERE DECIR QUE LA VAYA A USAR EN GRAFICOS Y TEXTURAS, ES JODIDAMENTE CARO. Una PS4 todavia tiene el musculo grafico (y capacidad de portabilidad) MAS QUE SUFICIENTE PARA QUE SE VEA DECENTE ALGO, ahora imaginate mas potencia, pero en una portatil.

La Switch tiene 0,38 Tflops aprox en FP32, no 1 TFLOPS, SERIA UNA BESTIALIDAD PARA UN CHIP DEL 2015.

Snake128

Jajja cierto, pido disculpas estube mirando y directamente ponen 1tf en ciertos sitios.

Snake128

Es que pensandolo bien, ps4 y xbox saltan de 1’3-1’8 a 12-10 respectivamente, la siguiente switch de 1 a 2’25, me parece muuuy escaso pero bueno…

Steven

Hola entiendo que sería como una Xbox s de potente mucho calculo es solo cuando usa el tenso core