Blog Personal.

Especulación, Microsoft, Xbox Series S, XSS

Xbox Series S»treaming» (Feedback)

Como la entrada de ayer no la habéis entendido muy bien, parte de la culpa la tenéis vosotros por haberos auto-liado solos, pues he decidido hacer un Feedback para así aprovechar para comentar ciertos aspectos que no han quedado claros.

Comentario Original:

Lo del 25% comparado con GCN no tiene sentido. Si ya RDNA tiene un rendimiento 30-40% superior a GCN a igualdad de potencia bruta ¿cómo puede ser que RDNA2 tenga sólo un 25% más que GCN? AMD ya comentó que la arquitectura de RDNA2 en consolas y en PC es la misma.

Lo del 25% lo dice Microsoft, no lo digo yo que me parece que me estáis acusando de,inventarme las cosas.

En todo caso sabemos que las RDNA son mejores que las GCN en lo que al rendimiento de las Compute Units se refiere por el hecho que retiran las instrucciones más rápidamente, en menos ciclos.

El programa de la izquierda la AMD Vega tarda unos 13 ciclos en ejecutarlo, Navi con wavefronts de 32 elementos tarda unos 8 ciclos y y con wavefronts de 64 elementos unos 9 ciclos. Si lo miramos bien la cantidad de instrucciones simultaneas por Compute Unit en RDNA respecto a GCN no ha aumentado sino que lo que han reducido son los ciclos por instrucción pero si hacemos una media de todos los ciclos que ha durando la ejecución de las instrucciones y la cantidad de instrucciones del programa original nos encontramos con que esta ha realizado más instrucciones en un ciclo pero…

..No todos los programas dan en el mismo ratio de rendimiento comparativo ya que dependerá de las instrucciones que se ejecuten en el mismo a la hora de hacer la prueba correspondiente. Esto es una trampa que hacen mucho los fabricantes de hardware, el hecho de decirte que en rendimiento el IPC ha aumentado un tanto por ciento respecto al anterior diseño. El IPC en su definición más correcta y pura es la cantidad de instrucciones que se ejecutan en un hardware simultáneamente que no es lo mismo que decir las que resuelven por ciclo de media.

El otro punto es el llamado rendimiento por watt, es cierto que AMD dijo que en esos terminos RDNA2 es un 50% mejor que RDNA.

El problema es que el consumo energético depende de la velocidad de reloj por lo que AMD en la diapositiva nos dice que en una velocidad de reloj indeterminada por ellos en cada uno de los elementos de la comparativa pero con un consumo común el diferencial de rendimiento entre los diferentes elementos es un tanto por ciento. Si escogemos otro consumo es posible que el diferencial sea distinto debido a que no todas las arquitecturas escalan igual en cuanto a velocidad de reloj y consumo.

Otro tema confuso es lo que dijo Cerny cuando afirmo una CU de RDNA2 es un 62% más compleja que una de GCN, la afirmación de Cerny era respecto al área ocupada en el chip.

Y si, son trucos de marketing pero debido a la confusión he decidido explicar donde esta la trampa.

Por otra parte, entiendo que sea difícil salvar la diferencia entre 10 y 16 GB si ambas consolas cuentan con SSD, pero ¿con los 12 de One X? Entre que Series S no necesitaría texturas 4K y el SSD, sus 10 GB cundirían mucho más que los 12 de One X.

EL SSD no funciona así, este no tiene el ancho de banda ni tampoco la latencia suficiente como para ser utilizado como memoria y estoy harto de tener que leer sobre el tema.

¿Cual es la mágia del SSD? Que nos permite copiar datos rapidamente en la RAM, pero no se ejecuta absolutamente nada. en el SSD. Simplemente cuando una dirección de memoria esta fuera de la memoria física lo que se hace es activarse un mecanismo que busca ese dato en el almacenamiento masivo y lo trae a la RAM. Esto hace años que se hace solo que con el SSD tenemos una serie de ventajas:

  • No es un formato basado en disco por lo que la latencia de acceso a los datos no dependerá de la pista en la que se encuentre.
  • Tiene la capacidad de enviar datos a una velocidad entre 40 veces y 100 veces más rápido que el Disco Duro.

La clave del SSD es que podemos cambiar los datos de la RAM lo suficientemente rápido como para que tanto la CPU como la GPU tengan virtualmente un espacio más grande por el hecho que el intercambio de datos se hace con la suficiente celeridad como para ser imperceptible a la ejecución. Pero para ello es necesario un mecanismo en las caches, estas incluyen el código más reciente que se esta ejecutando y son memoria multipuerto. Internamente hay un pequeño hardware que mira las lineas posteriores a ejecutar, especialmente las que tienen que ver con instrucciones que utilizan memoria externa y las que tienen una dirección de memoria más allá del espacio de la RAM las pre-capta por adelantado desde el SSD y las guarda en la RAM para que así cuando el procesador correspondiente llegue allí tenga los datos en la RAM que es desde donde va a trabajar.

Podría estar destinada a xCloud, pero ¿no crees que es demasiado potente? Creo que un aparato dedicado al streaming debería centrarse en el escalado IA y decodificación por hardware del mejor códec existente, el AV1.

Yo no he hablado en ningún momento que Lockhart sea el dispositivo cliente como has afirmado que he dicho yo. He dejado muy claro que Lockhart sería el hardware que estaría en los servidores de Microsoft ejecutando los juegos remotamente, no lo que tendríamos en nuestras casas. Es como si yo hubiese hablado del hardware de los servidores de Stadia y me dijeses que yo he dicho que Google vende un PC con una CPU Intel y una AMD Vega 56 a los usuarios finales para acceder a su servicio.

¡Pensad un poco lo que ponéis de comentarios, por Dios!

Es importante separar Lockhart de Xbox Series S de la misma manera que es importante separar esto…

… de esto …

Tampoco veo su sitio en el lado del servidor cuando pienso en «Anthem», los blades para xCloud basados en el SoC de Xbox Series X y que tienen las 56 CU activas.

Para mi si que tiene sentido, especialmente después de que Microsoft oficialmente haya dicho que la cantidad de chips que van a tener disponibles es más bajo y hay que tener en cuenta que ellos necesitan una infraestructura para el XCloud ya que Roma no se hizo en un día. Si tienen pocos chips de la Xbox Series X no solamente tienen pocos chips para la consola sino también para los servidores.

¿Como pueden solventar esto?

Pues simplemente creando un perfil de hardware más simple pero lo suficientemente bueno como para ejecutar los juegos de Xbox One en la nube con un mejor rendimiento o versiones recortadas técnicamente de juegos de Xbox Series X. De cara a los desarrolladores ambos sistemas existen como perfiles a desarrollar, pero uno de ellos se venderá en forma de consola de videojuegos para el público final y el otro es un servidor en la nube.

¿De verdad a nadie le parece raro que tanto hablar de Xbox Series S/Lockhart y Microsoft ni la enseñe como consola y este hablando de Xbox Series X como si no tuviese compañera? Que exista como perfil en el SDK no significa que exista una consola comercial con esas especificaciones, es más, esa información solo se ha dado a los desarrolladores y a nivel de marketing la Xbox Series S/Lockhart no existe como consola de videojuegos dedicada no existe pese a existir en el SDK.

Pe… pero Urian, si Phil Spencer dijo que el hardware de la Xbox Series X sería el de los servidores.

Yo no he dicho que no, solo he dicho que Lockhart podria ser utilizada como hardware servidor para el XCloud con el objetivo de tener un despliegue rápido de la infraestructura sin verse afectada por los peores de lo esperados yields del SoC de Xbox Series X mientras Microsoft espera que mejore la cosa para actualizar el hardware de sus servidores a uno más potente, basado en el de XSX pero seguramente más rápido en cuanto a velocidad de reloj.

Rectifico, basados no. El SoC de Xbox Series X es el mismo que el de xCloud al que le desactivan 4 CU. Por eso los núcelos Zen 2 son los «server class»

Hombre, gracias por darme la razón en cuanto a mi especulación. Esto significa que los servidores del XCloud basados en el SoC de XSX son muchos menos de lo esperado ya que la cantidad de chips buenos que tendrían disponibles para los servers del XCloud sería más bajo y dificultaría el despliegue de la infraestructura para el XCloud.

Esto es todo, tenéis los comentarios de esta misma entrada para comentar y no olvideis que tenemos Discord.

4 2 votes
Article Rating
2 Comments
Oldest
Newest Most Voted
Inline Feedbacks
View all comments
Dani

Urian, siento la confusión. Lo he comentado pero en realidad no iba por ti, lo digo en general. Microsoft dice lo del 25% comparado con la anterior generación y todos interpretan que es comparado con GCN. Luego, al ver que habla a igualdad de frecuencia de reloj, me cuadra más, aunque signifique una mejora nula entre RDNA2 y RDNA. Gracias, me estaba liando también con «el rendimiento por watio», que esa es la mayor mejora. En cuanto a lo de la mamoria, con lo del SSD me refiero sólo a texturas. Si una consola no requiere texturas 4K seguro que… Read more »

anon