Blog Personal.

Uncategorized

Defendiendo a Mark Cerny

Creo que esta entrada es necesaria, muchos cuando la lean se van a poner en plan…

… pero creo que ante tanta contaminación es importante un poco de cordura.

Supongamos que tenemos unos 4 regalos y unas 5 personas… ¿Que pasara cuando repartamos los regalos? Una de estas personas se quedará sin regala y por tanto triste.

En una GPU lo importante es que las diferentes Compute Units estén ocupadas todo el rato haciendo trabajo, si no reciben nada que hacer simplemente no hacen nada y no suman al computo general en cuanto a la potencia por muchas que sean estas.

En los foros esta lleno de gente que con la confirmación de los 36 CUs en la GPU de PlayStation 5 esta en modo…

Pero para tener esos moar cores ocupados les ha de alimentar con una carga de trabajo adecuada a su capacidad de computación. Existe el mito de que una GPU ira aumentando de manera progresiva su potencia si o si pero no es así. Haced una prueba, coged un juego antiguo y colocarme en vuestros PCs, luego coged un PC antiguo y comparad, veréis que no escala de la misma manera. El motivo de ello es que no hay suficiente carga de trabajo para la GPU más moderna y por tanto una buena parte de ella se encuentra sin hacer nada de nada y acaba siendo una potencia completamente desaprovechada, es por ello que los juegos antiguos no se disparán hasta los centenares e incluso miles de fotogramas por segundo.

Ayer Cerny hizo una comparación donde decía que es mejor menos CUs a mayor velocidad que más CUs a menor velocidad. Sono como una especie de control de daños para justificar el tener 36 CUs activas en la GPU en vez de 52, la realidad es que Cerny tiene razón en este aspecto pero con el tema de los Tontoflops desplegado por el marketing de Microsoft parece una excusa por parte de Cerny, pero a mi la explicación que dio me resulto satisfactoria ya que me pareció una explicación a todos los que hablábamos sobre el posible aumento de última hora de la cantidad de Compute Units, la explicación de Cerny a mi me parecio satifactoría, lastima que parecía un funeral.

El otro motivo que dio Cerny es que aumenta la velocidad de las etapas de función fija al ir estas más rápido. Pensad en el renderizado como una fábrica donde cada parte hace una etapa de la producción.

La velocidad de una etapa afectara a las posteriores. Las que son programables dependerán de la velocidad de los shaders y la carga de trabajo de estos. Si no hay suficiente potencia entonces habrá un cuello de botella pero también lo habrá si la carga de trabajo no es lo suficientemente alta, Las que son de función fija se van a beneficiar de una velocidad de reloj más alta en consecuencia y harán su trabajo en menos tiempo en dichas etapas dejando más tiempo disponible a las posteriores.

Suponed por un momento que en nuestra fábrica/GPU las parte programables las hacen operarios humanos.

Nos tenemos que asegurar que el trabajo que llegue es suficiente para que todos estén ocupados. En cambio en las partes robotizadas sabemos que el rendimiento y el tiempo del robot es fijo, si reducimos el tiempo de trabajo de los robots reduciremos el tiempo total y aumentaremos la producción. Pues bien, los robots son el equivalente a las unidades de función fija.

Pe… pero Urian… Estas justificando la chapuza de Cerny con PlayStation 5.

Lo que digo es que lo de Cerny no es una chapuza por mucho que los viral marketers y los astroturfers de Microsoft lo vayan diciendo porque lo importante es derivar la conversación a los Tontoflops de marras, Tontoflops que solo se alcanzan con el 100% de la utilización de todos los núcleos de la GPU y para ello se requiere una carga de trabajo acorde. No olvideis que los TFLOPS son una tasa, dicha tasa depende de la carga de trabajo, si la carga de trabajo es más baja entonces la tasa de rendimiento será más baja.

Esto es todo, tenéis el Discord y los comentarios de esta entrada para comentarla.

5 1 vote
Article Rating
12 Comments
Oldest
Newest Most Voted
Inline Feedbacks
View all comments
Batlander

Entiendo lo que quieres decir. Pero habrá que ver qué hacen con esos 2 Tontoflops y CUs ociosos de la XBS. Si lo utilizan solo para meter más fotógramas y resolución al final será como tirarlo a la basura. Pero si se utilísima para meter mejores texturas y más ray tracing la cosa puede cambiar bastante.

Aunque también habrá que ver si la RAM compartimentada luego puede que limite esta posibilidad.

nolgan

eso trate de explicar en otro sitio que ps5 al tener 16gb unificados, puede ser una ventaja a tener solo 10gb para gpu de xsx, sabemos que 2-3gb de ps5 se iran a sistema quedaran 13-14gb para el juego completo.. y creo que es mas acorde usar 14gb , que 10gb auqneu estos sean un poco mejores en velociadd de ancho de banda… no se.. a lo mejor me equivoco.. corregidme… que si que xsx despues tiene 3gb de apoyo para sonido otro usos etc etc… pero la gpu 10gb en esto creo que limitara el uso de ese 1,8… Read more »

Jorge

Ya lo veremos. Sobre el papel van a quitar trabajo a la ram tirando de SSD. A mi me ha llamado la atencion esto de in ingeniero de AMD. Es una aproximacion de memoria muy rara pero por algo lo habran hecho digo yo personas con mas conocimiento que nosotros. Espero que no acabe como la famosa ESRAM y tengan que sacar rapidamente otra consola.

https://mobile.twitter.com/philparkbot/status/1240096280287666176

El peluca

Bueno yo lo q veo es q Microsoft a hecho un gran trabajo para q los desarrolladores tengan todo lo necesario para hacer grandes juegos, Ps5 también. Pero todo lo que hace Ps5 prácticamente lo hará Xbox sx con mejores armas, no hay q ser muy listo para saber esto, soluciones exóticas siempre dependerá de lo q el desarrollador quiera trabajar, pero con soluciones pensadas para desarrolladores, creo w Microsoft a hecho una máquina para jugadores y desarrolladores desde principio a fin sin sacrificar nada.. ahora los juegos mandará.

Jorge

Yo me he vuelto a ver la charla de ayer hehe y debo decir que cada vez entiendo menos porque al final Cerny me vende que su criatura es mejor que el hijo del vecino. Y evidentemente todo tiene su verdad. Al final puedo comprar lo de AMD Smartshift. Sobre el papel la forma de usarlo Sony parece muy chulo pero quitando los tontoflops que se dicen por aqui digo yo que la diferencia de CUs por lo menos a nivel de RT me parece importante. Por mucho que Cerny quiera quitar merito por culpa de Nvidia el RT va… Read more »

Set

El ejemplo de juegos antiguos no lo veo, unos de los componentes principales que asigna carga a la GPU es la CPU, en juegos antiguos se da el famoso cuello de botella, es porque los juegos antiguos estan pensando para 1 o 2 core, y la GPU actuales son demasido potente, antes de tener la GPU llena con una carga del 99%, te limitara la CPU, alcanzando menos FPS una anologia de esto seria: – Que las GPU son como un jarron, entre mas potente mas grande es el jarron, y mas rapida tendra que ser la CPU para llenarla(asignarle… Read more »

Steven

Hola me quedo duda Sony tocó algo o pidió en el procesador de comandos

Cyber729

Yo lei por ahi que el lastre de PS5 no son los Tflops, si no su ancho de banda de 448 Gb/s para rasterizacion, procesamiento, renderizado, audio 3D, etc.

Schneider

Veo a las 2 nuevas consolas bastante igualadas a nivel de hardware, no creo que la Series X sea muy superior, ambas maquinas tienen cosas buenas en las que destacan. Si Microsoft no la caga y saca la Series X al mismo precio que la PS5, habrá batalla. Eso sí, Sony aún tiene que presentar la consola físicamente, el nuevo mando con sus nuevas características y los JUEGOS. Microsoft antes del lanzamiento debería presentar juegos juego juegos, de nueva generación y mejor si son nuevas IP. Y viendo que Sony va un poco coja en retro compatibilidad atacar por ahí,… Read more »

Jorge

A mi me encanta que al final son consolas muy igualadas y a la vez cada una con sus cosas custom. Sony con lo de AMD Smartshift, la locura de SSD,etc aunque espero no equivocarme creo que tanto esfuerzo en sonido no va ser muy apreciado en general. Luego Microsoft me ha ganado con el machine learning de HDR, el nuevo pass con la retro y muy interesado en lo de la latencia. Como punto negativo espero que lo de la memoria no les pass factura. Creo que lo han hecho para ahorrar costes al igual que ir a por… Read more »

Alfonso Chen

Es que la presentación fue muy aburrida, no solo lo que dice en ella, en si, creo que esperaban una presentación mas cool, como la de xbox con el youtuber

MACUZO-AUC

Una analogía para comprender estos desaguisados e la «la teoría de restricciones» (Theory of Constraints Eliyahu M. Goldratt 1982), paradigma desde la administración y gestión de empresas (tómenlo como bien puedan solo respiren profundo). Es como lo que comenta el Maese Urian, y que Eliyahu lo resume en «El proceso más lento es que nos dice cual es la velocidad de TODO el proceso.» Si tienes una inyectora que producen 100 tapas para PET por hora, pues eso es lo que vas a producir PUNTO. Aquí viene el giro Copernicano: Si bien la maquina solo producir 100 tapas por hora,… Read more »