Disruptive Ludens

Blog personal sobre tecnología

PS5 Pro y Xbox «Series Y» con unidades Tensor

Una de las cosas de las que se van a beneficiar tanto la futura PS5 Pro como Xbox «Series Y» va a ser el añadido de arrays sistólicos o más bien conocido como tensor cores o «procesadores» neurales.

¿Por qué digo esto? Bueno, ya comente en su día que RDNA 3 utilizará este tipo de unidades, los heredará de la recién presentada arquitectura CDNA, la cual no es más que una GCN optimizada para computación y añadiendo una unidad del tipo tensor en cada una de sus Compute Units,

CDNA CU Diagram

Como recordaréis, en GCN tenemos 4 unidades SIMD por Compute Unit, la cual esta compuesta por 16 ALUs FP32.

En el caso de CDNA se pueden ver varias unidades, esta son:

  • 8 unidades de Doble Precision (FP64)
  • 16 unidades de «Single» Precision (FP32)
  • 32 unidades de «Half» Precision (FP16)
  • 4 unidades SFU (Special Function Units) que se utilizan para instrucciones complejas.
  • Matrix Unit

La Matrix Unit es lo que llamamos la unidad tensor, la cual tal y como dijeron hace unos meses esta conmutada:

Lo esta porque comparte los registros con la unidad SIMD, lo cual es la misma solución que utiliza NVIDIA para sus tensor cores, recordad que las ALUs de la Compute Unit equivalen a los núcleos CUDA de NVIDIA.

¿Y de cual es la capacidad de las «Matrix Units»?

Recordad que los FLOPS son realizando la instrucción FMADD que permite realizar unas 2 operaciones por ciclo por ALU, esto significa que cada Compute Unit tiene 512 ALUs en total en el array sistólico, dividido en 4 unidades distintas, por lo que esto la hace comparable a los Tensor Cores de NVIDIA Volta y Turing en cuanto a capacidad de cálculo.

Super-Resolución y DirectML

Tenéis mi artículo sobre DirectML en Hardzone.

Tened en cuenta que DirectML al contrario del DLSS es un algoritmo de aumento de resolución que se puede utilizar en cualquier GPU independientemente de la compañía, el cual se adapta a cualquier tipo de hardware y no solo a los Tensor Core de NVIDIA. Os recomiendo leer el artículo para entender todo el contexto.

Es posible que veamos algoritmos de super-resolución en Xbox Series X que en Xbox «Series Y» se vean mejorados sin tocar ni una línea de código al tener una GPU nueva con un tipo de unidad mucho más rápida a la hora de hacer estas tareas.

Esto es todo, tenéis los comentarios para decir vuestra opinión de esta entrada, cualquier post fuera del tema de la misma o que sea irrespetuoso será borrado sin contemplaciones, por otro lado recordad que el blog también tiene un servidor de Discord donde podéis entrar.

5 2 votes
Article Rating
1 Comment
Oldest
Newest Most Voted
Inline Feedbacks
View all comments
Jose Luis Lerma Moreno

veo muy interesante que unas futuribles xby/ps5p puedan llevar esas características implementadas, ahora bien el problema que le veo es la capacidad de integrar esto en los soc actuales, creo que ahora mismo van bastante apretados, y no tengo muy claro que el nuevo proceso de 2nm de TSMC permita meterlo.
hay que ve lo que hemos avanzado desde el c64 y sus 160×200 (como el cpc) o el specy con 256×192.