Blog Personal.

PlayStation 5, PS5

PS5 Uncovered (DF): Tempest Engine

El Tempest Engine es la última parte que voy a comentar del artículo de Digital Foundry y va a ser la última entrada de todas estas entradas sobre la Next Gen donde realmente no tengo más que decir que lo que ya he ido hablando en estos días y tampoco tengo planes para estar diciendo lo mismo todo el rato en una serie de Feedbacks.

Antes de nada…

Esta entrada es una extrapolación de las palabras de Cerny y no es información oficial, es como YO interpreto de manera ordenada lo que ha dicho Mark Cerny por lo que esto es una aproximación y no infomación 100% fidedigna al faltarnos varios datos todavía, pero aún así me puedo hacer una idea.

El Tempest Engine por si mismo, tal como Cerny explico en su presentación, una Compute Unit de AMD modificada la cual funciona a la frecuencia de la GPU y otorga unos 64 FLOPS por ciclo.

La afirmación por parte de Cerny es curiosa porque las CUs de las GPUs de AMD independientemente de si hablamos de GCN o RDNA soportán hasta 128 FLOPS por ciclo teniendo unas 64 ALUs por Compute Unit… ¿Que significa esto? Pues que no tenemos 64 ALUs sino una Compute Unit de 32 ALUs ya de entrada.

El rendimiento pico del Tempest Engine esta por lo tanto en la región de los 100 Gigaflops, aproximadamente al nivel del cluster de 8 núcleos Jaguar utilizado en PlayStation 4.

Se nos dice que la capacidad de cálculo son más de 100GFLOPS que tiene el AMD Jaguar de PlayStation 4 y en efecto, si hacemos la división correspondiente esto coloca el Tempest Engine a una velocidad de 1600 Mhz aproximadamente, el cual parece ser la potencia pico del Tempest Engine según Cerny,

Ahora bien, el Tempest Engine esta conectado como un acelerador o co-procesador más al Data Fabric pero para acceder a la RAM no pasa por el UMC sino que utiliza el espacio de memoria de la GPU.

«… en cuanto al ancho de banda. El Tempest Engine puede utilizar hasta 20GB/s pero hemos de ir con cuidado debido a que noq queremos que el audio le quite un pedazo (del ancho de banda) al procesamiento gráfico. Si el audio consume demasiado ancho de banda, este puede tener un efecto perjudicial si el procesamiento de gráficos quiere saturar el ancho de banda del sistema al mismo tiempo.»

Esta afirmación de Cerny nos confirma algo que yo ya sospechaba, la consola tiene dos espacios en la RAM como ocurre con Xbox Series X. El hecho de que el Tempest Engine utilice el canal de acceso a memoria de la GPU y Cerny nos hable de manera especifica de dicho canal confirma lo que dije hace unos días.

¿Pero por qué utiliza el canal de la GPU? Pues por el hecho que el Tempest Engine ha de enviar sus datos al Display Engine, el cual necesita leer del búfer de imagen y por tanto esta asignado al espacio de memoria en el que renderizada GPU que es el No-Coherente y por tanto para acceder a dicha memoria no lo hace a través del UMC conectado al Puente Norte/Data Fabric.

En realidad hay una serie de aceleradores que acceden al espacio de memoria de la GPU utilizando su ancho de banda a la GDDR6 y sustrayendolo a este:

  • Display Engine: Que lee el búfer de imagen para transmitirlo a la pantalla y/o pantallas según el caso.
  • Video Core Next: Que se encarga de descodificar y codificar vídeo, para enviar un vídeo del Gameplay a través de la red o simplemente para reproducir una cinemática. Junto al ACP forman el Multimedia Engine
  • Audio Co-Processor (no confundir con el Tempest Engine): Una serie de DSPs encargados de la reproducción de audio, junto al VCN forman el Multimedia Engine

En fin, sigamos.

Esencialmente, la GPU se basa en el principio de paralelismo, la idea de ejecutar varias tareas (u olas) de manera simultanea. El Tempest Engine funciona más en serie, significando que no hay necesidad de conectar caches de memoria.

Bueno, aquí tenemos que entrar como funciona una GPU, pero voy a hacer un simil para la vida real. Supongamos que tenemos un cine…

Las butacas del cine son las ALUs y sus registros y los espectadores las instrucciones a realizar. El visionado de la película es el tiempo que se le da a las ALUs para ejecutar el programa que trae el espectador/hilo. Obviamente vamos a tener muchas sesiones de cine pero… ¿De donde vienen los espectadores? En una GPU convencional tenemos un transporte que trae a los espectadores/hilos y los envía al vendedor de entradas que es el planificador de manera continua siendo la parada de destinto de dicho transporte la Cache de Instrucciones.

En realidad el transporte va a buscar a los espectadores a la Estación Central que es donde los Procesadores de Comandos dejan a los espectadores/viajeros para que el transporte los lleve desde la Estación Central a las diferentes estaciones que son las Caches de Instrucciones que hay en cada grupo de Compute Units.

¿Pero que ha hecho Sony con el Tempest Engine? Se ha cargado las caches de tal manera que el envío de hilos/espectadores no esta automatizado, no hay una estación/cache de instrucciones y ni tan siquiera una estación central ni Procesadores de Comandos como en una GPU compleja donde los datos y las instrucciones se van enviando hacía la Compute Unit, sino que utiliza otro mecanismo.

Cuando utilizamos el Tempest Engine, realizamos DMA en los datos, los procesamos y los sacamos fuera con el DMA otra vez. Esto es lo que ocurre exatamente en las SPU/SPE de PlayStation 3.

Es decir, han reemplazado el sistema de caches por una Scratchpad RAM o Memoria Local. ¿Pero no es lo mismo? No, no lo es desde el momento en que una memoria local es gestionada manualmente por el programa mientras que una cache no. En realidad un pozo de SPRAM funciona igual que un pozo de RAM convencional y lo que entra y sale de dicha memoria es controlado manualmente por lo que no se produce un Cache Flush que es lo que ocurre cuando una cache no tiene espacio que envía los datos al nivel inferior de la jerarquía de caches, en una SPRAM nada entra ni sale si no es de manera explicita.

La SPRAM reemplaza también a la cache de datos, la cache de datos tiene en una GPU un camino distinto a la de instrucciones ya que no se comunica con el planificador. Si un programa del Shader pide un dato concreto en memoria lo que hará será el viaje hacía la Cache de Datos que en una GPU suele estar organizada de la siguiente manera dentro de cada Compute Unit:

  • Las L/S son la unidades Load/Store (Carga y Almanamiento) que son las encargadas de cargar los datos desde la Data Cache hacía los registros, hay 4 por la presencia del TF como paso intermedio y el hecho que necesita 4 datos para la interpolación.
  • El TF es el «Texture Filter» que realiza el filtraje de texturas si es necesario tomando el valor de 4 pixeles adjacentes para interpolarlos (bilineal) pero solo lo hace si el bloque de 2×2 esta especificamente marcado para esto (Pixel/Fragment Shader) ya que en el resto de shaders no realiza la interpolación y los datos hacen bypass a esa etapa
  • Los Registros son los registros sobre el que operan las ALUs.

El cambio que ha hecho Sony en el Tempest Engine simplemente es el siguiente:

Pero esto solo ocurre a nivel interno, lo que sabemos es que en las GPUs la Cache de datos reciben los datos de manera automática de los diferentes niveles de cache pero en el Tempest Engine no hay una jerarquia de caches que vayan alimentando los datos de manera automática sino que tenemos que hacerlo manualmente a través del código.

La otra diferencia es que como he comentado antes la cache de instrucciones de la Compute Unit de una GPU esta conectada al planificador y este último va leyendo de dicha cache por lo que una GPU tenemos las caches de datos e instrucciones separadas por completo, por lo que su organización es la siguiente:

Pero si el modelo es el de los SPE entonces no hay una cache de datos e instrucciones separada y el Tempest Engine tendría la siguiente organización.

La comparativa con los SPE del CBEA es interesante porque estos tenían una unidad que hacían de MMU de los SPE y de unidad DMA para comunicarse con el resto de elementos dentro del CBEA llamada Memory Flow Controller, esta unidad era la que enviaba y recibía datos desde el exterior del SPE.

Sony ha añadido algo como el MFC al otro extremo de la SPRAM de su Tempest Enine que es lo que permite leer y escribir datos desde y hacía el exterior… ¿Pero que es el exterior? Obviamente el Tempest Engine esta conectado al Data Fabric/Puente Norte pero no para acceder a la RAM via UMC desde el momento en que no accede a dicho espacio de memoria sino para que la CPU (Zen 2) al igual que hacía el PPE con los SPE del CBEA pueda transmitirle datos o más bien una una lista de datos e instrucciones de manera directa, tened en cuenta que al contrario de una GPU, el Tempest Engine carece de Procesador de Comandos y tampoco lo necesita desde el momento en que no es más que una Compute Unit o más bien media Compute Unit recortada.

Es decir, las olas (wavefronts) a procesar así como sus datos son enviados por la CPU a través del puente norte y es donde entramos en la parte fina.

«Las GPUs procesan cientos o incluso miles de wavefronts (olas, el Tempest Engne soporta dos».

El motivo de ello es que en el caso de una GPU no paran de llegar olas mientras que en el Tempest Engine el envio de olas es manual y por tanto recursivo. Cerny no aclara cual es la longitud de cada ola, es cierto que el tamaño estándar en AMD es de 64 (GCN y RDNA) y que RDNA soporta de 32. Las diferencias entre GCN y RDNA son que en en RDNA se procesa 1 ola de 32 componentes por ciclo al asignarle unas 32 ALUs a la ola. En cambio las olas de 64 componentes son asignadas a unas 16 ALUs por lo que el tiempo minimo por ola será de 64 ciclos, si tenemos 2 olas y unas 32 ALUs lo que se deduce es que la Compute Unit derivada es del tipo GCN pero en vez de tener 4 unidades SIMD16 tiene 2 unidades SIMD16.

Tanto en GCN como en RDNA el planificador soporta unas 40 olas de 64 elementos u 80 olas de 32 elementos. Dado que tenemos la mitad de unidades SIMD esto significa que solo necesitamos medio planificador y por tanto en vez de tener 256KB (64KBx4) vamos a tener 128KB en registros y un planificador que gestione 20 olas de 64 elementos. Claro esta que en una GPU la cache de instrucciones es pequeña porque las olas son rapidamente trasladadas al planificador y de ahí a los registros pero en un sistema sin caches vamos a necesitar un espacio importante en la SPRAM que equivalga a la información de las 20 olas de 64 elementos ya que recordemos que no tenemos un mecanismo externo alimentando todo el rato

Por lo que vamos a necesitar que las 20 olas estén en la SPRAM ya de antamano, esto hace que esta tenga que tener un tamaño minimo de 128KB y eso sin contar los datos adicionales que puedan llegar a tener. Dadas las comparaciones de Cerny con los SPE podemos asumir que la SPRAM del Tempest Engine podría ser de 256KB en total, aunque es una cifra que desconocemos.

Esto es todo, tenéis el Discord y los comentarios de esta entrada para comentarla.

0 0 vote
Article Rating
40 Comments
Oldest
Newest Most Voted
Inline Feedbacks
View all comments
Snake128

Lo entiendo simplemente es para que le eches un vistazo, no hace falta que comentes a nivel de blog.

nolgan

si lo dijera uno de windows central y fuera sobre xsx seria verdad absoluta, ahora lo dice gente de remedy y gente de crytek supuestamente gente IMPARCIAL… y ya lo estan tachando de mentiras… en monton de sitios.. habla de lo que hemos estado hablando.. que los 12 tf son teoricos, que ps5 es mas facil alcanzar su tope de tf que xsx, que es mas dificial por muchas cosas que dice.. que no solo es tf y la gpu en potencia bruta si no todo lo qeu tengas al rededor que suministre velociad a la gpu, y que segun… Read more »

Jorge

Ya te dije el otro dia la payasada y el clickbait de Windows Central… y te lo vuelvo a decir ahora. Eres libre de pensar lo que quieras. Pero estas cosas ya sabemos como funcionan. Si recuerdo bien lo de Remedy fue en la revista oficial de Playstation y todo lo que dice el de Crytek casualmente es lo mismo que ha dicho Cerny… Supuestamente dice esto: How have you experienced working with both consoles and how do you evaluate them? I can’t say anything right now about my own work, but I’m quoting others who have made a public… Read more »

Snake128

Parece que se ha saltado el NDA y ha pedido que borren la entrevista.

Jorge

No me creo que se pueda cometer semejante error de aficionado. Si todo esto es verdad que ni idea.. imagino que tiron de orejas de los jefazos por parecer un fanboy de PlayStation (llamadita de Microsoft) o llamadita de Sony por hablar mas de la cuenta y que en Xbox se puedan poner las pilas. A mi sinceramente no me ha parecido muy profesional por muchas verdades que diga o cosas interesantes que pueda decir. Otras cosas viniendo del mundo PC me han parecido realmente pobres y vacias. Es que es de cajon que si tu no eres first party… Read more »

nolgan

https://wccftech.com/ps5-better-console-xsx-bottleneck-crytek/ creo que no dice todo , en este hay mas infromacion y mejor explicada aqui traducida un chaval en vandal la tradujo con san google «DEJO LA ENTREVISTA ENTERA (TRADUCIDA POR GOOGLE PERO SE ENTIENDE) ya que el resumen de Vandal deja muchas cosas en el tintero para quien quiera informarse de verdad de hardware: INTRO Las especificaciones de hardware de PlayStation 5 y Xbox Series X fueron anunciadas oficialmente hace unas semanas por Sony y Microsoft, y Digital Foundry tuvo la oportunidad de analizar en profundidad lo que esperamos. Aunque todavía no hay muchos juegos para consolas, y… Read more »

Schneider

Tanta superioridad de PS5, mmm cuesta creerlo.
En PC no se optimiza nada bien, pero si tú coges una 2080ti y una 2080, y las comparas. En rendimiento la 2080ti siempre gana y por bastante a la 2080. Curiosamente las 2080ti tiene más cores y un bus de memoria con más bits, pero menos velocidad que la 2080 normal. Igual tendría que pasar con la GPU de la Xbox Series X y la de PS5.

Snake128

Pasaría igual si la programación fuera la misma, pero al ser consolas distintas el código a bajo nivel es totalmente distinto, lo unico que ha dicho el chico, es que ps5 es más facil de programar y de aprovechar el máximo durante más tiempo.

Jorge

Bueno… no solo ha dicho eso jeje

La perlita hablando de que Vulkan es una API vieja… y que solo las de PlayStation pueden digievolucionar…

Parece mas un first party de Playstation que de Crytek. Oyes que lo mismo junto a PS5 nos traen un nuevo Crysis bien optimizado y yo tan contento.

Snake128

Hay tres o cuatro frases que se han sacado de contexto, o eso me ha parecido a mi, de todas formas se le notaba más a favor de ps5

Jorge

Mira, Snake128. Ya no entro en el contenido o que sea fan de Sony. Es que a mi sinceramente me da igual. A mi es que toda la entrevista y con todos esos terminos normal no me parece. Joder que yo soy un pelele pero de las cosas que dice del PC no parece muy puesto. Y ya digo que a mi casi que me parecen un copia y pega de lo dicho por Cerny. Ya luego que todo esto se acabe cumpliendo pues mira mejor para los desarrolladores. Pero a mi todo esto de hoy me parece mas un… Read more »

Snake128

Estoy deacuerdo en todo lo que dices, y lo de la esram que puso es que xbox vuelva a tener varios pozos de memoria para trabajar, cosa que en ps5 no es así.

Jorge

Pero es que lo esram era otra memoria. No estaba separada y sobre todo que al final no era todo lo grande que deberia ser?

Claro que entiendo lo que quiere decir pero como digo es que son conceptos differentes. Digo yo que con 10GB de memoria rapida tienen de sobra.

Que la opcion de Sony junto lo del SSD es mejor al final? Pues lo mismo.

nolgan

xacto, pero mejor NO implica que la otra sea una mierda… ni mucho menos.. lo que tiene que entender la gente.. que la diferencia son MINIMAS entre las 2

y si una tiene un cuello de botella en al memoria ya se encargaran de resolverlo , pero vamos…. segurisimo!

ademas con el tema de tirar del ssd para leer directo desde ssd las texturas… se va a nesesitar mucha menos memoria…

Isaac

Iva a decir éso, que trabajan en un exclusivo pa Sony. Que Sony se haya hecho dev friendly parece raro (si es verdad me alegro)
Y ya me pongo a delirar: ya que Naughty Dog trabaja en TLOU2 y en su multijugador como juego completo,Sony encargó a Crytek que desarrolle Uncharted 5, gráficas y físicas realistas, gameplay y trama irreal. Por su parte Crytek también portaria Uncharted 1-4 a PC llevándose una tajada

Jorge

Creo yo que a Crytek le quedan cuatro telediarios. Su motor grafico en comparacion a Unreal o Unity lo deben de usar cuatro gatos. Ahora mismo algo interesante de lo ultimo que me venga a la cabeza pues vender motor grafico a Amazon y el juego
Kingdom Come: Deliverance.

Y varios peces gordos del Cryengine se fueron a id software.

nolgan

yo creo que tanto la gente de remedy y la gente de crytek y mas estudios que llevan diciendo desde hacetiempo esto mismo, por algo sera.. en ningun momento se dice que ps5 sea mas potente.. pero claro si de una es mas facil sacar rendimiento y la otra no.. pues.. al final… solo es ver RE3 40 fps en xonex en media baja calidad y 60fps en ps4pro en media alta calidad.., pasa en monton de juegos… como micro exige 4k nativos pues hala tenemos que bajar el nivel de detalle y ademas repercute en los fps.. RE3 no… Read more »

Jorge

Pensaba pasar de todo esto pero es que no puedo… 1. Has leido algo de lo que yo he puesto? Me la pela la potencia de cada consola. Yo estoy feliz sobre todo por dejar atras el maldito Jaguar y abrazar Ryzen. 2. Ya te he dicho que no entro lo que digan cada uno de ellos. Te he dado un contexto. La gente de Remedy hablaron para un medio oficial de Sony. Te crees que se van a poner a hablar de algo como la Nintendo Switch? 3. Solo por curiosidad. En que te basas para decir que Xbox… Read more »

Jorge

8. Voy a seguir pensando que lo de las frecuencias de la GPU de PS5 tuvo mucho que ver la cifra de la nueva Xbox. 9. Viendo la entrevista de Cerny y luego como se vende todo desde los pelotas que la PS5 se ha hecho pensando en los desarrolladores y los de Xbox solo pensando en tenerla mas grande. Ya somos mayorcitos. Que nos conocemos todos ya. Todos sabemos el motivo del no crossplay por parte de Playstation y no la chorrada oficial. Y todos sabemos el motivo de Xbox de llevar los juegos a PC y no la… Read more »

nolgan

a ver… que manipulas las cosas .. o te las inventas… aqui nadie esta diciendo que una ps5 tenga igual o mas potencia que una rtx2080ti en la entrevista si la lees creo que no la has leido, habla de xsx y no habla de la gpu de ps5 vs rtx2080ti, lee lo que e puesto… porque creo que NO lo has leido habla de la memoria de ps5 vs xsx y del «cuello» de botella que tiene xsx que eso hara que se saque menos rendimietno a xsx, y que cueste mucho mas tiempo sacarle ese rendimiento, segun comentaque… Read more »

Schneider

Creo que el que no lees bien eres tú, en ningún caso yo he comparado la PS5 con las rtx2080ti. He puesto un ejemplo, que según mi opinión es similar a comparar PS5 Vs Series X, que es la comparación rtx2080 Vs rtx2080ti. Ya que la primera tiene más frecuencia que la segunda, pero la segunda tiene más cores y un bus mayor. Y en rendimiento la segunda es muy superior. El tema de la memoria asimétrica/dividida no creo que sea un problema para sacarle el máximo rendimiento a la Series X porque ya habido en el pasado tarjetas gráficas… Read more »

MASS

@Schneider. No jodas, lo que has dicho de la GTX 970 es mentira y otras cosas mas bien las dejas en un contexto que no es. GTX 970. 1) Desde luego que las GTX 970 de «4GB» tienen problema conque al final llevaran solo 3.5GB buenos de vram y 512MB malos, eso definitivamente les quita rendimiento cuando se require de la mayor cantidad de Vram posible y mas en la actualidad donde existen juegos que sobrepasan el consumo de 4GB de vram…y tu vienes a decir que «no afecto» el rendimiento???. :v * Afectar el rendimiento no quiere decir que… Read more »

Snake128

Muy buena entrada por cierto.

Jorge

Ya lo ultimo que voy a decir del tema Crytek. Cada uno que piense lo que quiera. Junto a Navi exclusivo de Sony, PS5 RT por software, SSD magico, APIs magicas ya sean de Playstation o Xbox, PS5 no es RDNA2 del todo, VRS solo Xbox,DirectML, frecuencias variables, tontoflops, PS5 se calienta,etc. Todas estas mierdas empiezan a cansar. Cuando un trabajador de Crytek te dice que no trabaja con las nuevas consolas, que todo lo que ha dicho es basado en la informacion que todos tenemos y habla de Vulkan como API antigua pues a mi cuanto menos profesional no… Read more »

Set

En mi humilde opinión, todo el que diga que en xbox o PS5 es mas fcil desarrollar en su Arquitectura es marketing de alguna de las 2 empresas, hay que tener una cuenta que las 2 consolas comparten la misma arquitectura Zen 2 y RDNA 2, aqui no estamos hablando de diferencia de la PS3 y 360, con el famoso cell.

Talvez lo único que pueda marcar diferencia en facilidad de desarrollo es la API de cada una y poco mas.

Big crunch

En consolas se baja más a bajo nivel que en pc.

MASS

Lo del Close to Metal en realidad es mas aprovechado por las Desarrolladoras First Party y quizas las Second Party de cara a juegos EXCLUSIVOS de verdad (que no salgan en otras consolas y en PC)….para los Multiplataformas, nope.

Tokra_Kree

Buenos días Urian.
Podrias explicarme porque Tempest Engine ha de enviar sus datos al Display Engine.
¿Que relación hay entre el procesamiento del sonido y de los gráficos?

Jorge

Creo que llegas tarde a la fiesta ,)

Jorge

Con todo el respeto del mundo pero que elchapuzas lo tengais como medio de informacion cuando es puro salseo… de las noticias para generar comentarios… No pensaba seguir con esto pero joder… https://elchapuzasinformatico.com/2020/04/remedy-tambien-se-situa-a-favor-de-la-playstation-5-ofrece-una-mejor-experiencia-no-todo-son-los-graficos/ Sin entrar en lo que digan los de Remedy. Pero es como funcionan estas mierdas que por ejemplo hoy te saca el chapuzas. La info viene de una revista oficial de Sony como cuando mi madre me dice que soy el mas guapo y listo. Pero sobre todo que la info ya se hizo publica porque es de diciembre del año pasado. Revista PlayStation de diciembre del… Read more »

jonathan

la igual la pagina, el punto era lo que supuestamente decian remedy y crytek, culpa mia no leer todos los comentarios, aqui son 8 horas menos que en españa

Jorge

Como cansa ya bastante esto de las cajitas de plastico. Algun fan como yo del Mafia II ? Parece que se viene remaster. Esperemos que se lo hayan currado.

Jorge

Y bueno por supuesto muchas gracias a Urian por las molestias y tiempo que dedica a escribir estas entradas.

Yo como ya he dicho anteriormente pues no soy muy fan del audio pero si al final lo de Sony sirve para arrastrar a la industria y tengamos mejores juegos con mayor inmersion pues bienvenido sea. Tambien se agradece si esto sirve para democratizar el audio y no nos intenten vender sus auriculares como con PS4.

MASS

Al jugar con PS2/PS3/Multiemdia disfrute enormemente de un Teatro en Casa 5.1 con entrada digital Optica, aunque en ambiente PC (desde el año 2000) la verdad todol o he mantenido en Audio Stereo y desde hace un tiempo mas porque mi Teatro en Casa paso a mejor vida, asi que la idea de comprar una Tarjeta de Sonido compatible con Dolby Digital Live y/o DTS Connect/Neo (para la PC) pues la abandone en su momento. Muchos usuarios de PC privilegian otras cosas y dejan al audio multicanal como en el ultimo rincon de necesidades, lo cual me parece un error…ojala… Read more »

Big crunch

Machine Learning y DLSS en Oculus Quest, hardware de móvil

https://uploadvr.com/facebook-ai-quest-superres/

También usan IA para el tracking usando los DSP, y es lo que ha permitido que Quest tenga tracking de calidad y de tipo 6DOF en visor y mandos.

https://uploadvr.com/schrep-quest-tracking-impossible/

Big crunch

Y añado link de Qualcomm:

https://www.qualcomm.com/news/onq/2017/01/09/tensorflow-machine-learning-now-optimized-snapdragon-835-and-hexagon-682-dsp
comment image?itok=a_5cZe9-

¿Las gpus sin tensor cores no podrían hacer lo mismo? Usar los DSP como tensor cores por ejemplo en las geforce 1.060, la gpu más vendida entre usuarios de Steam (15% de ellos)