Blog Personal.

Intel, Uncategorized

Bad Luck Raja

Gracias a «Eduagdo» por el aviso en el Discord.

Intel ha anunciado hoy en la presentación de resultados del segundo trimestre de 2020 que ahora han retrasado la implementación de sus CPU de 7 nm en seis meses en relación con su fecha de lanzamiento previamente planificada, lo que indudablemente provoca retrasos de gran alcance en las hojas de ruta de la compañía. El comunicado de prensa de Intel también dice que los rendimientos para su proceso de 7 nm ahora están doce meses por detrás de los objetivos internos de la compañía, lo que significa que la compañía no está actualmente en camino de producir su proceso de 7 nm de una manera económicamente viable. La compañía ahora dice que sus CPUs de 7 nm no debutarán en el mercado hasta finales de 2022 o principios de 2023.

Antes de nada hemos de aclarar que 7nm de Intel en densidad= 5nm de TSMC en densidad. La cifra en nanómetros ya no corresponde con la realidad sino con términos de marketing y no olvidemos que hay chips con el proceso de 5nm de TSMC que están ya en la rampa de salida para lanzar chips en el mercado comercial por lo que el proceso de «7nm» de Intel llega tarde al mercado y las consecuencias es que AMD va a tener un año de ventaja adicional.

En fin, sigamos con la noticia.

Aquí está el fragmento del comunicado de prensa de Intel:

«El timing de los productos de CPU basados en 7 nm de la compañía está cambiando aproximadamente seis meses en relación con las expectativas anteriores. El principal moptivo es el rendimiento del proceso de 7 nm de Intel, que según datos recientes, ahora tiene una tendencia aproximadamente doce meses por detrás del objetivo interno de la compañía».

Traducción: Nuestro nuevo proceso no nos da suficientes chips buenos por oblea para ser rentable y poder vender chips a un precio razonable en el mercado.

En la presentación de resultados, el CEO de Intel, Bob Swan, dijo que la compañía había identificado un «modo de defecto» en su proceso de 7 nm que causó problemas de degradación del rendimiento. Como resultado, Intel ha invertido en «planes de contingencia», que Swan luego definió como el uso de fundiciones de terceros. La compañía también utilizará fundiciones externas de terceros para sus próximas GPU Ponte Vecchio de 7 nm, los primeros chips gráficos de la compañía. Ponte Vecchio viene como un diseño basado en chiplet, y Swan aclaró que la producción de algunos de los chiplets (azulejos) se subcontratará a terceros. Swan señaló que las GPU llegarán a fines de 2021 o principios de 2022, presagiando un retraso más allá del cronograma original para el lanzamiento de 2021 en la supercomputadora Aurora a gran escala.

Lo de utilizar fundiciones externas para sus GPUs dedicadas es algo que deberían haber pensado hace tiempo. El hecho que pueda tener sentido dividir una CPU en Tile/Chiplets no significa que eso tenga sentido para una GPU ya que hay una serie de escollos en cuanto a ancho de banda interno a superar que resultan un desafío. ¿Sabéis el motivo por el cual la arquitectura Intel Xe esta diseñada para estar compuesta por diversos Tiles/Chiplets? Pues porque el problema del proceso de 10nm de Intel en cuanto al rendimiento de las obleas al llegar a cierto tamaño es que la cantidad de chips buenos que salen es realmente muy bajo. ¿La solución? Tirar de chiplets/tiles para aumentar el rendimiento de las obleas. Una solución que no hubiese aparecido si no fuese por los problemas del nodo de 10nm de Intel.

En todo caso… En cuanto a «Artic Sound» que es el nombre en clave de los Xe de primera generación o más conocido como Intel Xe HP que hemos visto rumoreados… ¿Dónde están?

¿Donde están que no los veo? ¡Es que no se ha visto ni un chip siquiera! Lo que se ha visto es unaconfiguración monolitica con un solo chip en forma del Intel Xe DG1 que corresponde al Xe LPno es ni un producto comercial como GPU dedicada y del que sabemos los specs a través de los benchmarks.

Se trata de un chip con unas 96 EU (768 ALUs) a 1.5 Ghz y por tanto una potencia de solo 2.3 TFLOPS. En cuanto a los Intel Xe HP estos tenían que tener una configuración de 128 EUs por cada Tile/Chiplet pero no hemos visto ni el de gama baja siquiera en ningún momento. ¿La diferencia? La unica diferencia que conocemos entre el Xe LP y los Xe HP aparte del número de ALUs es que la gama, los Xe HP en adelante tienen arrays sistolicos/unidades matriciales/tensor cores.

En realidad esas unidades ya fueron mencionadas durante en la vaporosa presentación de los Xe HPC que son la gama más alta y están pensados para computación de alto rendimiento.

Vale, Intel ha «lanzado» el Xe LP de manera comercial como GPU en los Tiger Lake y hablaron hace unos meses del Xe HPC… ¿Pero aparte de menciones en los drivers? ¿Donde esta el Xe HP en forma de producto o siendo presentados siquiera? La realidad es que toda la gama Xe HP esta cancelada desde hace tiempo e Intel decidió dar el salto a su nodo de 7nm (equivalente al de 5nm de TSMC) para lanzar el Xe de segunda generación ya como producto comercial. Nunca hubo ningún plan para lanzar los Xe HP en el mercado doméstico, especialmente las configuraciones multi-tile/multi-chiplet, es decir, Artic Sound lleva tiempo cancelada y el motivo de su cancelación en Intel es Raja Koduri quien decidió al entrar en Intel empezar un segundo proyecto.

El problema con los juegos es que en el 99% de los casos soportan solo un procesador de comandos gráficos por lo que si los 2 o 4 Tiles son GPUs completas en cada Tile entonces el Intel Xe HP en sus configuraciones de 2 y 4 tiles no tienen sentido en el mercado doméstico pero si en el de los Data Centers. ¿El problema? Intel no ha conseguido todavía ningún cliente importante para estos y hace unos meses empezaron a hablar de los Intel Xe de segunda generación a los que lhan denominado Ponte Vecchio y es realmente el trabajo de Raja Koduri y su equipo una vez entraron en Intel. Al contrario que Artic Sound, Ponte Vecchio no se compone por una cantidad de tiles/chiplets sino que es una GPU monolitica de gran tamaño que Intel no puede fabricar bajo su proceso de «10nm» y esperaba poder fabricar bajo su proceso de 7nm pero con los problemas que han tenido y el hecho que retrasar una GPU durante un año es un problema enorme en dicho mercado pues han decidido salvar la arquitectura de alguna manera buscando un fabricante externo.

Con Ponte Vecchio, el cual es llamado Xe HPC, Intel pretende ir al mercado de la computación de alto rendimiento y no al mercado doméstico y por tanto estaríamos hablando de una GPU que competiría de tu a tu contra la gama A100 de Nvidia y con el futuro AMD CDNA/Arcturus. El estreno de Ponte Vecchio tiene que ser en el Project Aurora, un super-ordenador compuesto por chips de Intel bajo su proceso de 7nm tanto CPUs como GPUs, cuya construcción se ha visto afectada por el problema con el nodo de 7nm de Intel.

Aurora esta compuesta por unas 200 cabinas del tipo Cray Shasta donde caben hasta 64 Compute Blades.

No hagáis caso de las specs de CPU y GPU, lo que hace uso el Aurora del Shasta es la cabina y nada más por lo que nos va a servir para tener una idea de la potencia teórica mínima que tiene cada chip Ponte Vecchio. Tened en cuenata que todo el Cray Aurora ha de tener una potencia de 1.5 EFLOPS, es decir 1,5^1018 FLOPS o 1 millón de TFLOPS.

Con esto podemos hacer un cálculo rápido de la potencia de cada GPU Ponte Vecchio dentro del Intel Aurora.

1*1018/(200 Cabinas*64 Blades por Cabina*6 GPUs por Blade)= 19.5 TFLOPS por chip.

Lo que lo situa en teoría y bajo esos términos al nivel del A100 de Nvidia, obviamente un chip de esta potencia es un chip enormemente grande pero debido al uso del nodo de 7nm de Intel no iba a ser tan grande como es el A100 de Nvidia ya que en densidad equivale al de 5nm de TSMC. Ahora Raja y su equipo se han encontrado con el problema de que el nodo de 7nm de Intel no consigue el rendimiento esperado y su diseño no es viable de producir. La pregunta clave es… ¿Se va a materializar alguna vez el Intel Xe en forma de GPU discreta contra las Radeon y las Geforce o tomará el camino del Larrabee? La verdad es que Raja parece estar gafado.

Esto es todo, tenéis los comentarios de esta misma entrada para comentar y no olvideis que tenemos Discord.

4.7 3 votes
Article Rating
1 Comment
Oldest
Newest Most Voted
Inline Feedbacks
View all comments
Steven

Hola dicen que el se encargada de los cpu también