La microarquitectura del procesador M2 de Apple
La microarquitectura del procesador M2 de Apple. Ya están aquí. Las filtraciones de los últimos días nos invitaban a sospechar que el primer procesador de la familia M2 de Apple podría ver la luz durante esta edición de la WWDC (Worldwide Developers Conference), y finalmente ha sido así. Los primeros equipos que integrarán este chip serán el rediseñado MacBook Air y el MacBook Pro de 13 pulgadas, pero no cabe duda de que durante los próximos meses llegará a otras propuestas de esta marca. Si tienes alguna inquietud recuerda contactarnos a través de nuestras redes sociales, o regístrate y déjanos un comentario en esta página. También puedes participar en el WhatsApp. Si usas Telegram ingresa al siguiente enlace.
Apple no suele desvelar los detalles más profundos acerca de la microarquitectura de sus procesadores (en este terreno Intel y AMD sí suelen apaciguar el apetito de los entusiastas a los que nos gusta indagar en sus propuestas). Aun así, durante la presentación de los chips M2 los de Cupertino nos han entregado la información que necesitamos para formarnos una idea precisa acerca de qué es lo que nos promete esta CPU.
Y lo que nos promete, muy a grandes rasgos, es más potencia y una relación rendimiento/vatio superior a la que nos entrega el microprocesador M1. No obstante, esto no es todo. La información que tenemos acerca de este chip nos permite intuir qué nos propondrán los procesadores M2 Pro, M2 Max y M2 Ultra cuando lleguen. Y llegarán. De eso podemos estar seguros. Así se las gasta el nuevo microprocesador de Apple.
El procesador M2 de Apple, en cifras
M2
M1
FOTOLITOGRAFÍA
5 nm (segunda generación)
5 nm
NÚMERO DE TRANSISTORES
20 000 millones
16 000 millones
FABRICANTE
TSMC
TSMC
NÚMERO DE NÚCLEOS DE CPU
8
8
NÚCLEOS DE ALTO RENDIMIENTO (AR)
4
4
NÚCLEOS DE ALTA EFICIENCIA (AE)
4
4
CACHÉ INSTRUCCIONES (AR)
192 KB
192 KB
CACHÉ DATOS (AR)
128 KB
128 KB
CACHÉ INSTRUCCIONES (AE)
128 KB
128 KB
CACHÉ DATOS (AE)
64 KB
64 KB
CACHÉ L2 COMPARTIDA NÚCLEOS AR
16 MB
12 MB
CACHÉ L2 COMPARTIDA NÚCLEOS AE
4 MB
4 MB
NÚMERO DE NÚCLEOS GRÁFICOS
10
8
RENDIMIENTO FP32
3,6 TFLOPS
2,6 TFLOPS
NÚCLEOS NEURAL ENGINE (NE)
16
16
RENDIMIENTO LÓGICA NE
15,8 TOPS
11 TOPS
MAPA MÁXIMO DE MEMORIA UNIFICADA
24 GB
16 GB
TECNOLOGÍA DE MEMORIA PRINCIPAL
LPDDR5-6400
LPDDR4X-4266
ANCHO DE BANDA DE MEMORIA UNIFICADA
100 GB/s
68 GB/s
CODIFICACIÓN Y DECODIFICACIÓN DE VÍDEO
8K H.264, H.265, ProRes y ProRes RAW
4K H.264 y H.265
CONECTIVIDAD
2 x Thunderbolt 3/USB 4
2 x Thunderbolt 3/USB 4
Las mejoras de la microarquitectura del chip M2 son prometedoras
Desafortunadamente la información que ha desvelado Apple acerca de las mejoras que ha implementado en la microarquitectura del procesador M2 no es tan profunda como nos habría gustado. No conocemos qué innovaciones ha introducido en el cauce de ejecución, cómo funcionan los nuevos algoritmos de predicción de bifurcaciones del código o cómo es la política de administración de los distintos subniveles de memoria caché, entre otras particularidades de cada microarquitectura.
Aun así, tenemos la información que necesitamos para atar algunos cabos importantes. Empecemos por el principio. Sabemos que el procesador M2 está siendo fabricado por TSMC en su nodo de 5 nm, pero no es el mismo equipo fotolitográfico en el que esta compañía taiwanesa está produciendo los chips M1, que también utilizan la tecnología de integración de 5 nm; el microprocesador M2 está siendo fabricado empleando fotolitografía de 5 nm de segunda generación. La lástima es que todavía no sabemos qué mejoras concretas introduce esta revisión del proceso litográfico, pero tan pronto como las conozcamos indagaremos en ellas en un nuevo artículo.
Otro dato interesante: el procesador M2 aglutina 20 000 millones de transistores, mientras que el M1 incorpora 16 000 millones. Los 4000 millones de transistores adicionales responden, como podemos intuir, a las modificaciones que los ingenieros de Apple han introducido en la microarquitectura. Eso sí, ambos chips incorporan la misma cantidad de núcleos de CPU: 4 de alto rendimiento (AR) y otros 4 de alta eficiencia (AE).
Es muy razonable prever que la política de administración de los distintos subniveles de caché, y quizá también su latencia, sean diferentes en los chips M1 y M2
Las memorias caché de instrucciones y datos vinculadas a los núcleos AR y AE tienen el mismo tamaño en los chips M2 y M1 (en la tabla de especificaciones que publicamos encima de estas líneas indicamos su capacidad). Por otro lado, los núcleos AE acceden en ambos procesadores a una memoria caché compartida de nivel 2 con una capacidad de 4 MB, pero, y aquí el chip M2 se desmarca del M1, los núcleos AR en el nuevo procesador de Apple tienen a su alcance una caché compartida de nivel 2 con una capacidad de 16 MB, mientras que en el chip M1 esta cifra se reduce a 12 MB.
Como acabamos de ver, solo la caché compartida de nivel 2 a la que acceden los núcleos de alto rendimiento ha incrementado su capacidad en el procesador M2, pero esto no significa que esta sea la única diferencia que ha introducido Apple en el subsistema de memoria caché. Es muy razonable prever que la política de administración de los distintos subniveles de caché, y quizá también su latencia, sean diferentes en los chips M1 y M2. Este último sobre el papel debería verse favorecido por las mejoras que han introducido los ingenieros de Apple.
El alcance de las novedades no se limita solo a los núcleos de propósito general del procesador M2; la lógica gráfica también ha sido rediseñada, aunque por el momento Apple no ha desvelado apenas detalles que nos permitan intuir la magnitud de los cambios que ha implementado en la GPU integrada. Lo que sí sabemos es que el chip M2 incorpora 10 núcleos gráficos (dos más que el procesador M1), y también que su rendimiento en operaciones de coma flotante de precisión simple (FP32) es de 3,6 TFLOPS, lo que le permite aventajar en 1 TFLOP al chip M1.
Con el motor de inteligencia artificial implementado en estos microprocesadores sucede esencialmente lo mismo.
No conocemos con detalle en qué se diferencia la lógica Neural Engine de los chips M2 y M1, pero Apple ha confirmado que ambas tienen el mismo número de núcleos: 16. Eso sí, no son iguales. Y sabemos que no lo son debido a que el motor de IA del chip M2 es capaz de llevar a cabo 15,8 billones de operaciones por segundo, mientras que el del M1 roza los 11 billones de operaciones por segundo. En ambos casos se trata de billones de los nuestros, no de los anglosajones.
Antes de seguir adelante merece la pena que indaguemos en las características de la memoria principal unificada del procesador M2. A diferencia del chip M1, que ‘solo’ puede convivir con 16 GB de memoria, el M2 puede acceder a un mapa unificado de 24 GB. Además, esta memoria es en el nuevo chip de Apple de tipo LPDDR5-6400, mientras que en el procesador M1 utiliza la tecnología LPDDR4X-4266. Esta modificación, y este dato es muy importante, permite a la interfaz de la memoria unificada del M2 alcanzar un ancho de banda de hasta 100 GB/s, mientras que la interfaz de memoria del M1 se conforma con unos más comedidos 68 GB/s.
Ya hemos indagado en los elementos de la lógica del procesador M2 más relevantes, pero antes de pasar a la siguiente sección del artículo merece la pena que echemos un vistazo a otro ámbito en el que, sobre el papel, Apple ha hecho los deberes: las normas de codificación de vídeo con las que su nuevo procesador puede lidiar. Según los de Cupertino su chip M2 puede reproducir contenidos con resolución máxima 8K codificados en los formatos H.264, H.265, ProRes y ProRes RAW, mientras que el procesador M1 está capacitado para lidiar con contenidos 4K UHD H.264 y H.265.
Así rinde el procesador M2 (según Apple)
En la siguiente diapositiva podemos ver que, según Apple, el microprocesador M2 integrado en el nuevo MacBook Pro casi consigue duplicar el rendimiento de un portátil Galaxy Book2 360 de Samsung equipado con una CPU Intel Core i7‑1255U y 16 GB de RAM cuando ambos arrojan un consumo de algo menos de 15 vatios.
El chip M2 integrado en el nuevo MacBook Pro casi consigue duplicar el rendimiento de un portátil Galaxy Book2 360 de Samsung cuando ambos consumen 15 vatios
Y a igual consumo el chip de los de Cupertino siempre entrega un rendimiento claramente mayor que el del procesador de Intel. Cuando tengamos la oportunidad de analizar el primer ordenador de Apple equipado con un procesador M2 que caiga en nuestras manos comprobaremos si, efectivamente, su rendimiento por vatio es tan atractivo como defiende Apple.
La siguiente gráfica compara el rendimiento del nuevo MacBook Pro equipado con un procesador M2 y el mismo Galaxy Book2 360 de Samsung dotado de una CPU Intel Core i7‑1255U y 16 GB de RAM de la gráfica anterior. ¿El resultado? Cuando ambos consumen 15 vatios la lógica gráfica integrada en el chip M2 multiplica por 2,3 el rendimiento de los gráficos del procesador de Intel.
Cuando ambas lógicas gráficas nos entregan un rendimiento relativo ligeramente inferior a 60 el procesador M2 consume un 80% menos que el chip de Intel
Y cuando ambas lógicas gráficas nos entregan un rendimiento relativo ligeramente inferior a 60 el procesador M2 consume un 80% menos que el chip de Intel. En cualquier caso, por el momento lo más prudente es que recojamos estos datos con cierto escepticismo debido a que Apple, como todos sabemos, es parte interesada. Será muy esclarecedor comprobar por nosotros mismos si el procesador M2 está realmente a la altura de las expectativas cuando el primer ordenador equipado con este chip caiga en nuestras manos.