Tras comunicar resultados financieros al alza la semana pasada, Google Cloud sitúa el foco en la infraestructura de IA y en una demanda de TPU que describe como sin precedentes. La compañía subraya una transición de la industria hacia una “era de la inferencia”, con cargas que requieren más computación, y sostiene que su catálogo de chips, desarrollado internamente durante décadas, busca impulsar esta nueva etapa de la IA combinando rendimiento y control de costes en aceleradores especializados (Ironwood) y CPU de uso general eficientes (Axion).
Google Cloud anuncia la disponibilidad general de Ironwood, su TPU de séptima generación, junto con nuevas instancias basadas en Axion Arm para uso general. En el ámbito de aceleración, Ironwood estará disponible de forma generalizada en las próximas semanas. Según los datos facilitados, ofrece hasta diez veces el rendimiento máximo de TPU v5p y más de cuatro veces el rendimiento por chip en entrenamiento e inferencia respecto a TPU v6e (Trillium). Google presenta a Ironwood como su TPU personalizada más potente y eficiente desde el punto de vista energético hasta la fecha.
La propuesta de escala es otro de los ejes. Un superpod de Ironwood puede integrar hasta 9.216 chips interconectados mediante ICI (Inter-Chip Interconnect) a 9,6Tb/s, con hasta 1,77petabytes de memoria HBM compartida, lo que apunta a reducir cuellos de botella de datos en modelos de gran tamaño. Este diseño, orientado a que miles de chips se comuniquen con baja latencia y alto ancho de banda, busca facilitar el despliegue de cargas de entrenamiento e inferencia especialmente exigentes.
En computación de propósito general, Google amplía Axion con nuevas máquinas virtuales. La instancia N4A entra en vista previa y, según Google; supera en más del doble el rendimiento de máquinas x86 comparables de la generación actual; además, la primera instancia bare-metal de esta familia, C4A metal, estará disponible próximamente en vista previa. La compañía sitúa estas opciones como base de aplicaciones de IA que requieren CPU eficientes y una relación precio-rendimiento optimizada.
La nota incorpora datos de adopción temprana por parte de clientes. Anthropic prevé acceder hasta a un millón de TPU para ejecutar sus modelos Claude; en Axion, Vimeo registró un 30% de mejora de rendimiento en N4A para su transcodificación principal y ZoomInfo cuantificó un 60% de mejora en precio-rendimiento para cargas clave de procesamiento de datos. Estos casos de uso ilustran la orientación de Ironwood a cargas de inferencia y entrenamiento a gran escala, y de Axion N4A a tareas intensivas en CPU.
De cara a la planificación, Ironwood llegará a disponibilidad general en las próximas semanas, mientras que N4A ya se encuentra en vista previa y C4A metal se incorporará a dicha fase próximamente, según el calendario comunicado por la compañía.



