AMD ha anunciado el lanzamiento de ROCm 6.4, su plataforma de software para GPU, que introduce mejoras significativas en inteligencia artificial (IA), computación de alto rendimiento (HPC) y gestión de infraestructura en contenedores. Esta versión representa una evolución sustancial respecto a entregas anteriores, ofreciendo rendimiento optimizado, nuevas funcionalidades para Kubernetes y herramientas de desarrollo más precisas.
Diseñado para funcionar con aceleradores AMD Instinct MI300X, ROCm 6.4 facilita el entrenamiento de modelos de lenguaje a gran escala, la inferencia optimizada y el despliegue eficiente en entornos locales o en la nube. Esta solución responde a una necesidad crítica del sector: impulsar cargas de trabajo complejas manteniendo el control sobre costes, consumo energético y escalabilidad.
Mejoras clave en frameworks de la IA y contenedores optimizados
Uno de los avances más destacados de esta actualización es la mejora sustancial del rendimiento en frameworks de IA como PyTorch, JAX y Megatron-LM. La introducción de optimizaciones en operaciones como TopK, atención escalada y SDPA permite acelerar la inferencia de modelos LLM, manteniendo coherencia y calidad en los resultados.
ROCm 6.4 también incorpora contenedores Docker preconfigurados para entrenamiento e inferencia con modelos como Llama 2, Llama 3 y DeepSeek, listos para su despliegue inmediato en entornos corporativos. Estos entornos soportan múltiples marcos, incluyendo vLLM y SGLang, facilitando una experiencia plug-and-play para desarrolladores de modelos de lenguaje.
Además, AITER, un conjunto de kernels preoptimizados, proporciona mejoras de hasta 17 veces en velocidad de ejecución para operaciones críticas como GEMM y atención, reduciendo la necesidad de ajustes manuales en los desarrollos.
Bibliotecas matemáticas y comunicación entre GPUs
En el apartado computacional, ROCm 6.4 ofrece mejoras en bibliotecas clave como rocWMMA y rocSPARSE. Las mejoras en GEMM intercalado y el algoritmo Stream-K incrementan la eficiencia computacional, mientras que las operaciones sobre matrices dispersas permiten acelerar simulaciones HPC complejas con menor uso de memoria.
En cuanto a comunicaciones, se han introducido avances en rocSHMEM y RCCL, que mejoran la comunicación entre nodos y dentro de un mismo nodo, reduciendo la congestión de red mediante una optimización de la topología de red basada en switches de capa única.
Herramientas para desarrolladores y nuevas capacidades de observabilidad
El ROCm Systems Profiler amplía sus funciones con trazado de actividad de red, análisis de OpenMP offload en C++ y monitorización de motores de vídeo (VCN). Estas herramientas permiten identificar cuellos de botella con mayor precisión y optimizar el rendimiento de aplicaciones exigentes.
Estas capacidades son especialmente relevantes para entornos multimedia, donde ROCm 6.4 añade compatibilidad con el códec VP9, además de los ya soportados HEVC, AVC y AV1, mejorando así la capacidad de procesamiento de vídeo. También incorpora soporte para procesamiento de audio orientado a modelos de voz, como operadores de espectrogramas y filtros de banco Mel.
Integración nativa con Kubernetes y soporte empresarial
En el plano de la gestión de infraestructura, ROCm 6.4 introduce un operador de GPU para Kubernetes con soporte para Red Hat OpenShift y Ubuntu, que automatiza tareas de orquestación, actualización de drivers y mantenimiento. Esta solución soporta entornos aislados o con proxies, cubriendo necesidades críticas de sectores regulados como defensa o administración pública.
El nuevo Device Metrics Exporter, basado en Prometheus, permite monitorizar métricas como errores ECC, consumo energético y utilización de memoria en tiempo real, ofreciendo umbrales configurables por el usuario para prever fallos y minimizar interrupciones.
Modularidad y soporte extendido de drivers
La modularización del stack con el nuevo Instinct GPU Driver, ahora desacoplado del espacio de usuario de ROCm, permite actualizaciones independientes del driver y del toolkit, mejora la estabilidad y facilita su uso con diversas versiones del software o de contenedores ISV. Esta modularidad está diseñada para garantizar compatibilidad hacia adelante y hacia atrás durante un período ampliado de 12 meses.