AMD Lanza la Bomba de IA: ¿Pueden Vencer a NVIDIA ahora?
Tabla de Contenidos
- Introducción
- Descripción del Instinct Mi 300X
- Arquitectura cdna A3
- Rendimiento y Ventajas del Mi 300X
- Diseño Modular y de Código Abierto
- Lanzamiento de Rockham 6
- Mi 250: Tercera generación de Infiniti Architecture
- Cuarta generación de Infiniti Architecture
- Mi 300A: El primer APU de centro de datos para IA y HPC
- Ryzer 8040 Series: Procesadores móviles de alto rendimiento
🚀 Instinct Mi 300X: El Acelerador de IA Generativa Más Potente del Mundo
¡Buenos días a todos! Sean bienvenidos a todos los que nos acompañan aquí en Silicon Valley y a todos los que se encuentran en línea alrededor del mundo. Estoy emocionado de presentarles hoy nuestro nuevo lanzamiento, el Instinct Mi 300X. Este revolucionario acelerador de rendimiento es el más potente del mundo en el ámbito de la inteligencia artificial generativa.
Descripción del Instinct Mi 300X
El Instinct Mi 300X se basa en nuestra nueva arquitectura de centro de datos, cdna A3. Esta arquitectura ha sido optimizada para ofrecer un rendimiento excepcional y una eficiencia energética sobresaliente. Con características innovadoras, el cdna A3 combina un nuevo motor de computación y soporte para formatos de datos avanzados, como fp8, además de contar con una capacidad y ancho de banda de memoria líderes en la industria.
Rendimiento y Ventajas del Mi 300X
La capacidad y el ancho de banda de memoria son cruciales para el rendimiento de la IA generativa. Es por eso que en el Mi 300X hemos tomado la decisión consciente de brindar mayor flexibilidad, capacidad de memoria y ancho de banda. Esto se traduce en una capacidad de memoria 2.4 veces mayor y un ancho de banda de memoria 1.6 veces superior al de la competencia.
Al utilizar tipos de datos de baja precisión, ampliamente utilizados en modelos de lenguaje de aprendizaje automático, las nuevas unidades de cómputo y la densidad de memoria del cdna A3 permiten que el Mi 300X ofrezca un rendimiento 1.3 veces mayor en teraflops de rendimiento fp8 y fp16 que la competencia.
La forma en que hemos construido el Mi 300X es realmente asombrosa. Comenzamos con cuatro IO die en la capa base, que cuentan con 256 megabytes de caché infinita y todas las interfaces de nueva generación necesarias, como las interfaces HBM3 de 128 canales y el soporte PCIe Gen 5. Luego, apilamos ocho chiplets aceleradores cdna A3 en la parte superior de los IO die, lo que nos permite ofrecer un rendimiento de 1.3 pedal flops de fp16 y 2.6 pedal flops de fp8. Además, conectamos estas 34 unidades de cómputo con TSVs densos (Through Silicon Vias) que admiten hasta 17 terabytes por segundo de ancho de banda.
Para aprovechar toda esta capacidad de cómputo, conectamos ocho pilas de HBM3, lo que nos brinda un total de 192 GB de memoria con un ancho de banda de 5.3 terabytes por segundo. ¡Es realmente sorprendente todo lo que hemos logrado con este diseño!
Diseño Modular y de Código Abierto
En nuestra filosofía de hacer que nuestros productos sean accesibles y fáciles de adoptar, hemos diseñado el Mi 300X de manera modular y de código abierto. Esto significa que se puede integrar fácilmente en cualquier diseño compatible con el estándar OCP (Open Compute Project), que es el estándar utilizado en la mayoría de los sistemas de IA hoy en día. Queremos que nuestros clientes puedan actualizar sus sistemas de manera sencilla, solo retirando la placa anterior e instalando la plataforma Instinct Mi 300X.
Además, hemos asegurado que el Instinct Mi 300X tenga todas las capacidades de conectividad y networking necesarias para competir con otros productos en el mercado. Soportamos PCIe Gen 5 y Ethernet de 400 gigabits por segundo, junto con un ancho de banda de sistema total de 896 Gbps. Pero lo que realmente nos destaca es que ofrecemos 2.4 veces más memoria y 1.3 veces más capacidad de cómputo que la competencia.
Lanzamiento de Rockham 6
Estoy emocionado de anunciar que lanzaremos Rockham 6 a finales de este mes. Esta versión ha sido especialmente optimizada para los modelos de lenguaje de aprendizaje automático de gran escala, con nuevas características avanzadas y una mayor eficiencia. Rockham 6 admite tipos de datos como fp16, bf16 y el nuevo fp8, lo cual proporciona un rendimiento más alto al reducir la necesidad de memoria y ancho de banda.
Hemos incorporado técnicas avanzadas de gráficos y operaciones de kernel, así como también hemos optimizado bibliotecas para mejorar la eficiencia. Además, estamos entregando potentes algoritmos de atención, como flash attention 2 y page attention, que son fundamentales para el rendimiento de los modelos de lenguaje de aprendizaje automático en 2021.
Mi 250: Tercera generación de Infiniti Architecture
Antes de presentarles el Mi 300A, quiero recordarles que lanzamos el Mi 250, que introduce la tercera generación de Infiniti Architecture. Esta arquitectura conecta una CPU épica a la GPU Mi 250 a través del bus de Alta velocidad Infinity Fabric, permitiendo que la CPU y la GPU compartan un espacio de memoria coherente y facilitando el intercambio de datos, lo cual agiliza la programación y acelera el procesamiento.
Cuarta generación de Infiniti Architecture
Hoy llevamos ese concepto un paso más allá con la cuarta generación de Infiniti Architecture, que une la CPU y la GPU en un solo paquete, compartiendo una memoria unificada. Esto da lugar a lo que llamamos una Unidad de Procesamiento Acelerado (APU), que es la primera APU de centro de datos para IA y HPC en la industria. Estamos orgullosos de anunciar que el Mi 300A ha comenzado su producción en volumen este trimestre y se está incorporando en lo que esperamos que sea el sistema de mayor rendimiento del mundo.
Hablemos ahora sobre ese rendimiento. El Mi 300A ofrece 61 teraflops de punto flotante de precisión doble (fp64) y 122 teraflops de precisión simple (fp32). Además, cuenta con 128 GB de memoria HBM3 con un ancho de banda de 5.3 terabytes por segundo. Las capacidades del Mi 300A son impresionantes y se destacan en comparación con las alternativas en el mercado. Tiene 1.6 veces más capacidad de memoria y ancho de banda que el "Hopper". En operaciones de baja precisión, como fp16, ambos tienen un rendimiento computacional similar, pero cuando se requiere precisión, el Mi 300A ofrece 1.8 veces más rendimiento en fp64 y fp32.
Ryzen 8040 Series: Procesadores móviles de alto rendimiento
Por último, pero no menos importante, me complace anunciar el lanzamiento de nuestra serie de procesadores móviles Ryzen 8040. Estos procesadores combinan nuestro rendimiento líder en la industria con una vida útil de la batería mejorada y aumentan la potencia de la IA en un 60% en comparación con la generación anterior.
Si observamos algunas de las métricas de rendimiento de la serie Ryzen 8040, veremos que, en la parte superior de la gama, el Ryzen 9 8945 es significativamente más rápido que la competencia en muchos aspectos. Ofrece un mayor rendimiento para aplicaciones de múltiples hilos, un 1.8x más de velocidad de fotogramas para juegos y un 1.4x más de rendimiento en aplicaciones de creación de contenido.
Quiero agradecer especialmente a todos nuestros socios que nos han acompañado hoy y a todos ustedes por unirse a nosotros en este emocionante evento.
¡Gracias a todos!