Cerebras redefine la IA: ¡7.000 veces más rápido que Nvidia!

Cerebras CS3 establece un nuevo estándar al superar a las GPUs y la supercomputadora más potente en simulaciones y modelos IA. ¿Cómo impactará esto en el futuro de la inteligencia artificial?
***

El Cerebras CS3 procesa 970 tokens por segundo en Llama-3.1 405B, aplastando a las GPUs más avanzadas.
Simulaciones científicas en el CS3 son 700 veces más rápidas que en Frontier, la supercomputadora más potente.
Este avance podría transformar el uso de la inteligencia artificial en ciencia y tecnología.

En el marco del evento SuperComputing ’24 en Atlanta, la startup Cerebras Systems sorprendió al mundo al anunciar avances revolucionarios en inteligencia artificial y simulación científica. Su procesador CS3, basado en la innovadora tecnología Wafer Scale Engine, no solo pulverizó a las GPUs tradicionales en velocidad de inferencia, sino que también superó a la supercomputadora Frontier en simulaciones moleculares, marcando un antes y un después en el sector tecnológico.

Un récord en inferencia de IA

La compañía demostró la capacidad de su procesador al ejecutar el modelo Llama-3.1 con 405.000 millones de parámetros, generando 970 tokens por segundo.

En comparación, las mejores GPUs del mercado no superaron los 100 tokens por segundo. Esto representa un salto sin precedentes en eficiencia para modelos de inteligencia artificial generativa, un área donde el ancho de banda de memoria es el principal cuello de botella.

El secreto radica en el uso de SRAM ultra rápida integrada en el chip, que ofrece hasta 7.000 veces más ancho de banda que la memoria HBM de las GPUs Nvidia H100.

Según Andrew Feldman, CEO de Cerebras, “ninguna supercomputadora en la Tierra puede igualar este rendimiento”, resaltando la capacidad del CS3 para acelerar tareas que antes tomaban años, a solo días o incluso horas.

Una herramienta científica revolucionaria

Además de su éxito en inteligencia artificial, el CS3 estableció un nuevo estándar en simulaciones moleculares, alcanzando 1,2 millones de pasos por segundo.

Esto equivale a realizar en un día el trabajo de dos años en Frontier, la supercomputadora más potente del mundo. Los investigadores anticipan que este avance permitirá acelerar descubrimientos en áreas críticas como la medicina y la química.

¿Quién necesita tanto poder?

A pesar de su costo estimado de USD $2-3 millones por unidad, el impacto potencial de Cerebras en la ciencia y la industria de la IA justifica la inversión.

En palabras de Feldman, “este nivel de rendimiento abre casos de uso completamente nuevos, desde razonamiento hasta colaboración multi-agente en tiempo real”.

Con la creciente demanda de modelos más complejos como GPT-40 o sistemas de IA autónoma, se espera que la necesidad de hardware de alta capacidad se dispare en los próximos años.

Un desafío para las GPUs tradicionales

Aunque Nvidia ha liderado el mercado de hardware de IA, los avances de Cerebras plantean un desafío significativo.

Mientras que los nuevos diseños de Nvidia prometen cuadruplicar el rendimiento de inferencia, aún no se acercan a la velocidad y eficiencia de Cerebras.

Esto podría empujar a la industria hacia nuevos estándares y tecnologías, dejando atrás las limitaciones de las arquitecturas actuales.

Fuentes: Presentaciones de SuperComputing ’24, datos técnicos de Cerebras Systems
Imagen original de DiarioBitcoin, de uso libre, licenciada bajo Dominio Público

 

DiarioBitcoin