Los supercomputadores más rápidos del mundo cambian rápidamente

La entrada Los supercomputadores más rápidos del mundo cambian rápidamente se publicó primero en Tecnogus.

Imagen: NVIDIA – 2021

Las cargas de trabajo informáticas modernas, incluidas las simulaciones científicas, la visualización, el análisis de datos y el aprendizaje automático, están impulsando a los centros de supercomputación, los proveedores de nube y las empresas a repensar su arquitectura informática.

El procesador, la red o las optimizaciones del software por sí solos no pueden abordar las últimas necesidades de los investigadores, ingenieros y científicos de datos. En cambio, el centro de datos es la nueva unidad de computación y las organizaciones deben considerar la pila de tecnología completa.

Las últimas clasificaciones de los sistemas más potentes del mundo muestran un impulso continuo para este enfoque de pila completa en la última generación de supercomputadoras.

Las tecnologías NVIDIA aceleran más del 70 por ciento, o 355, de los sistemas en la lista TOP500 lanzados en la conferencia de computación de alto rendimiento SC21 esta semana, incluyendo más del 90 por ciento de todos los sistemas nuevos. Eso es más que los 342 sistemas, o el 68 por ciento, de las máquinas en la lista TOP500 lanzadas en junio .

NVIDIA también sigue teniendo una fuerte presencia en la lista Green500 de los sistemas más eficientes energéticamente, con 23 de los 25 sistemas principales de la lista, sin cambios desde junio. En promedio, los sistemas con tecnología GPU de NVIDIA ofrecen una eficiencia energética 3,5 veces mayor que los sistemas sin GPU de la lista.

Destacando el surgimiento de una nueva generación de sistemas nativos de la nube, la supercomputadora Azure acelerada por GPU de Microsoft ocupó el décimo lugar en la lista, la primera de las 10 principales para un sistema basado en la nube.

La IA está revolucionando la informática científica. La cantidad de artículos de investigación que aprovechan la HPC y el aprendizaje automático se ha disparado en los últimos años; pasando de aproximadamente 600 documentos ML + HPC presentados en 2018 a casi 5,000 en 2020.

La convergencia continua de las cargas de trabajo de HPC y AI también se ve subrayada por nuevos puntos de referencia como HPL-AI y MLPerf HPC.

HPL-AI es un punto de referencia emergente de cargas de trabajo convergentes de HPC e IA que utiliza matemáticas de precisión mixta, la base del aprendizaje profundo y muchos trabajos científicos y comerciales, al tiempo que ofrece la precisión total de las matemáticas de doble precisión, que es la vara de medición estándar. para los puntos de referencia tradicionales de HPC.

Y MLPerf HPC aborda un estilo de computación que acelera y aumenta las simulaciones en supercomputadoras con IA, con el rendimiento de medición de referencia en tres cargas de trabajo clave para los centros de HPC: astrofísica (Cosmoflow), clima (Deepcam) y dinámica molecular (Opencatalyst).

NVIDIA aborda la pila completa con procesamiento acelerado por GPU, redes inteligentes, aplicaciones optimizadas para GPU y bibliotecas que admiten la convergencia de AI y HPC. Este enfoque ha sobrealimentado las cargas de trabajo y ha permitido avances científicos.

Computación acelerada

La potencia combinada de las capacidades de procesamiento paralelo de la GPU y más de 2500 aplicaciones optimizadas para GPU permite a los usuarios acelerar sus trabajos de HPC, en muchos casos de semanas a horas.

Optimizamos constantemente las bibliotecas CUDA-X y las aplicaciones aceleradas por GPU , por lo que no es inusual que los usuarios vean una ganancia de rendimiento de factor x en la misma arquitectura de GPU.

Como resultado, el rendimiento de las aplicaciones científicas más ampliamente utilizadas, a las que llamamos la “suite dorada”, ha mejorado 16 veces en los últimos seis años, y se avecinan más avances.

Convergencia de HPC e IA

La infusión de IA en HPC ayuda a los investigadores a acelerar sus simulaciones mientras logran la precisión que obtendrían con el enfoque de simulación tradicional.

Es por eso que un número cada vez mayor de investigadores se está aprovechando de la inteligencia artificial para acelerar sus descubrimientos.

Eso incluye a cuatro de los finalistas del premio Gordon Bell de este año, el premio más prestigioso en supercomputación. Las organizaciones están compitiendo para construir computadoras AI a exaescala para soportar este nuevo modelo, que combina HPC e AI.

Esa fortaleza se ve subrayada por puntos de referencia relativamente nuevos, como HPL-AI y MLPerf HPC, que destacan la convergencia en curso de las cargas de trabajo de HPC y AI.

Para impulsar esta tendencia, la semana pasada NVIDIA anunció una amplia gama de nuevas bibliotecas avanzadas y kits de desarrollo de software para HPC.

Los gráficos, una estructura de datos clave en la ciencia de datos moderna, ahora se pueden proyectar en marcos de redes neuronales profundas con Deep Graph Library, o DGL, un nuevo paquete de Python.

NVIDIA Modulus crea y entrena modelos de aprendizaje automático basados ​​en la física que pueden aprender y obedecer las leyes de la física.

Y NVIDIA introdujo tres nuevas bibliotecas:

ReOpt : para aumentar la eficiencia operativa para la industria logística de $ 10 billones.cuQuantum : para acelerar la investigación de la computación cuántica.cuNumeric : para acelerar NumPy para científicos, científicos de datos e investigadores de inteligencia artificial y aprendizaje automático en la comunidad de Python.

NVIDIA Omniverse , la plataforma de colaboración y simulación del mundo virtual de la empresa para flujos de trabajo 3D, lo une todo .

Omniverse se utiliza para simular gemelos digitales de almacenes, plantas y fábricas, de sistemas físicos y biológicos, del borde 5G , robots , coches autónomos e incluso avatares .

Usando Omniverse, NVIDIA anunció la semana pasada que construirá una supercomputadora, llamada Earth-2 , dedicada a predecir el cambio climático mediante la creación de un gemelo digital del planeta.

Supercomputación nativa de la nube

A medida que las supercomputadoras asumen más cargas de trabajo en análisis de datos, inteligencia artificial, simulación y visualización, las CPU se amplían para admitir un número creciente de tareas de comunicación necesarias para operar sistemas grandes y complejos.

Como plataforma de centro de datos en un chip totalmente integrada, las DPU de NVIDIA BlueField pueden descargar y administrar tareas de infraestructura del centro de datos en lugar de hacer que el procesador host haga el trabajo, lo que permite una seguridad más sólida y una orquestación más eficiente de la supercomputadora.

Combinada con la plataforma NVIDIA Quantum InfiniBand , esta arquitectura ofrece un rendimiento bare-metal óptimo al tiempo que admite de forma nativa el aislamiento de inquilinos multinodo.

Gracias a un enfoque de confianza cero , estos nuevos sistemas también son más seguros.

Las DPU de BlueField aíslan las aplicaciones de la infraestructura. NVIDIA DOCA 1.2 , la última plataforma de software BlueField, permite firewalls distribuidos de próxima generación y un uso más amplio del cifrado de datos de velocidad de línea. Y NVIDIA Morpheus , asumiendo que un intruso ya está dentro del centro de datos, utiliza ciencia de datos impulsada por el aprendizaje profundo para detectar actividades de intrusos en tiempo real.

Y todas las tendencias descritas anteriormente se verán aceleradas por la nueva tecnología de redes.

NVIDIA Quantum-2 , también anunciado la semana pasada, es una plataforma InfiniBand de 400 Gbps y consta del conmutador Quantum-2, la NIC ConnectX-7, la DPU BlueField-3 , así como un nuevo software para la nueva arquitectura de red.

NVIDIA Quantum-2 ofrece los beneficios del alto rendimiento completo y la tenencia múltiple segura, lo que permite que la próxima generación de supercomputadoras sea segura, nativa de la nube y se utilice mejor.

La entrada Los supercomputadores más rápidos del mundo cambian rápidamente se publicó primero en Tecnogus.