Webinar en vivo

Tecnología AMD EPYC™ que transforma los desafíos de la IA empresarial

Descubre cómo la combinación ganadora de procesadores AMD EPYC™ y aceleradores de GPU líderes en la industria proporciona la fuerza necesaria para abordar los desafíos más exigentes de la IA empresarial.

AMD EPYC

Los procesadores AMD EPYC™ ayudan a maximizar el valor de las grandes inversiones en GPU

Los aceleradores de GPU se han convertido en la herramienta principal de la IA moderna, ya que se destacan en el entrenamiento de modelos grandes y complejos y son compatibles con una inferencia eficiente en tiempo real y a escala. Sin embargo, maximizar el potencial de tu inversión en GPU requiere un potente socio de CPU.

¿Por qué usar GPU para cargas de trabajo de IA?

Las GPU son la herramienta adecuada para muchas cargas de trabajo de IA.

  • Entrenamiento de IA: las GPU aceleran el entrenamiento de modelos grandes y medianos con sus capacidades de procesamiento paralelo.
  • Implementaciones de IA dedicadas: las GPU ofrecen la velocidad y escalabilidad necesarias para la inferencia en tiempo real en implementaciones a gran escala

La ventaja de la CPU:

combinar la potencia de las GPU con la CPU adecuada puede mejorar significativamente la eficiencia de IA para determinadas cargas de trabajo. Busca estas funciones clave de la CPU:

  • Alta frecuencia y recuento de núcleos: maneja extensas tareas de preparación y posprocesamiento de datos de forma rápida y eficiente.
  • Gran tamaño de caché: facilita el acceso rápido a conjuntos de datos masivos.
  • Alto ancho de banda de memoria y E/S de alto rendimiento: permite un intercambio de datos rápido y sin interrupciones entre la CPU y la GPU.
  • Núcleos de bajo consumo energético: libera energía para el uso de la GPU y puede ayudar a reducir el consumo general de energía.
  • Compatibilidad con la GPU y el ecosistema de software permite un rendimiento y eficiencia optimizados y un funcionamiento sin interrupciones.
GPU System

Procesadores AMD EPYC

Son tu opción ideal para liberar el verdadero potencial de tus grandes cargas de trabajo de IA. Ayudan a maximizar el rendimiento del acelerador de GPU y la eficiencia general de la carga de trabajo de IA.  Además, con funciones de seguridad avanzadas y un compromiso largo y constante con los estándares abiertos, los procesadores AMD EPYC permiten a las empresas implementar con confianza la siguiente fase en su recorrido con IA.  

Aplicaciones e industrias

Las soluciones basadas en aceleradores de GPU impulsadas por CPU AMD EPYC potencian muchas de las supercomputadoras e instancias en la nube más rápidas del mundo, lo que ofrece a las empresas una plataforma consolidada para optimizar cargas de trabajo basadas en datos y lograr resultados innovadores en IA.

CPU AMD EPYC: La elección correcta para maximizar el valor de las grandes inversiones en GPU

Las CPU desempeñan un papel crucial en la organización y sincronización de las transferencias de datos entre las GPU, el manejo de los gastos generales de lanzamiento del kernel y la gestión de la preparación de datos. Esta función de “conductor” garantiza que las GPU funcionen a la máxima eficiencia.

Optimiza el valor de inversión de la GPU con CPU de alto rendimiento

Algunas cargas de trabajo se benefician de las altas velocidades de reloj de la CPU para mejorar el rendimiento de la GPU mediante la optimización del procesamiento, la transferencia y la ejecución simultánea de datos, lo que aumenta la eficiencia de la GPU.

Para demostrar el concepto de que las frecuencias de CPU más altas aumentan el rendimiento de la carga de trabajo Llama2-7B, utilizamos CPU AMD EPYC 9554 personalizadas en un servidor 2P equipado con ocho GPU NVIDIA H1001

Ajuste de Llama2-7B
Rendimiento relativo en 2,0 GHz
1,0 veces
Rendimiento relativo en 2,5 GHz
1,12 veces
Rendimiento relativo en 3,0 GHz
1,28 veces

Entrenamiento Llama2-7B (longitud de secuencia de 1000)
Rendimiento relativo en 2,0 GHz
1,0 veces
Rendimiento relativo en 2,5 GHz
1,16 veces
Rendimiento relativo en 3,0 GHz
1,2 veces

Entrenamiento Llama2-7B (longitud de secuencia de 2000)
Rendimiento relativo en 2,0 GHz
1,0 veces
Rendimiento relativo en 2,5 GHz
1,1 veces
Rendimiento relativo en 3,0 GHz
1,14 veces

Implementa la IA empresarial de manera eficiente

Los procesadores que combinan alto rendimiento, bajo consumo energético, manejo eficiente de datos y capacidades efectivas de administración de energía permiten que tu infraestructura de IA opere al rendimiento máximo mientras optimiza el consumo energético y los costos.

Los procesadores AMD EPYC alimentan los servidores con el menor consumo energético del mundo, lo que ofrece un rendimiento excepcional y ayuda a reducir los costos energéticos2. Impleméntalos con confianza para crear soluciones de bajo consumo energético y ayudar a optimizar tu recorrido con la IA.

En los procesadores AMD EPYC Serie 9004, la administración de energía AMD Infinity ofrece un excelente rendimiento predeterminado y permite ajustar el comportamiento específico de la carga de trabajo.

Abstract illustration with glowing blue lines

Tranquilidad: Adopta la IA con soluciones de confianza

Elige entre varias soluciones aceleradas por GPU certificadas o validadas y alojadas en CPU AMD EPYC para sobrecargar tus cargas de trabajo de IA.

¿Prefieres las soluciones con tecnología de aceleradores AMD Instinct?

¿Utilizas otras GPU? Consulta por otras soluciones con tecnología de CPU AMD EPYC disponibles de los principales proveedores de soluciones de plataforma, incluidos Asus, Dell, Gigabyte, HPE, Lenovo y Supermicro.

Ecosistema creciente de opciones de instancias de CPU AMD EPYC + GPU con IA/ML en la nube

Solicita instancias que combinen la CPU AMD EPYC con GPU para cargas de trabajo con IA/ML de los principales proveedores en la nube, incluidos AWS, Azure, Google, IBM Cloud y OCI.

server room photo

Recursos

Aceleradores AMD Instinct

Especialmente adecuado para impulsar tus cargas de trabajo de IA más exigentes.

Informes sobre IA empresarial de AMD EPYC

Encuentra documentación sobre AMD y sus socios que describe la IA y la innovación en el aprendizaje automático mediante CPU y GPU

Podcasts

Escucha a los tecnólogos líderes de AMD y la industria que analizan los temas de tendencia más recientes sobre servidores, computación en la nube, IA, HPC y más.

Notas al pie
  1. SP5-292: resultados de rendimiento de ajuste y entrenamiento de Llama2-7B basados en pruebas de concepto internas de AMD realizadas al 15/6/24.

    Configuraciones del servidor: EPYC 9554 de 2P (CPU con frecuencias personalizadas, 64 núcleos/128 subprocesos, 16 núcleos activos), 1,5 TB de memoria (24 DDR5 de 64 GB a 5600 MHz funcionando a 4800 MT/s), SSD de 3,2 TB, Ubuntu® 22.04.4 LTS, con ocho NVIDIA H100 de 80 GB HBM3, HuggingFace Transformers v 4.31.0, NVIDIA PyTorch 23.12, PEFT 0.4.0, Python 3.10.12, CUDA 12.3.2.001, TensorRT-LLM v 0.9.0.dev2024, CUDNN 8.9.7.29+cuda12.2, controlador NVIDIA-SMI versión 550.54.15, TRT v8.6.1.6+cuda12.0.1.011, motor transformador v1.1

    Ajuste de Llama2-7B: BS por dispositivo = 4, seqln = 128, promedio sobre 4 series, 10 etapas por serie, FP16

    Entrenamiento de Llama2-7B (1000): BS = 56 (7x8 GPU), seqln = 1000, gradientes en GPU

    Entrenamiento de Llama2-7B (2000): BS = 24 (3x8 GPU), seqln = 2000, gradientes en GPU

    Resultados:

    Frecuencia de CPU              2000 MHz           2500 MHz           3000 MHz

    Tiempo de ejecución promedio de ajuste del entrenamiento en segundos 649,38 584,24 507,1

    Porcentaje de aumento del rendimiento 0,00 % 11,15 % 28,06 %

    Rendimiento de entrenamiento en la longitud de secuencia de 1000 276,08 238,81 230,82

    Porcentaje de aumento del rendimiento 0,00 % 15,61 % 19,61 %

    Rendimiento de entrenamiento en la longitud de secuencia de 2000 883,85 807,94 778,72

    Porcentaje de aumento del rendimiento 0,00 % 9,40 % 13,50 %

    Los resultados pueden variar debido a factores como las configuraciones del sistema, las versiones de software y la configuración del BIOS. IMPORTANTE: Este rendimiento es una prueba de concepto. Datos recopilados en AMD EPYC™ 9554 de 2P personalizado como procesador host con varias frecuencias utilizando ocho aceleradores Nvidia H100 de 80 GB. Los procesadores EPYC de 4.a generación no permiten a los usuarios finales ajustar las frecuencias

  2. EPYC-028D: SPECpower_ssj® 2008, SPECrate®2017_int_energy_base y SPECrate®2017_fp_energy_base basadas en resultados publicados en el sitio web de SPEC al 21/2/24. Resultados basados en el rendimiento de potencia del servidor y el almacenamiento (PPKW)/rendimiento de potencia del servidor VMmark® publicados en https://www.vmware.com/products/vmmark/results3x.1.html?sort=score. Las 105 publicaciones con los resultados de eficiencia general más altos ssj_ops/vatio de SPECpower_ssj®2008 correspondían todos a procesadores que contaban con tecnología AMD EPYC. Las CPU con AMD EPYC obtuvieron los primeros 8 mejores resultados en las puntuaciones de rendimiento/sistema W en SPECrate®2017_int_energy_base en el SPECrate®2017 entero (Energy Base) Las CPU con AMD EPYC obtuvieron los primeros 12 resultados en las puntuaciones de rendimiento/sistema W en SPECrate®2017_fp_energy_base en el SPECrate®2017 punto flotante (Energy Base). En el rendimiento de potencia del servidor (PPKW) VMmark®, obtuvieron los mejores cinco resultados para pares coincidentes de dos y cuatro sockets, lo que superó todos los demás resultados de sockets, mientras que en el rendimiento de potencia del servidor y almacenamiento (PPKW) de VMmark®, obtuvieron la mejor puntuación general. Consulta https://www.amd.com/en/claims/epyc4#faq-EPYC-028D para ver la lista completa. Para obtener más información sobre los objetivos de sustentabilidad de AMD, visita https://www.amd.com/en/corporate/corporate-responsibility/data-center-sustainability.html Encuentra más información sobre SPEC® en http://www.spec.org. SPEC, SPECrate y SPECpower son marcas comerciales registradas de Standard Performance Evaluation Corporation. VMmark es una marca comercial registrada de VMware en los Estados Unidos y otros países.