NVIDIA Vera: Así es la primera CPU del mundo diseñada específicamente para la era de la IA

Roger Casadejús Pérez
Full stack web developer y SEO + miembro del blueteam en ciberseguridad web

Nvidia vera: innovación en la era de la inteligencia artificial

El contexto de la presentación de nvidia vera

En el marco de la evolución tecnológica y las innovaciones continuas, NVIDIA ha dado un nuevo paso al frente con el anuncio de NVIDIA Vera, la primera CPU del mundo ideada específicamente para la era de la inteligencia artificial agéntica y el aprendizaje por refuerzo. Este anuncio se produce junto al lanzamiento del NVIDIA DLSS 5, consolidando así el compromiso de la empresa con el desarrollo de tecnologías avanzadas que transformen el procesamiento y manejo de datos en el ámbito de la inteligencia artificial.

La tesis de nvidia: nuevos flujos de inteligencia artificial

A diferencia de las CPU generalistas que han dominado el mercado hasta ahora, NVIDIA ha diseñado Vera con una tesis clara: atender a los nuevos flujos de inteligencia artificial. En la actualidad, el cuello de botella no se localiza únicamente en el acelerador que ejecuta el modelo, sino que se extiende a la capa que coordina a los agentes, maneja datos, ejecuta herramientas, valida resultados y mantiene miles de entornos concurrentes operando simultáneamente. NVIDIA Vera busca devolverle el protagonismo a la CPU en los centros de datos dedicados a la inteligencia artificial, gestionando eficientemente estos complejos procesos.

El legado de grace y la evolución hacia vera

Vera se erige como el sucesor de Grace en la estrategia de NVIDIA para su negocio de CPU. Grace se había basado en la arquitectura Arm, utilizando núcleos Neoverse V2. En su variante C1, ofrecía 72 núcleos y hasta 480 GB de memoria LPDDR5X. Por su parte, el NVIDIA Grace Superchip integraba un diseño de doble CPU para escalar hasta 144 núcleos con un ancho de banda de 1 TB/s. NVIDIA Vera representa un salto cualitativo al incorporar 88 núcleos Olympus diseñados por NVIDIA, con 176 hilos gracias a su sistema de Spatial Multithreading. Además, ofrece compatibilidad con Armv9.2, soporte de FP8 y una arquitectura monolítica orientada a mantener baja latencia y un rendimiento previsible en cargas sensibles al movimiento de datos.

La memoria y la conexión de nvidia vera

Un punto fuerte y diferenciador de NVIDIA Vera es su capacidad de memoria. Cada CPU Vera se acompaña de hasta 1,5 TB de memoria LPDDR5X, proporcionando un ancho de banda de memoria de 1,2 TB/s. Además, mejora el enlace NVLink-C2C a 1,8 TB/s de ancho de banda coherente entre la CPU y la GPU, duplicando así la capacidad del Grace Superchip, que es de 900 GB/s. Esta mejora no solo aumenta el rendimiento, sino que también introduce capacidades como la computación confidencial, lo cual es crucial en aplicaciones modernas de inteligencia artificial que requieren seguridad y eficiencia.

La integración de cpu y gpu: un enfoque coherente

NVIDIA ha diseñado Vera no solo para que acompañe a la GPU, sino para que forme un bloque más estrecho y coherente con ella. Este diseño permite mover datos de manera eficiente, descargar KV cache, coordinar la inferencia y alimentar sistemas de fábricas de inteligencia artificial a gran escala. Un ejemplo de esta integración es el anuncio de un rack con 256 CPU Vera refrigeradas por agua, capaces de sostener más de 22,500 entornos de CPU concurrentes en un solo rack. Esta capacidad se alinea con la expectativa de que la inteligencia artificial agéntica multiplicará el número de procesos auxiliares, incluyendo herramientas, validaciones, sandboxes, compilaciones, recuperación de contexto, bases de datos, colas y coordinación entre agentes.

Nvidia como proveedor de plataforma completa

Con NVIDIA Vera, queda claro que la compañía no solo busca vender GPUs, sino ofrecer una plataforma completa que incluya CPU, GPU y memoria. Vera se integra en la plataforma Vera Rubin, donde un rack NVL72 combina 72 GPUs Rubin con 36 CPUs Vera, además de incluir SuperNICs, DPUs y el resto del stack de red y almacenamiento. NVIDIA asegura que esta configuración ofrece mejoras significativas respecto a Blackwell, como entrenar modelos MoE con una cuarta parte de las GPUs necesarias y lograr hasta 10 veces más rendimiento por vatio en inferencia, con una décima parte del coste por token.

Acuerdos y redefinición de la cpu para centros de datos

La innovación representada por NVIDIA Vera ha llevado a la compañía a cerrar importantes acuerdos con hiperescaladores y proveedores en la nube como Alibaba, ByteDance, Meta, Oracle Cloud Infrastructure, CoreWeave, Lambda, Nebius y Nscale. Además, ha colaborado con fabricantes como Dell, HPE, Lenovo, Supermicro, ASUS, Foxconn y Wiwynn. Con estos movimientos, NVIDIA intenta redefinir la CPU para centros de datos como una pieza especializada para el tráfico de la inteligencia artificial moderna, exigiendo alta eficiencia de memoria, coherencia CPU-GPU, gran ancho de banda, comportamiento predecible y buena densidad para miles de tareas auxiliares.

Conclusión: un nuevo paradigma en la era post-chatbot

En resumen, NVIDIA Vera representa una CPU diseñada para el mundo posterior al chatbot simple, adaptándose a las nuevas demandas de la inteligencia artificial que ya no solo responde, sino que planifica, ejecuta, verifica y coordina. Esta evolución marca un nuevo paradigma en el diseño de CPUs, enfocándose en satisfacer las complejas y variadas necesidades de los modernos centros de datos dedicados a la inteligencia artificial.