NVIDIA Vera: benchmarks y apuesta por IA agentiva

NVIDIA Vera, plataforma que integra múltiples chips en una arquitectura de supercomputadora de IA para reducir costos, apareció en nuevos benchmarks de Phoronix, web que se dedica a reseñar productos de hardware para Linux. Los resultados refuerzan el mensaje de que la infraestructura de IA no se juega solo en GPU.

Según la cobertura publicada por Phoronix y el material oficial de NVIDIA, Vera fue diseñada como una CPU para centros de datos orientados a lo que la industria llama IA “agéntica”: sistemas que encadenan pasos, usan herramientas, consultan datos, ejecutan código y coordinan varios procesos alrededor del modelo.

La novedad para Vera es que ahora hay resultados públicos de Phoronix comparando esta CPU con plataformas de servidor de AMD e Intel, y NVIDIA los usa para sostener que su apuesta va más allá de vender aceleradores.

En su blog, la compañía destacó rendimiento, ancho de banda de memoria y consumo de plataforma. Phoronix, por su lado, dejó una lectura más útil para el momento actual: Vera tuvo un debut fuerte, pero con pruebas iniciales centradas en los tipos de cargas para los que fue pensada.

Qué muestra este nuevo benchmark de NVIDIA Vera

En la información oficial, NVIDIA describe Vera como una CPU con 88 núcleos Olympus, hasta 1,2 TB/s de ancho de banda de memoria y un diseño orientado a sostener rendimiento cuando muchos núcleos están activos al mismo tiempo. La empresa la vincula directamente con fábricas de IA, entrenamiento, inferencia y servicios a gran escala donde hay que mover datos, lanzar herramientas, aislar procesos y coordinar software de soporte.

Phoronix publicó una revisión independiente con comparaciones frente a procesadores de servidor actuales. En su conclusión, Michael Larabel escribió que Vera superó sus expectativas y que logró un promedio geométrico 10% superior al AMD EPYC 9575F probado, además de una mejora de 1,63 veces frente a Grace en las cargas analizadas. También señaló que Vera fue especialmente competitiva frente al Intel Xeon 6980P y que, para los trabajos medidos, fue el procesador ARM para Linux con mejor desempeño que ha probado hasta ahora.

Ese resultado no equivale a una victoria cerrada en todo el mercado. El propio análisis de Phoronix aclara que hubo límites en la selección de pruebas y que todavía quedan preguntas sobre precio, disponibilidad amplia y eficiencia final en servidores de producción. Aun así, los datos ya sirven para entender la dirección técnica: NVIDIA quiere que Vera destaque en tareas como compilación, compresión, bases de datos, runtimes, Java, Python y otras piezas del flujo que acompañan a los modelos. En otras palabras, la CPU no reemplaza a la GPU, pero puede acelerar el sistema que rodea a la IA.

NVIDIA Vera y la carrera por más capas del servidor de IA

Ese punto ayuda a leer mejor la jugada de NVIDIA. Cuando se habla de asistentes de código, agentes de oficina o servicios que encadenan búsqueda, validación y ejecución, suele quedar fuera de foco el trabajo que hace el resto del servidor. Una CPU coordina llamadas a herramientas, manejo de memoria, consultas a bases de datos, ejecución secuencial y partes de la orquestación. A medida que crecen los despliegues de agentes, esa capa gana peso. Ya se ve en productos que combinan búsqueda, contexto y acciones encadenadas, como el rediseño de AI Mode de Google Search.

En su nota de prensa de marzo, NVIDIA presentó Vera como una CPU creada específicamente para la era de la IA agéntica y la conectó con una oferta más amplia de racks, fabricantes y proveedores de nube. La compañía mencionó colaboraciones con actores como Alibaba Cloud, CoreWeave, Meta y Oracle Cloud Infrastructure, además de socios de hardware como Dell, HPE, Lenovo y Supermicro. El mensaje es claro: NVIDIA quiere controlar más partes del stack, desde los aceleradores hasta la CPU, la memoria, el sistema de rack y la plataforma de despliegue.

Durante los últimos años, gran parte del foco estuvo en modelos y GPUs. Vera empuja otra idea: si los sistemas de IA empiezan a depender más de flujos largos, herramientas externas y servicios simultáneos, el cuello de botella puede moverse al conjunto del servidor. Por eso NVIDIA insiste en rendimiento sostenido, ancho de banda y eficiencia de plataforma, no solo en potencia bruta.

Fuentes

Roberto Meza Ferrari