NVIDIA Rubin CPX: la nuova GPU dedicata all'inferenza a contesto massivo

NVIDIA annuncia Rubin CPX, una nuova classe di GPU progettata specificamente per elaborare milioni di token in applicazioni AI come coding software e video gen…

Contenuto

Scopri anche

In questo articolo:

NVIDIA ha presentato ufficialmente NVIDIA Rubin CPX, una nuova categoria di GPU progettata specificamente per l'elaborazione a contesto massivo. Questo processore consente ai sistemi di intelligenza artificiale di gestire codice software da milioni di token e video generativo con velocità ed efficienza senza precedenti.

Architettura e integrazione della piattaforma Rubin

⬆ Torna su

Rubin CPX opera insieme alle CPU NVIDIA Vera e alle GPU Rubin all'interno della nuova piattaforma NVIDIA Vera Rubin NVL144 CPX. Questo sistema integrato NVIDIA MGX racchiude 8 exaflops di potenza di calcolo AI, fornendo prestazioni AI superiori di 7,5 volte rispetto ai sistemi NVIDIA GB300 NVL72.

La piattaforma offre 100 TB di memoria veloce e una bandwidth di memoria di 1,7 petabyte al secondo in un singolo rack. Per i clienti che intendono riutilizzare i sistemi Vera Rubin NVL144 esistenti, sarà disponibile anche un tray di calcolo Rubin CPX dedicato.

Caratteristiche tecniche del processore Rubin CPX

⬆ Torna su

Basato sull'architettura NVIDIA Rubin, il GPU Rubin CPX utilizza un design a die monolitico economicamente efficiente, ricco di potenti risorse computazionali NVFP4. È ottimizzato per fornire prestazioni estremamente elevate ed efficienza energetica per i task di inferenza AI.

Rubin CPX offre fino a 30 petaflops di calcolo con precisione NVFP4 per le massime prestazioni e accuratezza. Dispone di 128 GB di memoria GDDR7 economicamente efficiente per accelerare i carichi di lavoro più impegnativi basati sul contesto.

Il processore garantisce capacità di attention 3 volte più veloci rispetto ai sistemi NVIDIA GB300 NVL72, potenziando la capacità dei modelli AI di elaborare sequenze di contesto più lunghe senza riduzioni di velocità.

Configurazioni e supporto software

⬆ Torna su

Rubin CPX è disponibile in multiple configurazioni, tra cui Vera Rubin NVL144 CPX, che può essere combinata con il fabric di calcolo scale-out NVIDIA Quantum-X800 InfiniBand o con la piattaforma di networking Ethernet NVIDIA Spectrum-X.

Il processore sarà supportato dallo stack AI completo NVIDIA, dall'infrastruttura accelerata al software enterprise-ready. La piattaforma NVIDIA Dynamo scala efficientemente l'inferenza AI, aumentando drasticamente il throughput mentre riduce i tempi di risposta e i costi di servizio dei modelli.

I processori saranno in grado di eseguire gli ultimi modelli della famiglia NVIDIA Nemotron, che forniscono ragionamento state-of-the-art per agenti AI enterprise-ready.

Vantaggi economici e casi d'uso

⬆ Torna su

Vera Rubin NVL144 CPX consente alle aziende di monetizzare su scala senza precedenti, con 5 miliardi di dollari di revenue da token per ogni 100 milioni di dollari investiti.

Gli innovatori AI stanno esplorando come Rubin CPX possa accelerare le loro applicazioni, dallo sviluppo software su larga scala all'analisi di contenuti visivi dinamici. Cursor, un'azienda software alimentata da AI, vede i benefici di Rubin CPX per aumentare la produttività degli sviluppatori con generazione di codice intelligente e strumenti collaborativi direttamente nell'ambiente di coding.

Runway, un'azienda americana di AI generativa, utilizzerà le tecnologie NVIDIA per consentire ai creatori di produrre contenuti cinematografici ed effetti visivi sofisticati con scala ed efficienza senza pari. La generazione video sta avanzando rapidamente verso contesti più lunghi e workflow creativi più flessibili guidati da agenti.

Magic, un'azienda di ricerca e prodotto AI che sviluppa modelli foundation per alimentare agenti AI in grado di automatizzare l'ingegneria del software, beneficerà della finestra di contesto da 100 milioni di token di Rubin CPX.

Innovazioni della piattaforma Rubin completa

⬆ Torna su

La piattaforma Rubin rappresenta la prossima generazione di AI, comprendendo sei nuovi chip progettati per fornire un supercomputer AI incredibile. Utilizza un codesign estremo attraverso i sei chip per ridurre i tempi di training e i costi per token di inferenza.

La piattaforma introduce cinque innovazioni, tra cui le ultime generazioni della tecnologia di interconnessione NVIDIA NVLink, Transformer Engine, Confidential Computing e RAS Engine, insieme alla CPU NVIDIA Vera. Queste innovazioni accelereranno l'AI agentica, il ragionamento avanzato e l'inferenza di modelli mixture-of-experts su larga scala con costi per token fino a 10 volte inferiori rispetto alla piattaforma NVIDIA Blackwell.

Rispetto al suo predecessore, la piattaforma NVIDIA Rubin addestra modelli MoE con 4 volte meno GPU per accelerare l'adozione dell'AI.

Questo articolo è stato redatto esclusivamente sulla base delle fonti elencate, senza aggiunte speculative o informazioni esterne.

NVIDIA Rubin CPX: la nuova GPU dedicata all'inferenza a contesto massivo

Contenuto

Scopri anche

NVIDIA Rubin CPX: la nuova GPU dedicata all'inferenza a contesto massivo

Architettura e integrazione della piattaforma Rubin

Caratteristiche tecniche del processore Rubin CPX

Configurazioni e supporto software

Vantaggi economici e casi d'uso

Innovazioni della piattaforma Rubin completa

Fonti

In breve

Link utili