NVIDIA Rubin CPX: la nuova GPU dedicata all'inferenza a contesto massivo
NVIDIA annuncia Rubin CPX, una nuova classe di GPU progettata specificamente per elaborare milioni di token in applicazioni AI come coding software e video gen…
Contenuto

Scopri anche
- AMD: volatilità del titolo e aspettative AI in vista degli utili del 3 febbraio
- AMD Prevede Crescita del Ricavo Grazie all'Aumento della Produzione di CPU per Server
- Nvidia Rubin: la nuova piattaforma AI entra in produzione con prestazioni record
- Nvidia e l'economia delle AI factories: la piattaforma Rubin e il nuovo paradigma infrastrutturale
- L'impatto dei Capex Big Tech sull'ecosistema AI e i risultati trimestrali di Nvidia
- Analisi della correzione del mercato AI: il calo dell'11% di AMD e il cambiamento di fase del settore
- Sviluppo dell'Infrastruttura AI in Africa: Investimenti, Sfide e Opportunità
- Xbox e PlayStation: La strategia dei rilasci multiplatform spiegata dal capo degli studi
- L'aumento dei prezzi dell'hardware spinge verso il cloud gaming
- NVIDIA Vera Rubin: la piattaforma AI in produzione per l'era dell'AI Agente
- Microsoft Azure già pronta per NVIDIA Rubin: infrastruttura progettata anni prima
- Steam stabilisce un nuovo record storico con oltre 42 milioni di utenti simultanei
- SynthSmith: addestramento AI con dati sintetici e nuove architetture chip
- AMD RDNA 5: primo supporto LLVM per GFX13 conferma sviluppo architettura
- Piattaforma NVIDIA Rubin: Sei Nuovi Chip per un Supercomputer AI
- Yahoo lancia Scout, il motore di risposte AI integrato nei suoi servizi
- AMD e l'Era dello Yottascale: Come l'AI Guida la Trasformazione del Compute nel 2026
- Motivair lancia MCDU-70, unità di raffreddamento da 2,5 MW per data center AI
- Le 32 Startup Enterprise Tech più Promettenti del Disrupt Startup Battlefield
- Google Search Integra Gemini 3 per una Ricerca Conversazionale e Senza Interruzioni
NVIDIA Rubin CPX: la nuova GPU dedicata all'inferenza a contesto massivo
NVIDIA ha presentato ufficialmente NVIDIA Rubin CPX, una nuova categoria di GPU progettata specificamente per l'elaborazione a contesto massivo. Questo processore consente ai sistemi di intelligenza artificiale di gestire codice software da milioni di token e video generativo con velocità ed efficienza senza precedenti.
Architettura e integrazione della piattaforma Rubin
⬆ Torna suRubin CPX opera insieme alle CPU NVIDIA Vera e alle GPU Rubin all'interno della nuova piattaforma NVIDIA Vera Rubin NVL144 CPX. Questo sistema integrato NVIDIA MGX racchiude 8 exaflops di potenza di calcolo AI, fornendo prestazioni AI superiori di 7,5 volte rispetto ai sistemi NVIDIA GB300 NVL72.
La piattaforma offre 100 TB di memoria veloce e una bandwidth di memoria di 1,7 petabyte al secondo in un singolo rack. Per i clienti che intendono riutilizzare i sistemi Vera Rubin NVL144 esistenti, sarà disponibile anche un tray di calcolo Rubin CPX dedicato.
Caratteristiche tecniche del processore Rubin CPX
⬆ Torna suBasato sull'architettura NVIDIA Rubin, il GPU Rubin CPX utilizza un design a die monolitico economicamente efficiente, ricco di potenti risorse computazionali NVFP4. È ottimizzato per fornire prestazioni estremamente elevate ed efficienza energetica per i task di inferenza AI.
Rubin CPX offre fino a 30 petaflops di calcolo con precisione NVFP4 per le massime prestazioni e accuratezza. Dispone di 128 GB di memoria GDDR7 economicamente efficiente per accelerare i carichi di lavoro più impegnativi basati sul contesto.
Il processore garantisce capacità di attention 3 volte più veloci rispetto ai sistemi NVIDIA GB300 NVL72, potenziando la capacità dei modelli AI di elaborare sequenze di contesto più lunghe senza riduzioni di velocità.
Configurazioni e supporto software
⬆ Torna suRubin CPX è disponibile in multiple configurazioni, tra cui Vera Rubin NVL144 CPX, che può essere combinata con il fabric di calcolo scale-out NVIDIA Quantum-X800 InfiniBand o con la piattaforma di networking Ethernet NVIDIA Spectrum-X.
Il processore sarà supportato dallo stack AI completo NVIDIA, dall'infrastruttura accelerata al software enterprise-ready. La piattaforma NVIDIA Dynamo scala efficientemente l'inferenza AI, aumentando drasticamente il throughput mentre riduce i tempi di risposta e i costi di servizio dei modelli.
I processori saranno in grado di eseguire gli ultimi modelli della famiglia NVIDIA Nemotron, che forniscono ragionamento state-of-the-art per agenti AI enterprise-ready.
Vantaggi economici e casi d'uso
⬆ Torna suVera Rubin NVL144 CPX consente alle aziende di monetizzare su scala senza precedenti, con 5 miliardi di dollari di revenue da token per ogni 100 milioni di dollari investiti.
Gli innovatori AI stanno esplorando come Rubin CPX possa accelerare le loro applicazioni, dallo sviluppo software su larga scala all'analisi di contenuti visivi dinamici. Cursor, un'azienda software alimentata da AI, vede i benefici di Rubin CPX per aumentare la produttività degli sviluppatori con generazione di codice intelligente e strumenti collaborativi direttamente nell'ambiente di coding.
Runway, un'azienda americana di AI generativa, utilizzerà le tecnologie NVIDIA per consentire ai creatori di produrre contenuti cinematografici ed effetti visivi sofisticati con scala ed efficienza senza pari. La generazione video sta avanzando rapidamente verso contesti più lunghi e workflow creativi più flessibili guidati da agenti.
Magic, un'azienda di ricerca e prodotto AI che sviluppa modelli foundation per alimentare agenti AI in grado di automatizzare l'ingegneria del software, beneficerà della finestra di contesto da 100 milioni di token di Rubin CPX.
Innovazioni della piattaforma Rubin completa
⬆ Torna suLa piattaforma Rubin rappresenta la prossima generazione di AI, comprendendo sei nuovi chip progettati per fornire un supercomputer AI incredibile. Utilizza un codesign estremo attraverso i sei chip per ridurre i tempi di training e i costi per token di inferenza.
La piattaforma introduce cinque innovazioni, tra cui le ultime generazioni della tecnologia di interconnessione NVIDIA NVLink, Transformer Engine, Confidential Computing e RAS Engine, insieme alla CPU NVIDIA Vera. Queste innovazioni accelereranno l'AI agentica, il ragionamento avanzato e l'inferenza di modelli mixture-of-experts su larga scala con costi per token fino a 10 volte inferiori rispetto alla piattaforma NVIDIA Blackwell.
Rispetto al suo predecessore, la piattaforma NVIDIA Rubin addestra modelli MoE con 4 volte meno GPU per accelerare l'adozione dell'AI.
Questo articolo è stato redatto esclusivamente sulla base delle fonti elencate, senza aggiunte speculative o informazioni esterne.
Fonti
⬆ Torna su- https://nvidianews.nvidia.com/news/nvidia-unveils-rubin-cpx-a-new-class-of-gpu-designed-for-massive-context-inference
- https://www.tomshardware.com/pc-components/gpus/nvidia-launches-vera-rubin-nvl72-ai-supercomputer-at-ces-promises-up-to-5x-greater-inference-performance-and-10x-lower-cost-per-token-than-blackwell-coming-2h-2026
- https://nvidianews.nvidia.com/news/rubin-platform-ai-supercomputer
In breve
- cpx
- inference
- gpu
- tokens