Intel e SambaNova stringono partnership strategica per l'inferenza AI: presentato il chip SN50

Collaborazione pluriennale per soluzioni di inferenza AI basate su Xeon. SambaNova rivendica prestazioni 5x superiori e costi 3x inferiori rispetto alle GPU tr…

Contenuto

Intel e SambaNova stringono partnership strategica per l'inferenza AI: presentato il chip SN50

Scopri anche

Ottimizzazione dell'inferenza AI: vLLM, PagedAttention e nuovi paradigmi per i Large Language Models
AMD e Meta firmano accordo da 100 miliardi di dollari per chip AI
Intel investe 350 milioni in SambaNova e stringe partnership strategica per soluzioni AI inference
Confronto prestazionale tra GPU AMD e NVIDIA nell'inferenza AI: benchmark e analisi tecnica
AMD e Meta firmano accordo da 6 gigawatt per infrastruttura AI
La Cina accelera sulla produzione di chip AI domestici per ridurre la dipendenza da Nvidia
L'inference AI: architetture, ottimizzazioni e sfide tecniche
L'anno dell'AI agentiva: trasformazione sistemica, rischi geopolitici e la corsa alle infrastrutture
Nvidia rientra nel mercato dei laptop con processori AI: sfida diretta a Intel, AMD e Qualcomm
Accordo multigenerazionale tra Meta e Nvidia: i processori Grace entrano nei data center
Confronto tra Nvidia e Broadcom nel settore dei chip per l'intelligenza artificiale
Le chiavi BootROM della PlayStation 5 trapelano online: una vulnerabilità hardware irreversibile
AMD segna ricavi record da 10.3 miliardi nel Q4 2025, prospettiva crescita data center del 60% annuo
AMD: volatilità del titolo e aspettative AI in vista degli utili del 3 febbraio
Nvidia report earnings Q4 2026: attese da record per il test decisivo del trade AI
Intel Panther Lake: il processore Core Ultra Series 3 segna il ritorno alla produzione interna
Consumi energetici dell'IA: i dati di OpenAI e Google su query, addestramento e impatto ambientale
Analisi della correzione del mercato AI: il calo dell'11% di AMD e il cambiamento di fase del settore
Meta e Nvidia siglano partnership pluriennale per infrastruttura AI iperscalare
L'ecosistema hardware per l'intelligenza artificiale: dai chip personalizzati alla gestione del ciclo di vita del silicio

Intel e SambaNova stringono partnership strategica per l'inferenza AI: presentato il chip SN50

In questo articolo:

Intel e SambaNova Systems hanno annunciato una collaborazione strategica pluriennale finalizzata alla realizzazione di infrastrutture di inferenza AI su larga scala, basate su processori Intel Xeon e acceleratori AI SambaNova. L'accordo, reso noto contestualmente alla presentazione del nuovo processore SN50 da parte di SambaNova, prevede lo sviluppo di soluzioni rack-level per carichi di lavoro inferenziali destinati a imprese, governi e fornitori di modelli AI.

La partnership prevede l'integrazione delle tecnologie Intel — CPU, GPU, networking e memoria — con i sistemi AI full-stack di SambaNova. Intel Capital ha inoltre partecipato al round di finanziamento Serie E da 350 milioni di dollari di SambaNova, guidato da Vista Equity Partners e Cambium Capital. La collaborazione non altera la roadmap di sviluppo GPU interna di Intel, ma intende integrare un approccio infrastrutturale eterogeneo per rispondere alla domanda diversificata del mercato inferenziale.

Il processore SN50: architettura e specifiche tecniche

⬆ Torna su

SambaNova ha presentato l'acceleratore AI SN50, progettato specificamente per carichi di lavoro inferenziali piuttosto che per il training. Il processore dual-chiplet utilizza l'architettura Reconfigurable Data Unit (RDU) e integra un sottosistema di memoria a tre livelli: SRAM, HBM e DDR5. Questa configurazione consente di mantenere residenti multipli modelli per un rapido hot-swapping e ottimizzare l'utilizzo della memoria e il consumo energetico.

Secondo SambaNova, l'SN50 offre cinque volte maggior capacità di calcolo per acceleratore e quattro volte la larghezza di banda di networking rispetto alla generazione precedente. L'azienda dichiara inoltre un costo totale di proprietà triplo inferiore rispetto ai sistemi basati su GPU tradizionali. Il processore è ottimizzato per latenza ridotta, requisito essenziale per applicazioni in tempo reale come assistenti vocali, agenti AI e carichi di lavoro multimodali.

Confronto prestazionale con Nvidia B200

⬆ Torna su

SambaNova cita i risultati del benchmark InferenceX di SemiAnalysis. Nella configurazione con precisione FP8, il modello Llama 3.3 70B con 1K token di input e output raggiunge 895 token al secondo per utente sull'SN50, contro i 184 token al secondo per utente su Nvidia B200. Attraverso diverse configurazioni testate — Llama 70B, GPT-OSS 120B e DeepSeek 671B — il throughput per RDU risulta mediamente superiore di circa 3 volte rispetto a quello per GPU quando vengono applicati vincoli di latenza.

L'azienda posiziona l'SN50 principalmente come componente della soluzione rack-scale SambaRack SN50. Ogni rack da 20 kW contiene 16 processori RDU SN50, con possibilità di interconnettere fino a 256 acceleratori tramite un fabric multi-terabyte al secondo. Il consumo di 20 kW per rack rimane entro gli envelop di potenza esistenti nei data center, consentendo l'uso di raffreddamento ad aria senza modifiche infrastrutturali o ricorso al liquid cooling.

Capacità per modelli su scala trilioni di parametri

⬆ Torna su

Un cluster di 256 acceleratori SN50 è progettato per gestire modelli estremamente grandi, incluse configurazioni che superano i 10 trilioni di parametri con finestre di contesto superiori a 10 milioni di token. SambaNova identifica questa capacità come essenziale per carichi di lavoro AI agentici basati su reasoning e multi-modello, che richiedono sia scala che reattività.

L'architettura SN50 include funzionalità di agentic caching, memoria residente multi-modello e utilizzo hardware ottimizzato per ridurre il costo-per-token nelle distribuzioni su larga scala. Le spedizioni ai clienti sono previste entro la fine dell'anno, mentre i sistemi SambaRack SN50 saranno disponibili nella seconda metà del 2026.

SoftBank primo cliente per distribuzione in Giappone

⬆ Torna su

SoftBank Corp. sarà il primo cliente a distribuire l'SN50 nei propri data center AI di nuova generazione in Giappone. L'infrastruttura supporterà servizi di inferenza a bassa latenza per clienti sovereign ed enterprise nell'area Asia-Pacifico, eseguendo sia modelli open-source che modelli frontier proprietari con requisiti prestazionali rigorosi.

SoftBank ospita già SambaCloud nella regione e la nuova distribuzione espande la partnership esistente. Hironobu Tamba, Vice President e responsabile della Divisione Data Platform Strategy di SoftBank, ha dichiarato che standardizzando sull'SN50 l'azienda può offrire servizi AI con prestazioni comparabili ai migliori cluster GPU, ma con economie e controllo superiori.

Posizionamento nel mercato dell'inferenza AI

⬆ Torna su

L'industria sta spostando l'attenzione dal training all'inferenza. Secondo Gartner, il mercato inferenziale è "assolutamente aperto" rispetto al training dominato da leader come Nvidia. Le imprese richiedono strategie coerenti per integrare le capacità inferenziali nelle operazioni core. L'analista Chirag Dekate di Gartner ha rilevato che Intel sta trovando un posizionamento solido in questo contesto.

L'approccio eterogeneo proposto da Intel e SambaNova mira a formalizzare un nuovo benchmark: l'intelligenza per joule. Questa metrica cattura la qualità dell'intelligenza erogata per unità di energia consumata, rispondendo ai costi crescenti di alimentazione e raffreddamento determinati dalla domanda AI. L'architettura dataflow di SambaNova riduce gli sprechi energetici trattando i dati come flusso continuo attraverso una linea di assemblaggio AI, ottenendo utilizzo più elevato e potenza sostenuta inferiore.

Investimento Intel Capital e governance

⬆ Torna su

Intel Capital ha partecipato al round Serie E da 350 milioni di dollari, affiancando Vista Equity Partners, Cambium Capital e Battery Ventures. Lip-Bu Tan, CEO di Intel, ricopre il ruolo di chairman del board SambaNova dal 2017 ed era stato investitore早期的 attraverso Walden International. Intel ha comunicato che Tan si è astenuto dalle negoziazioni della partnership, guidate dall'EVP Kevork Kechichian, responsabile del Data Center and AI Group.

Precedenti report avevano indicato discussioni non andate a buon fine per una potenziale acquisizione di SambaNova da parte di Intel per circa 1,6 miliardi di dollari. Secondo Forrester, la scelta della partnership rispetto all'acquisizione rappresenta un investimento inferiore che permette alle aziende di dimostrare la tecnologia senza le pressioni e le distrazioni di un'acquisizione.

Strategia di go-to-market congiunta

⬆ Torna su

La collaborazione si articola su tre aree principali: espansione della cloud AI verticalmente integrata di SambaNova su infrastruttura Intel Xeon; integrazione dei sistemi SambaNova con CPU, acceleratori e tecnologie networking Intel per inferenza production-ready; iniziative go-to-market congiunte attraverso l'ecosistema partner enterprise e cloud di Intel. L'obiettivo è offrire un'alternativa all'infrastruttura AI centrata su GPU per un mercato inferenziale valutato in diversi miliardi di dollari.

Kevork Kechichian, EVP e General Manager del Data Center Group Intel, ha sottolineato che la combinazione della leadership Intel in calcolo, networking e memoria con i sistemi AI full-stack e la piattaforma inference cloud di SambaNova offre un'opzione per le organizzazioni che cercano alternative GPU per distribuire AI avanzata su scala.

Contesto competitivo e sfide di mercato

⬆ Torna su

Nvidia mantiene una quota di mercato dell'85% nei chip AI, posizione che si traduce in scala incomparabile, dominio software e fedeltà dei clienti. Giganti come OpenAI e Microsoft hanno confermato distribuzioni massicce su infrastruttura Nvidia. Per Intel e SambaNova, la sfida non è solo offrire un chip superiore, ma scalzare un leader che ha costruito un quasi-monopolio sull'infrastruttura del paradigma AI attuale.

L'industria dei semiconduttori fronteggia un paradosso: mentre l'AI traina vendite record e spinge i ricavi globali dei chip verso un picco storico, questa concentrazione crea vulnerabilità a una correzione della domanda. I chip AI ad alto valore rappresentano circa la metà dei ricavi totali ma meno dello 0,2% del volume totale di chip. Intel affronta inoltre sfide operative, con possibili ritardi per i processori desktop Nova Lake-S e aumenti di prezzo del 10-15% per le CPU server dovuti a vincoli di capacità.

Questo articolo è una sintesi basata esclusivamente sulle fonti elencate.

Implicazioni e scenari

⬆ Torna su

La partnership tra Intel e SambaNova riflette una strategia eterogenea per contendere spazio nel mercato inferenziale, dove la quota dell'85% di Nvidia lascia margini limitati ma non insormontabili. L'approccio rack-scale con consumo contenuto entro i 20 kW potrebbe appeal per data center che vogliono evitare interventi infrastrutturali costosi.

Scenario 1: Se le prestazioni dichiarate si confermano in ambienti production, l'alternativa a GPU potrebbe attrarre imprese e governi con vincoli energetici stringenti, replicando il modello SoftBank in altre regioni.
Scenario 2: La scelta della partnership rispetto all'acquisizione potrebbe rivelarsi conservativa ma prudente, permettendo a Intel di validare la tecnologia senza exposure eccessiva mentre mantiene la propria roadmap GPU interna.
Scenario 3: Il posizionamento su modelli da 10+ trilioni di parametri e carichi agentici potrebbe anticipare una domanda emergente, ma dipende dall'adozione effettiva della finestra temporale 2026.

Cosa monitorare

⬆ Torna su

Validazione indipendente dei benchmark InferenceX rispetto all'hardware Nvidia B200 in configurazioni production.
Eventuali nuovi clienti enterprise oltre SoftBank entro il lancio dei sistemi SambaRack.
Evoluzione della metrica "intelligenza per joule" come standard di riferimento per procurement infrastrutturali.

Nota editoriale: questa sezione propone una lettura analitica dei temi trattati, senza introdurre dati fattuali non presenti nelle fonti.

Intel e SambaNova stringono partnership strategica per l'inferenza AI: presentato il chip SN50

Contenuto

Scopri anche

Intel e SambaNova stringono partnership strategica per l'inferenza AI: presentato il chip SN50

Il processore SN50: architettura e specifiche tecniche

Confronto prestazionale con Nvidia B200

Capacità per modelli su scala trilioni di parametri

SoftBank primo cliente per distribuzione in Giappone

Posizionamento nel mercato dell'inferenza AI

Investimento Intel Capital e governance

Strategia di go-to-market congiunta

Contesto competitivo e sfide di mercato

Implicazioni e scenari

Cosa monitorare

Fonti

In breve

Link utili