DeepSeek V4: il modello cinese esclude Nvidia e AMD dall'accesso anticipato

DeepSeek lancia il modello V4 con accesso anticipato riservato ai fornitori cinesi. Esclusi Nvidia e AMD, la mossa segna una frattura geopolitica nel settore A…

Contenuto

DeepSeek V4: il modello cinese esclude Nvidia e AMD dall'accesso anticipato

Scopri anche

DeepSeek V4: il modello cinese esclude Nvidia e AMD dall'accesso anticipato

DeepSeek V4: il modello cinese esclude Nvidia e AMD dall'accesso anticipato

In questo articolo:

DeepSeek, la società cinese di intelligenza artificiale con sede a Hangzhou, si appresta a rilasciare il nuovo modello linguistico V4 segnando una rottura significativa nelle prassi consolidate del settore. Secondo quanto riportato da Reuters, l'azienda ha escluso i produttori statunitensi di chip Nvidia e AMD dall'accesso anticipato al modello, riservando questa possibilità esclusivamente ai fornitori cinesi, tra cui spicca Huawei.

La decisione interrompe una collaborazione tecnica che negli anni precedenti aveva permesso ai produttori di hardware di ottimizzare le proprie piattaforme per i nuovi modelli. DeepSeek stessa, in passato, aveva collaborato strettamente con i tecnici di Nvidia. L'accesso anticipato di diverse settimane è stato concesso ai chipmaker cinesi per consentire una messa a punto più efficace sui processori nazionali.

Le caratteristiche tecniche del modello V4

⬆ Torna su

Il modello V4 rappresenta uno degli aggiornamenti più significativi del laboratorio cinese. Secondo le fonti disponibili, si tratta di un modello multimodale, capace di generare e comprendere immagini, video e testo. Le indiscrezioni trapelate indicano un'architettura con 1.000 miliardi di parametri (1 trilione), contro i 671 miliardi totali del precedente modello R1.

L'architettura utilizza un sistema Mixture-of-Experts (MoE), dove per ogni richiesta viene attivata solo una porzione specializzata del modello, riducendo il consumo computazionale. La finestra di contesto è stata estesa da 128.000 a 1 milione di token, consentendo al modello di elaborare intere codebase o documenti di centinaia di pagine in un'unica sessione.

Tra le innovazioni tecniche figurano il sistema Manifold-Constrained Hyper-Connections (mHC), che stabilizza il flusso di informazioni tra gli strati della rete neurale durante l'addestramento, e DeepSeek Sparse Attention, un meccanismo di attenzione selettiva che riduce del 50% l'overhead computazionale rispetto ai Transformer standard.

Il tempismo politico e le Due Sessioni

⬆ Torna su

Il lancio di V4 è previsto alla vigilia delle annuali riunioni parlamentari cinesi note come le "Due Sessioni", in programma dal 4 marzo. Questo posizionamento temporale consoliderebbe l'immagine di DeepSeek come campione nazionale dell'innovazione tecnologica, inserendosi in una strategia più ampia di rafforzamento dell'autosufficienza tecnologica del Paese.

Secondo quanto riportato dal Financial Times, DeepSeek ha lavorato con i produttori cinesi di chip Huawei e Cambricon per ottimizzare il modello V4 sui loro più recenti semiconduttori. La scelta segnala uno sforzo della Cina per ridurre la dipendenza dai chip di Nvidia, attualmente soggetti ai controlli sulle esportazioni imposti da Washington.

Le accuse sull'utilizzo di hardware statunitense

⬆ Torna su

Un funzionario dell'amministrazione Trump ha dichiarato a Reuters che il modello V4 sarebbe stato addestrato su chip Blackwell di Nvidia, i più avanzati sul mercato, tramite un cluster installato nella Cina continentale. Questa operazione, se confermata, entrerebbe in conflitto con le norme sull'export americane. La stessa fonte sostiene che DeepSeek potrebbe voler eliminare le tracce tecniche che rivelano l'uso di hardware statunitense per presentare pubblicamente un addestramento basato sui chip di Huawei.

Nvidia e AMD non hanno commentato le esclusioni. Anche DeepSeek e Huawei non hanno risposto alle richieste di commento da parte di Reuters. Questo silenzio indica la sensibilità del tema in uno scenario in cui ogni iniziativa può essere letta in chiave geopolitica.

Il contesto competitivo e i costi inferiori

⬆ Torna su

DeepSeek ha dichiarato di aver addestrato il modello V3 con una spesa di circa 6 milioni di dollari, rispetto agli oltre 100 milioni investiti da OpenAI per GPT-4. Un rapporto RAND pubblicato a gennaio ha rilevato che i modelli cinesi operano a un costo compreso tra un sesto e un quarto di quello dei sistemi statunitensi comparabili.

Le proiezioni per V4 indicano costi di inferenza da 10 a 40 volte inferiori rispetto ai concorrenti occidentali. Per un contesto da 100.000 token che su GPT-4 costa circa 5,50 dollari, su DeepSeek V3.2-Exp il costo scende a circa 0,90 dollari.

Il modello sarà rilasciato sotto licenza open-source Apache 2.0, scaricabile e utilizzabile liberamente anche per scopi commerciali. Secondo un rapporto RAND, i modelli cinesi hanno conquistato oltre il 13% della quota di mercato globale delle LLM in due mesi dopo il lancio di R1, con penetrazione particolarmente forte nei paesi in via di sviluppo.

L'impatto sul mercato e le reazioni

⬆ Torna su

Secondo Ben Bajarin, CEO di Creative Strategies, l'impatto immediato per i produttori statunitensi resta contenuto, dato che DeepSeek è usato soprattutto come modello di benchmarking. I nuovi strumenti di sviluppo riducono sensibilmente i tempi necessari per adattare un modello a un determinato processore.

La crescita del laboratorio cinese è stata sostenuta da un forte interesse internazionale. Le versioni rilasciate su Hugging Face hanno superato i settantacinque milioni di download. Nel corso dell'ultimo anno, la piattaforma ha registrato un volume di download dei modelli cinesi superiore a quello di qualsiasi altro paese.

Anthropic ha accusato DeepSeek e altri due laboratori cinesi di aver condotto "attacchi di distillazione", una pratica che consiste nell'addestrare modelli più piccoli utilizzando gli output di sistemi più avanzati, replicandone le prestazioni senza sostenere gli stessi costi computazionali.

La concorrenza interna in Cina

⬆ Torna su

DeepSeek non è sola nel lancio di nuovi prodotti. Zhipu AI ha rilasciato il suo ultimo modello con funzionalità di codifica avanzate. ByteDance ha presentato Seedance 2.0 per la generazione video. Alibaba dovrebbe presentare la serie Qwen 3.5 con capacità di ragionamento matematico e di codifica migliorate.

Prima dell'affermazione di DeepSeek, alcuni leader del settore cinese sostenevano che i sistemi closed source avrebbero dominato. Pochi giorni dopo che l'assistente di DeepSeek aveva superato ChatGPT nei download dell'App Store di Apple negli Stati Uniti, aziende come Baidu hanno iniziato a rendere accessibili parti dei propri modelli.

Le implicazioni geopolitiche

⬆ Torna su

La decisione di DeepSeek contribuisce a ridefinire gli equilibri tra le grandi potenze tecnologiche. Sempre più spesso, le alleanze si costruiscono sulla base di considerazioni di sovranità e autonomia strategica. Il think tank Bruegel ha avvertito che l'emergere di DeepSeek punta verso una biforcazione in due mondi AI concorrenti — americano e cinese.

I modelli AI cinesi devono conformarsi alle normative del Partito Comunista Cinese. Ricerche condotte nel 2025 hanno dimostrato che DeepSeek R1 ragiona internamente su argomenti politici sensibili ma produce risposte allineate alla propaganda ufficiale. L'Atlantic Council prevede che entro la fine del 2026, la governance globale dell'AI sarà "globale nella forma ma geopolitica nella sostanza".

Questo articolo è una sintesi basata esclusivamente sulle fonti elencate.

Implicazioni e scenari

⬆ Torna su

L'esclusione dei produttori statunitensi dall'accesso anticipato a V4 accelera la biforcazione dell'ecosistema AI globale. La scelta di privilegiare Huawei e Cambricon segnala un consolidamento della filiera semiconduttori cinese, con conseguenze che potrebbero estendersi oltre il singolo modello.

  • Scenario 1: Se l'ottimizzazione sui chip nazionali avrà successo, altri laboratori cinesi potrebbero replicare l'approccio, riducendo progressivamente la dipendenza dall'hardware statunitense.
  • Scenario 2: Le accuse sull'utilizzo di chip Blackwell potrebbero innescare una risposta normativa più stringente da parte di Washington, con ulteriori restrizioni all'export.
  • Scenario 3: I costi di inferenza nettamente inferiori potrebbero accelerare l'adozione dei modelli cinesi nei mercati in via di sviluppo, amplificando l'influenza tecnologica di Pechino.

Cosa monitorare

⬆ Torna su
  • Eventuali accertamenti ufficiali sulle violazioni delle normative export statunitensi.
  • La risposta competitiva di OpenAI, Anthropic e dei produttori di chip occidentali.
  • L'impatto concreto sui margini e sulle strategie di pricing dei competitor globali.

Nota editoriale: questa sezione propone una lettura analitica dei temi trattati, senza introdurre dati fattuali non presenti nelle fonti.

Fonti

⬆ Torna su

In breve

  • llm
  • nvidia
  • semiconductor
  • ai-infrastructure

Link utili

Apri l'articolo su DeafNews