ChatGPT: l'evoluzione da GPT-3.5 a GPT-5.4 Thinking e la nuova era agente

OpenAI accelera lo sviluppo di ChatGPT con GPT-5.4 Thinking, finestra contestuale da 1 milione di token e capacità agentiche. Nuove policy e oltre 700 milioni…

Contenuto

ChatGPT: l'evoluzione da GPT-3.5 a GPT-5.4 Thinking e la nuova era agente

Scopri anche

ChatGPT: l'evoluzione da GPT-5 a GPT-5.4 Thinking e la strada verso l'AGI
ChatGPT: evoluzione dei modelli GPT-5, capabilities agentiche e nuove policy di sicurezza
iOS 26.4: playlist generate dall'AI, fix della tastiera e 35 vulnerabilità corrette
ChatGPT: come funziona realmente e perché gli utenti ne percepiscono i limiti
Arm AGI CPU: il primo silicio di produzione propria per l'AI agentica nei data center
L'integrazione tra SEO tradizionale e GEO: l'evoluzione verso i motori di ricerca generativi
OpenAI e Nvidia: 110 miliardi di dollari per ridefinire l'infrastruttura AI
Data poisoning: bastano 250 documenti per compromettere un modello AI
L'evoluzione degli LLM: dal testo all'intelligenza agentica, il panorama 2025-2026
L'AI diventa infrastruttura: tutti gli annunci chiave del GTC 2026 NVIDIA
Twin Transition: l'integrazione tra trasformazione digitale e sostenibilità nelle imprese italiane
Data poisoning: quando 250 documenti bastano per compromettere un modello AI
I bias cognitivi nei Large Language Models: un'analisi delle distorsioni strutturali
NVIDIA rilascia Nemotron-Cascade 2: modello MoE da 30B con soli 3B parametri attivi per reasoning avanzato
Samsung e AMD firmano accordo strategico per memoria AI di nuova generazione
OpenAI unifica ChatGPT, Codex e Atlas in una super app desktop: la risposta a Anthropic
OpenAI lancia Codex Security: validazione comportamentale invece di report SAST tradizionali
Accordo Apple-Google: Gemini addestra i nuovi modelli Siri per iOS 27
La geometria del rifiuto nei LLM: come controllare il comportamento nello spazio latente
OpenAI unifica ChatGPT, Codex e Atlas in una super app desktop

ChatGPT: l'evoluzione da GPT-3.5 a GPT-5.4 Thinking e la nuova era agente

In questo articolo:

ChatGPT è un chatbot di intelligenza artificiale generativa sviluppato da OpenAI, rilasciato nel novembre 2022. Basato su modelli transformer pre-addestrati (GPT), genera testo, parlato e immagini in risposta ai prompt degli utenti. Il servizio ha raggiunto 100 milioni di utenti in due mesi, diventando l'applicazione software per consumatori a crescita più rapida nella storia, e il suo sito web figura tra i primi 5 più visitati al mondo. Secondo i dati diffusi da OpenAI, gli utenti attivi settimanali sono passati da 300 milioni a dicembre a 500 milioni a marzo, fino a quota 700 milioni, quadruplicando rispetto all'anno precedente.

L'architettura tecnica e il modello di business

⬆ Torna su

ChatGPT si basa su modelli foundation GPT sottoposti a fine-tuning per l'assistenza conversazionale. Il processo di fine-tuning combina apprendimento supervisionato e reinforcement learning from human feedback (RLHF). I trainer umani hanno agito sia come utenti che come assistenti AI nella fase supervisionata, mentre nella fase di reinforcement learning hanno classificato le risposte generate dal modello per creare "reward models" utilizzati per ulteriori iterazioni di ottimizzazione. Il servizio opera su un modello freemium: gratuito con capacità limitata, con piani a pagamento tra cui ChatGPT Plus a 20 dollari al mese, ChatGPT Team, ChatGPT Enterprise e il livello Pro a 200 dollari al mese introdotto a dicembre 2024.

Per costruire un sistema di sicurezza contro contenuti dannosi, OpenAI ha impiegato lavoratori kenioti esterni, retribuiti circa 1,32-2 dollari l'ora, per etichettare contenuti sessualmente abusivi, violenti, razzisti e sessisti. Queste etichette hanno addestrato un modello di rilevamento. I lavoratori sono stati esposti a contenuti tossici e traumatici; un lavoratore ha descritto l'incarico come "tortura". OpenAI ha collaborato con Sama, azienda di dati di addestramento con sede a San Francisco.

L'evoluzione dei modelli: da GPT-4 a GPT-5.4 Thinking

⬆ Torna su

La progressione dei modelli ha subito una significativa accelerazione. Dopo GPT-4 e GPT-4o (dove "o" sta per "omni"), presentato a maggio 2024 per un'interazione più naturale attraverso testo, audio, immagini e video, OpenAI ha rilasciato GPT-5 ad agosto 2025. Sam Altman, CEO di OpenAI, ha descritto GPT-5 come un "aggiornamento significativo e un avanzamento concreto verso l'AGI, l'intelligenza artificiale generale", affermando che "con GPT-5 è come parlare con un esperto. Un vero esperto di livello PhD, in qualsiasi area vi serva, disponibile su richiesta".

Nel marzo 2026 OpenAI ha annunciato GPT-5.3 Instant, seguito a breve distanza da GPT-5.4 Thinking. Quest'ultimo si posiziona come modello pensato per compiti complessi, workflow agentici e attività business ad alta intensità di documenti e strumenti. OpenAI dichiara sei aree di miglioramento: coding, comprensione documenti, uso strumenti, instruction following (capacità di seguire richieste complesse), percezione immagini, task multimodali. Si aggiungono miglioramenti nell'esecuzione di task a lunga durata, workflow agentici multi-step, efficienza dei token, prestazioni end-to-end nei workload con molti tool e efficacia nella ricerca web agente con sintesi da più fonti.

Finestra contestuale da 1 milione di token

⬆ Torna su

Uno degli elementi più rilevanti di GPT-5.4 è il supporto fino a 1 milione di token. Questa estensione permette di lavorare su intere codebase, raccolte ampie di documenti o traiettorie agentiche prolungate senza frammentare il contesto in più prompt. Una context window più ampia riduce gli attriti operativi perché il modello mantiene più informazioni rilevanti nello stesso flusso di lavoro. GPT-5.4 è anche il primo modello mainline addestrato a supportare la "compaction", tecnica per mantenere più a lungo il contesto rilevante durante traiettorie agentiche estese.

GPT-5.3 Instant, invece, interviene su tono, pertinenza e ritmo della conversazione. Con la versione precedente 5.2 Instant, diversi utenti avevano segnalato risposte che partivano con lunghi preamboli legati alla sicurezza o con rifiuti poco necessari. GPT-5.3 Instant fornisce risposte più dirette, meno appesantite da introduzioni assertive o moralistiche, con una gestione più equilibrata dei rifiuti pur mantenendo gli standard di sicurezza. OpenAI definisce il modello "meno cringe". I test interni su ambiti come medicina, diritto e finanza mostrano una riduzione del tasso di "allucinazioni" del 26,8% con l'uso del web e del 19,7% senza supporto della ricerca online.

Capacità agentiche e computer use

⬆ Torna su

Nel 2025 OpenAI ha aggiunto diverse funzionalità per rendere ChatGPT più agente, ovvero capace di eseguire autonomamente task più lunghi. A gennaio 2025 è stato rilasciato Operator, capace di eseguire autonomamente task attraverso interazioni con browser web, inclusa compilazione di moduli, ordini online, programmazione appuntamenti e altri task basati su browser. Controllava un ambiente software all'interno di una macchina virtuale con connettività internet limitata e restrizioni di sicurezza. Operator ha mostrato difficoltà con interfacce utente complesse.

A maggio 2025 OpenAI ha introdotto Codex, un agente per il coding capace di scrivere software, rispondere a domande sulla codebase, eseguire test e proporre pull request. Basato su una versione fine-tuned di OpenAI o3, dispone di due versioni: una che gira in una macchina virtuale nel cloud, e una dove l'agente gira nel cloud ma esegue azioni su una macchina locale connessa via API. A luglio 2025 è stato rilasciato ChatGPT agent, un agente AI che può eseguire task multi-step. Come Operator, controlla un computer virtuale e eredita da Deep Research la capacità di raccogliere e sintetizzare volumi significativi di informazioni. L'utente può interrompere i task o fornire istruzioni aggiuntive.

A settembre 2025 OpenAI ha collaborato con Stripe, Inc. per rilasciare l'Agentic Commerce Protocol, abilitando acquisti tramite ChatGPT. Al lancio, la funzionalità era limitata ad acquisti su Etsy da utenti statunitensi con metodo di pagamento collegato all'account OpenAI. OpenAI trattiene una quota non divulgata dal pagamento del merchant.

Le nuove Usage Policies e le sensitive conversations

⬆ Torna su

Con le Usage Policies entrate in vigore il 29 ottobre 2025, OpenAI ha ridefinito i limiti dell'intelligenza artificiale e le regole del suo stesso potere. Vengono vietati armi, manipolazioni politiche, sorveglianza biometrica e usi critici dell'AI (soldi, lavoro, salute, giustizia) privi di controllo umano qualificato. Sono inoltre attivati migliori guardrail a tutela di persone vulnerabili, per evitare di assecondare o amplificare derive psicotiche o depressive. L'elenco dei divieti include lo sviluppo o la gestione di armi, attività terroristiche, manipolazione dell'opinione pubblica, sorveglianza biometrica, profilazione sociale, creazione di immagini intime non consensuali, adescamento di minori, violenza, disinformazione, gioco d'azzardo con denaro reale.

Con GPT-5 è stata introdotta una categoria inedita: le sensitive conversations, ovvero interazioni in cui emergono fragilità psicologiche, disagio, solitudine, pensieri suicidari o situazioni di vulnerabilità. OpenAI ha collaborato con 170 esperti tra psicologi, medici e assistenti sociali per addestrare il modello a riconoscere questi casi e rispondere con maggiore cautela. Secondo i dati diffusi, le risposte "inadeguate" sarebbero diminuite dell'80%.

Libertà intellettuale e ricerca della verità

⬆ Torna su

OpenAI ha annunciato un aggiornamento significativo nel modo in cui ChatGPT viene addestrato, introducendo una filosofia basata sulla libertà intellettuale. L'obiettivo è permettere al chatbot di affrontare un più ampio spettro di argomenti, anche complessi o controversi, senza assumere una posizione editoriale netta. La modifica fa parte di un aggiornamento del Model Spec, un documento di 187 pagine che definisce le linee guida per il comportamento dell'IA. Tra le nuove regole spicca il principio di "ricerca della verità", che impone a ChatGPT di evitare sia dichiarazioni false sia omissioni di contesto rilevanti.

La nuova politica implica che il chatbot può offrire più prospettive su un argomento, invece di limitarsi a risposte sintetiche o neutre. Un esempio fornito da OpenAI è la possibilità di affermare sia che "Black Lives Matter" sia che "All Lives Matter", fornendo il contesto storico e culturale a entrambe le affermazioni. Il chatbot continuerà a rifiutarsi di rispondere a domande pericolose o palesemente false. L'aggiornamento arriva dopo mesi di critiche, soprattutto da ambienti conservatori negli Stati Uniti, che hanno accusato OpenAI di censurare alcune opinioni politiche o sociali.

Criticità: allucinazioni e limiti

⬆ Torna su

I dati di addestramento di ChatGPT coprono un periodo fino alla data di cut-off, quindi mancano di conoscenza di eventi recenti. OpenAI ha talvolta mitigato questo effetto aggiornando i dati di addestramento. Il chatbot può trovare informazioni più aggiornate cercando sul web, ma questo non assicura che le risposte siano accurate, poiché può accedere a siti inaffidabili o fuorvianti. Una stima del 2023 calcola che ChatGPT allucina circa il 3% delle volte. Giornalisti e studiosi hanno commentato la tendenza di ChatGPT a produrre informazioni false presentandole come fatti.

I bias nei dati di addestramento si riflettono nelle risposte. Il modello di ricompensa, progettato attorno alla supervisione umana, può essere sovra-ottimizzato e ostacolare le prestazioni in un esempio di patologia di ottimizzazione nota come legge di Goodhart. Questi limiti possono emergere quando ChatGPT risponde a prompt che includono descrittori di persone. In un caso, ChatGPT ha generato un rap in cui donne e scienziati di colore venivano presentati come inferiori agli scienziati maschi bianchi.

Funzionalità e integrazioni

⬆ Torna su

ChatGPT offre diverse funzionalità aggiuntive. Una funzione "Memory" permette agli utenti di istruire il chatbot a memorizzare informazioni specifiche. Un'altra opzione permette di richiamare vecchie conversazioni. Moderatori classifier basati su GPT riducono il rischio di output dannosi. A marzo 2023 OpenAI ha aggiunto il supporto per plugin, inclusi plugin sviluppati da OpenAI come navigazione web e interpretazione del codice, e plugin esterni da sviluppatori come Expedia, OpenTable, Zapier, Shopify, Slack e Wolfram.

Da ottobre a dicembre 2024 è stato distribuito ChatGPT Search, che permette al chatbot di cercare sul web per fornire risposte più accurate e aggiornate, aumentando la competizione diretta con i principali motori di ricerca. A dicembre 2024 OpenAI ha lanciato una funzione che permette agli utenti di chiamare ChatGPT telefonicamente per un massimo di 15 minuti al mese gratuitamente. A settembre 2025 è stato aggiunto Pulse, che genera un'analisi giornaliera delle chat dell'utente e delle app connesse come Gmail e Google Calendar.

A ottobre 2025 OpenAI ha lanciato ChatGPT Atlas, un browser che integra l'assistente ChatGPT direttamente nella navigazione web per competere con browser esistenti come Google Chrome e Safari. Include una funzione aggiuntiva chiamata "agentic mode" che permette di eseguire azioni online per l'utente. A gennaio 2026 è stata introdotta la funzione "ChatGPT Health", con cui il chatbot può discutere la salute dell'utente in modo separato dalle altre chat. La funzione non è disponibile per utenti nel Regno Unito, Svizzera o nello Spazio Economico Europeo, ed è disponibile su lista d'attesa altrove.

Pubblicità e infrastruttura

⬆ Torna su

Il 17 gennaio 2026 OpenAI ha annunciato che avrebbe iniziato a testare inserzioni nella versione gratuita per utenti adulti statunitensi connessi. L'obiettivo è generare più entrate, considerando che OpenAI ha programmato di spendere 1,4 trilioni di dollari in infrastruttura AI nei prossimi otto anni. Allo stesso tempo, OpenAI sta lavorando su Stargate, un progetto da 500 miliardi di dollari per la costruzione di data center avanzati negli Stati Uniti.

ChatGPT ha utilizzato inizialmente un'infrastruttura Microsoft Azure alimentata da un supercomputer costruito specificamente da Microsoft per OpenAI, dotato di migliaia di GPU Nvidia, con un costo di centinaia di milioni di dollari. TrendForce ha stimato che nel 2023 sono state utilizzate circa 30.000 GPU Nvidia (ciascuna al costo di circa 10.000-15.000 dollari) per alimentare ChatGPT. Scienziati dell'Università della California Riverside hanno stimato che una serie di 5-50 prompt richiede circa 0,5 litri d'acqua per il raffreddamento dei server Microsoft.

Questo articolo è una sintesi basata esclusivamente sulle fonti elencate.

Implicazioni e scenari

⬆ Torna su

La traiettoria verso capacità più autonome e contesti estesi configura ChatGPT come piattaforma operativa, oltre che conversazionale.

Scenario 1: L'Agentic Commerce Protocol potrebbe trasformare il servizio in intermediario commerciale, con ChatGPT che gestisce transazioni e acquisti per conto degli utenti.
Scenario 2: La finestra contestuale da 1 milione di token potrebbe ridefinire i flussi professionali, permettendo analisi di intere codebase e documentazioni senza frammentazione.
Scenario 3: Le sensitive conversations e i nuovi guardrail potrebbero aumentare l'affidabilità percepita in contesti vulnerabili, estendendo l'adozione oltre l'uso produttivo tradizionale.

Cosa monitorare

⬆ Torna su

Tasso di adozione delle funzionalità agenti (Operator, Codex) rispetto all'uso conversazionale classico.
Reazioni dei merchant all'Agentic Commerce Protocol e alla quota trattenuta sulle transazioni.
Feedback degli utenti sull'equilibrio tra sicurezza e libertà intellettuale nelle nuove policy.

Nota editoriale: questa sezione propone una lettura analitica dei temi trattati, senza introdurre dati fattuali non presenti nelle fonti.

ChatGPT: l'evoluzione da GPT-3.5 a GPT-5.4 Thinking e la nuova era agente

Contenuto

Scopri anche

ChatGPT: l'evoluzione da GPT-3.5 a GPT-5.4 Thinking e la nuova era agente

L'architettura tecnica e il modello di business

L'evoluzione dei modelli: da GPT-4 a GPT-5.4 Thinking

Finestra contestuale da 1 milione di token

Capacità agentiche e computer use

Le nuove Usage Policies e le sensitive conversations

Libertà intellettuale e ricerca della verità

Criticità: allucinazioni e limiti

Funzionalità e integrazioni

Pubblicità e infrastruttura

Implicazioni e scenari

Cosa monitorare

Fonti

In breve

Link utili