LLM e memoria persistente: come Google e OpenAI stanno risolvendo il problema del contesto

Google presenta Context Engineering e l'architettura Titans per la memoria a lungo termine, mentre OpenAI implementa la funzione Memory in ChatGPT. Le sfide te…

Contenuto

LLM e memoria persistente: come Google e OpenAI stanno risolvendo il problema del contesto

Scopri anche

Anthropic e il Pentagono: lo scontro sul controllo dell'intelligenza artificiale militare
I modelli linguistici di grandi dimensioni: architettura, funzionamento e limitazioni
OpenAI sostituisce Anthropic nelle forniture al Pentagono: accordo da miliardi e scontro etico sull'IA militare
L'intelligenza artificiale può replicare la personalità umana con due ore di conversazione
GPT-5.3 Instant e la crisi di OpenAI: tra ritiri, proteste e sfide di mercato
I Large Language Models: architettura, funzionamento e implicazioni
Elastic perde il 15% nonostante i risultati Q4 oltre le attese
OpenAI rilascia GPT-5.3 Instant: conversazioni più naturali e riduzione degli errori
Tecniche di addestramento e ottimizzazione degli LLM: dati, distillazione e quantizzazione
Nvidia segna record di fatturato: Jensen Huang annuncia il punto di svolta dell'AI agentica
Broadcom punta a 100 miliardi di ricavi AI entro il 2027 con chip personalizzati
OpenAI rilascia GPT-5.3 Instant: conversazioni più dirette e riduzione degli errori per ChatGPT
Ottimizzazione dell'inferenza AI: vLLM, PagedAttention e nuovi paradigmi per i Large Language Models
L'anno dell'AI agentiva: trasformazione sistemica, rischi geopolitici e la corsa alle infrastrutture
Nvidia costruisce l'impero dell'infrastruttura AI: investimenti miliardari e partnership strategiche
Large Language Models: architettura, funzionamento e applicazioni nell'era dell'AI generativa
OpenClaw: perché le grandi aziende tech bloccano l'agente AI autonomo
Claude supera ChatGPT nell'App Store USA dopo il rifiuto di Anthropic a collaborare con il Pentagono
Architettura dell'informazione AI-first: oltre l'interfaccia conversazionale
OpenClaw, l'agente AI che spaventa le Big Tech: Meta vieta, OpenAI assume il creatore

LLM e memoria persistente: come Google e OpenAI stanno risolvendo il problema del contesto

In questo articolo:

I modelli di linguaggio di grandi dimensionzioni (LLM) presentano una limitazione strutturale: ogni richiesta viene elaborata in isolamento, senza memoria delle interazioni precedenti. Google definisce questo il "goldfish problem", riferendosi all'incapacità dei modelli di mantenere il contesto tra una conversazione e l'altra. Due approcci stanno emergendo per risolvere questa carenza: da un lato, Google ha pubblicato un whitepaper di 70 pagine su Context Engineering insieme all'architettura Titans; dall'altro, OpenAI ha implementato la funzione Memory in ChatGPT (esclusa temporaneamente da Europa e Regno Unito).

Contenuto

Scopri anche

LLM e memoria persistente: come Google e OpenAI stanno risolvendo il problema del contesto

Il problema del contesto isolato

Sessioni: il contenitore della conversazione

Memoria: persistenza cross-conversazione

L'architettura Titans di Google

Il meccanismo della "sorpresa"

ChatGPT Memory: l'implementazione di OpenAI

Il pattern Memory-as-a-Tool

Gestione conflitti e affidabilità

Compattazione della cronologia

RAG e Memoria: approcci complementari

Applicazioni settoriali

Sfide tecniche e considerazioni

Isolamento dei dati utente

Il potenziale per l'AGI

Framework disponibili

Implicazioni e scenari

Cosa monitorare

Fonti

In breve

Link utili