ExpMath: l'iniziativa DARPA per accelerare la matematica con l'AI

Analisi dell'iniziativa DARPA ExpMath per sviluppare co-autori AI che risolvano problemi matematici complessi attraverso modelli di ragionamento avanzati.

Contenuto

ExpMath: l'iniziativa DARPA per accelerare la matematica con l'AI

Scopri anche

ExpMath: l'iniziativa DARPA per accelerare la matematica con l'AI

ExpMath: l'iniziativa DARPA per accelerare la matematica con l'AI

In questo articolo:

Lo scorso aprile, la Defense Advanced Research Projects Agency statunitense ha lanciato l'iniziativa expMath, acronimo di Exponentiating Mathematics. L'obiettivo dichiarato è accelerare i progressi nel campo matematico, considerato fondamentale per applicazioni cruciali dall'informatica alla medicina e alla sicurezza nazionale.

La matematica come base del mondo moderno

⬆ Torna su

La matematica permette di modellare sistemi complessi come il flusso dell'aria attorno a un aereo, l'andamento dei mercati finanziari o la circolazione del sangue nel cuore. Le scoperte matematiche possono sbloccare tecnologie come la crittografia, essenziale per la messaggistica privata e la sicurezza bancaria online, o la compressione dei dati che consente di trasmettere immagini e video via internet.

Secondo la DARPA, tuttavia, la matematica viene ancora praticata "in solitaria davanti alla lavagna", con metodi sostanzialmente immutati da secoli. I progressi in questo settore possono richiedere anni, e l'agenzia mira ad accelerare questo processo.

Il concetto di co-autore AI

⬆ Torna su

L'obiettivo specifico di expMath è incentivare matematici e ricercatori di intelligenza artificiale a sviluppare quello che viene chiamato "co-autore-IA". Si tratta di uno strumento in grado di scomporre grandi problemi matematici complessi in sotto-problemi più piccoli e comprensibili, presumibilmente più veloci da risolvere.

Mentre i matematici usano computer da decenni per velocizzare calcoli o verificare affermazioni, la nuova visione prevede che l'intelligenza artificiale possa aiutarli a risolvere problemi finora considerati irrisolvibili. Esiste però una differenza significativa tra AI che risolve problemi di scuola superiore e AI che affronta problemi su cui i matematici professionisti lavorano per decenni.

Dai Large Language Models ai Large Reasoning Models

⬆ Torna su

I grandi modelli linguistici come ChatGPT non sono noti per le loro abilità matematiche. Tendono a "inventare" risposte e possono essere persuasi ad accettare affermazioni errate come "2 + 2 = 5". Tuttavia, i cosiddetti Large Reasoning Models rappresentano un'evoluzione significativa.

Modelli come o3 di OpenAI e Claude 4 Thinking di Anthropic sono LLM ulteriormente addestrati per risolvere compiti di ragionamento multi-step. Quest'anno, diversi LRM hanno ottenuto punteggi elevati all'American Invitational Mathematics Examination, test rivolto al 5% degli studenti più bravi delle scuole superiori statunitensi.

Modelli ibridi e risultati concreti

⬆ Torna su

Sono emersi modelli ibridi che combinano LLM con sistemi di verifica dei fatti. AlphaProof di Google DeepMind combina un LLM con il modello da gioco AlphaZero. Lo scorso anno, AlphaProof è diventato il primo programma a eguagliare le prestazioni di un medagliato d'argento alle Olimpiadi Internazionali di Matematica.

A maggio, un altro modello di DeepMind chiamato AlphaEvolve ha trovato soluzioni migliori rispetto a quelle umane per oltre cinquanta problemi matematici irrisolti e numerosi problemi concreti di informatica.

Limiti e prospettive dei modelli attuali

⬆ Torna su

Mentre GPT-4 non è in grado di fare matematica oltre il livello universitario, il LRM o1 di OpenAI mostra capacità avanzate. Tuttavia, i problemi delle Olimpiadi della Matematica spesso richiedono trucchetti ingegnosi, mentre i problemi di ricerca sono più esplorativi e pieni di elementi eterogenei.

Secondo alcuni matematici, il successo in un tipo di risoluzione dei problemi potrebbe non essere trasferito ad altri contesti. I problemi di ricerca matematici presentano caratteristiche qualitative diverse rispetto a quelli delle competizioni.

Questo articolo è stato redatto esclusivamente sulla base delle fonti elencate, senza aggiunte speculative o informazioni esterne.

Fonti

⬆ Torna su

In breve

  • darpa
  • lrm
  • matematica
  • ai

Link utili

Apri l'articolo su DeafNews