OpenAI annuncia un nuovo modello che promette di rivoluzionare l'intelligenza artificiale

Il modello o3 è stato annunciato da OpenAI in una trasmissione in diretta venerdì 20 ed è considerato il modello più avanzato fino ad oggi.

OpenAI annuncia un modello che mira a rivoluzionare l'intelligenza artificiale e fa discutere sull'AGI. Credito: Analytics Vidhya

I modelli linguistici di grandi dimensioni (LLM) hanno guadagnato molta attenzione negli ultimi anni. Una delle applicazioni più conosciute è ChatGPT della società OpenAI, che in breve tempo ha raggiunto milioni di utenti. Gli LLM sono addestrati a comprendere e generare testo, oltre ad avere una gamma di applicazioni che vanno dall'analisi del testo alla generazione di testo o immagini.

Recentemente, aziende come OpenAI, Google e Facebook stanno combinando LLM con modelli di ragionamento. I modelli di ragionamento possono fare deduzioni logiche e risolvere problemi complessi collegando le informazioni. Negli ultimi tempi, combinare linguaggio naturale e ragionamento logico è l'obiettivo di diverse aziende che stanno già proponendo i loro modelli.

Venerdì 20 OpenAI ha annunciato tramite una trasmissione in diretta il lancio del modello o3, definito il modello di intelligenza artificiale più avanzato al mondo. Combina una comprensione superiore della matematica e della programmazione oltre alla conversazione. La sua architettura integra il LLM con l'apprendimento per rinforzo al fine di integrare l'elaborazione linguistica e il ragionamento logico.

LLM

Gli LLM si basano principalmente su un'architettura nota come Transformer proposta da Google nel 2017. Gli LLM vengono addestrati su enormi quantità di dati di testo, rendendo i modelli in grado di comprendere e generare testi. Altre applicazioni simili vengono fatte alle immagini e ai video, aprendo ulteriormente le possibili applicazioni dei modelli generativi.

Utilizzando Transformers, gli LLM possono acquisire modelli nel linguaggio umano comprendendo le relazioni semantiche e contestuali.

Per migliorare le capacità dei LLM, diversi gruppi di ricerca si concentrano sulla combinazione di modelli di ragionamento con LLM. In questo modo, ci si aspetta che gli LLM migliorino la loro accuratezza e capacità di generalizzazione. Inoltre, i modelli vengono utilizzati per rispondere a domande specifiche nelle aziende e nella scienza utilizzando i propri database durante la messa a punto dei modelli esistenti.

Imparare a ragionare

L'idea alla base dei modelli di ragionamento è imitare il processo di ragionamento umano quando si risolvono problemi con deduzione e induzione. Pertanto, questi modelli vengono utilizzati per risolvere problemi matematici, condurre analisi scientifiche e contribuire in situazioni in cui sono presenti molte variabili. A causa delle numerose applicazioni possibili, diversi gruppi si stanno concentrando sul miglioramento delle tecniche.

I modelli di ragionamento utilizzano tecniche che possono strutturare il ragionamento come, ad esempio, la catena di pensiero che suggerisce ai modelli di mostrare passaggi intermedi. Un'altra tecnica è la decodifica autoconsistente, che analizza diverse linee di ragionamento per selezionare quella migliore. Altri modelli strutturano catene logiche gerarchiche. Inoltre, l’utilizzo di queste tecniche con le reti neurali permette di combinare l’apprendimento di pattern con il ragionamento logico.

Modello o3

In questi giorni OpenAI, una società famosa per ChatGPT, ha annunciato il suo nuovo modello di intelligenza artificiale chiamato modello o3. Questo modello combina LLM con capacità di ragionamento. Ciò che ha attirato maggiormente l'attenzione è la capacità di o3 di risolvere problemi matematici avanzati e di ragionamento logico. Per raggiungere questo obiettivo, o3 è stato addestrato con tecniche di suggerimento della catena di pensiero.

La stimolazione della catena di pensiero suddivide i problemi in passaggi più piccoli e spiega i passaggi intermedi creando una linea di ragionamento. Inoltre, o3 ha mostrato una migliore comprensione del codice e generazione di algoritmi rispetto al suo predecessore o1. OpenAI ha anche annunciato che o3 ha ottenuto risultati mai visti prima nei test progettati per quantificare quanto siamo vicini all'intelligenza generale artificiale, o AGI.

Siamo arrivati all'AGI?

Da quando sono stati annunciati i risultati del modello o3 e sono riusciti a realizzare test importanti per AGI, come ARC-AGI. È importante notare che questi test non significano che abbiamo raggiunto l’AGI. L'ARC è progettato per valutare abilità specifiche come il ragionamento astratto, ma non concetti come creatività e comprensione emotiva.

I risultati di o3 rappresentano progressi nel campo, ma dipendono ancora da dati e regole pre-addestrati che controllano l'apprendimento. Sebbene o3 rappresenti un passo importante verso l’AGI, è troppo presto per dire che ci siamo arrivati o che stiamo per raggiungerlo.

Fonte della notizia

OpenAI o3 and o3-mini—12 Days of OpenAI: Day 12