OpenAI lancia la sua nuova intelligenza artificiale: “È più umana, ora pensa prima di rispondere”
È la "cosa" artificiale più simile a un essere umano. O almeno così OpenAI ha definito il suo nuovo modello chiamato 01. L‘intelligenza artificiale è stata addestrata "con apprendimento per rinforzo per eseguire ragionamenti complessi. o1 pensa prima di rispondere: può produrre una lunga catena interna di pensieri", spiega l'azienda. In altre parole è un passo avanti verso il grande progetto di qualsiasi azienda che produce modelli di grandi dimensioni: creare un'intelligenza artificiale che superi l'essere umano.
Al di là delle ambizioni di OpenAI, o1 al momento è solo un anteprima, diciamo una dichiarazione di intenti per il futuro dell'azienda. Il modello infatti è più costoso e lento di GPT-4o. Non solo, come spiega OpenAI "01 non dispone ancora di molte delle funzionalità che rendono ChatGPT utile, come la navigazione sul web per la ricerca di informazioni o il caricamento di immagini e file. Assenti anche rilevanti feature nell’API come il supporto all’utilizzo di strumenti, la funzione di chiamata, lo streaming e la personalizzazione dei messaggi. Per molti casi più comuni, per ora GPT-4o rimane più funzionale." OpenAI ha presentato anche o1-mini, una versione più piccola ed economica che sarà accessibile gratuitamente per tutti gli utenti di ChatGPT, non ha ancora stabilito però una data di rilascio.
Cosa cambia rispetto a ChatGPT
La differenza sta alla base. OpenAI infatti ha insegnato ai precedenti modelli GPT a imitare i pattern dei suoi dati di training. Il modello o1, invece, è stato addestrato a risolvere i problemi da solo usando l'apprendimento per rinforzo (tecnica di apprendimento automatico che vuole realizzare agenti autonomi in grado di scegliere azioni per il conseguimento di determinati obiettivi tramite interazione con l'ambiente in cui sono immersi). Usa quindi una "catena di pensiero" per elaborare le query. In modo simile gli essere umani si approcciano ai problemi: esaminandoli passo dopo passo.
Come spiega OpenAI: "Questi modelli imparano a rifinire il metodo di elaborazione attraverso l’utilizzo di varie possibilità e riconoscendo gli errori", scrive in una nota la società di Sam Altman. Non solo. "o1 è stato addestrato utilizzando un algoritmo di ottimizzazione completamente nuovo e un nuovo set di dati di addestramento specificamente adattato per esso", ha spiegato Jerry Tworek, responsabile della ricerca di OpenAI, a The Verge.
"Il nostro algoritmo di apprendimento di rinforzo su larga scala insegna al modello come pensare in modo produttivo usando la sua catena di pensiero in un processo di formazione altamente efficiente in termini di dati. Abbiamo scoperto che le prestazioni di o1 migliorano costantemente con più apprendimento di rinforzo e con più tempo dedicato al pensiero (elaborazione del tempo di test). I vincoli sulla scalabilità di questo approccio differiscono sostanzialmente da quelli del pre-addestramento LLM e continuiamo a studiarli."
Quanto costa il modello o1
Mentre l'azienda prevede di distribuire gratis la versione mini a tutti gli utenti, o1 non sarà economico. L'accesso degli sviluppatori nell'API, o1-preview costa 15 dollari per 1 milione di token di input, o blocchi di testo analizzati dal modello, e 60 dollari per 1 milione di token di output. Per fare un paragone, GPT-4o costa 5 dollari per 1 milione di token di input e 15 dollari per 1 milione di token di output.
"Abbiamo trascorso molti mesi lavorando sul ragionamento perché pensiamo che questa sia in realtà la svolta critica", ha spiegato Bob McGrew, responsabile della ricerca di OpenAI a The Verge. "Fondamentalmente, questa è una nuova modalità per i modelli per essere in grado di risolvere i problemi davvero difficili che servono per progredire verso livelli di intelligenza simili a quelli umani".