Inflection AI, la startup con sede a Palo Alto fondata da Mustafa Suleyman, co-fondatore di DeepMind, e Reid Hoffman, co-fondatore di LinkedIn, ha annunciato oggi il lancio di un nuovo modello fondamentale chiamato Inflection-2.5. Questo nuovo modello, basato sul lavoro svolto finora, supera significativamente l’originale Inflection-1 dell’azienda e si avvicina notevolmente al modello GPT-4 di OpenAI, soprattutto per quanto riguarda le materie STEM. Inflection-2.5 alimenta il chatbot Pi dell’azienda, progettato per competere con ChatGPT e Gemini, ed è disponibile per i test su dispositivi mobili e sul web.
Miglioramenti significativi, ma ancora dietro a GPT-4
Fin dalla sua creazione, Inflection AI si è concentrata nello sviluppare un’intelligenza artificiale “empatica, utile e sicura” che agisce in modo più personale e colloquiale rispetto ad altri modelli, incluso la serie GPT. L’azienda ha utilizzato una messa a punto empatica unica per conferire al modello alla base di Pi una personalità distintiva e un EQ (quoziente emotivo) eccezionale.
Inflection-2.5 rappresenta l’ultimo sforzo nello spazio dell’IA in rapida evoluzione per contrastare la dominanza di OpenAI, che continua a chiarire la sua approccio allo sviluppo dell’IA per l’umanità. Recentemente, Anthropic ha presentato Claude 3 Opus, diventando il primo modello a battere GPT-4.
Miglioramenti nelle prestazioni
Con l’introduzione del modello migliorato Inflection-2.5, la startup, che ha raccolto 1,3 miliardi di dollari a giugno 2023, sta sviluppando l’aspetto dell’intelligenza del modello, coprendo aree come la fisica e la matematica. In un post sul blog, l’azienda ha affermato che gli utenti che parlano con Pi, supportato da Inflection-2.5, possono discutere di una serie di argomenti, dalla condivisione di un hobby alla programmazione, dal controllo delle risposte a un compito di biologia alla stesura di un piano aziendale.
Milioni di utenti, miliardi di messaggi. Scopri il nuovo e migliorato Pi, dove l’intelligenza utile si fonde con l’empatia amichevole.
Ora alimentato dal nostro modello fondamentale di classe mondiale: Inflection-2.5
In termini di prestazioni nei benchmark, il modello migliorato mostra notevoli miglioramenti rispetto a Inflection-1 in generale e si avvicina a GPT-4, anche se rimane ancora indietro.
Ad esempio, nel benchmark MMLU, che misura le prestazioni su compiti che vanno dalla scuola superiore a livelli professionali di difficoltà, Inflection-2.5 ha ottenuto un punteggio di 85,5, posizionandosi poco dietro l’87,3 di GPT-4. Allo stesso modo, nei test STEM, il modello ha ottenuto risultati quasi pari a quelli del modello di OpenAI, con un punteggio di 63 nell’esame di matematica ungherese (rispetto al 68 di GPT-4) e un percentile dell’85esimo nella Physics GRE, rispetto al 97esimo di GPT-4.
Nel benchmark GSM8K, composto da 8.500 problemi di matematica scolastica di alta qualità, il modello di Inflection ha ottenuto un punteggio di 86,3, rispetto al 92 di GPT-4. Nel test 0-shot HumanEval, progettato per valutare le capacità di generazione di codice, ha ottenuto un punteggio di 73,8 rispetto al 79,3 di GPT-4.
Un modello addestrato in modo efficiente con ricerca web
Nonostante le prestazioni non siano superiori a quelle di GPT-4, Inflection AI ha evidenziato che questa “performance al 94% del livello di GPT-4” è stata ottenuta con un addestramento molto più efficiente rispetto al grande modello di linguaggio (LLM) di OpenAI.
Secondo l’azienda, Inflection-2.5 ha richiesto solo il 40% del FLOPs (calcolo) di addestramento di GPT-4 per ottenere questi risultati.
Inoltre, proprio come GPT-4, il modello incorpora anche la capacità di ricerca web in tempo reale, fornendo agli utenti le informazioni più aggiornate sugli eventi attuali. Questo sarà un importante miglioramento, considerando che l’azienda ha posizionato Pi come un assistente virtuale per tutti. Tuttavia, è importante notare che la qualità dei risultati con il recupero dei dati web potrebbe essere leggermente diversa perché nessun benchmark lo utilizza.
Come accedere a Inflection-2.5?
Inflection AI ha già rilasciato il nuovo modello per il chatbot Pi. Ciò significa che chiunque utilizzi l’assistente può iniziare a testarne le capacità.
L’azienda non ha condiviso in che modo gli utenti beneficiano del modello migliorato, ma ha dichiarato che il cambiamento ha avuto un impatto significativo sul sentiment degli utenti, sull’interazione e sulla fidelizzazione, accelerando la crescita organica degli utenti del chatbot.
Attualmente, il chatbot Pi, disponibile su Android, iOS, web e come applicazione desktop, conta un milione di utenti attivi giornalieri e sei milioni di utenti attivi mensili. Più di quattro miliardi di messaggi sono stati scambiati con l’IA, con una conversazione media che dura 33 minuti.

