Come risponde ChatMinerva? La sfida di costruire un ChatGPT italiana

Se un mattone pesa un chilo più mezzo mattone, quanto pesa un mattone? L’indovinello è vecchio e molti esperti lo usavano come test per i primi modelli di AI generativa, Gpt-3 e dintorni, che puntualmente fallivano. ChatMinerva, chatbot italico appena lanciato, ha questo vantaggio indubbio: ci riporta in quel passato in cui potevamo farci beffe dell’AI generativa. “Il peso di quel mattonella sarà esattamente 1 kg + 0.5 × 1 kg = 1.5 kg (o 1 500 g). In altre parole, ha lo stesso peso del doppio della sua massa!”, ci risponde, con sicurezza (il punto esclamativo), quando la risposta giusta ormai la conoscono anche i sassi, o i mattoni, ed è due chili. Chatgpt Instant (versione più veloce dell’attuale modello Gpt 5.5) risponde correttamente e in più ci dice la formula per arrivarci, X=1+X/2, quindi due (kg). A farci soffrire di più è forse lo svarione linguistico (“quel mattonella”), che non fa onore a un modello il cui principale elemento distintivo dovrebbe essere quello di essere addestrato con e per la nostra lingua, l’italiano. Così l’hanno presentato al mondo i suoi creatori, il gruppo di ricerca Sapienza NLP dell’Università La Sapienza di Roma, guidato dal professor Roberto Navigli, in collaborazione con Babelscape, spin-off accademico fondato dieci anni fa.

Non è però nemmeno corretto essere tanto severi con una creatura che, «è stato costruito con molta più passione che budget, grazie al lavoro incessante di decine di ricercatori, dottorandi, studenti e collaboratori che credono nella possibilità di creare tecnologia AI italiana da cui partire per costruire prodotti competitivi», come ha detto Navigli.

Un po’ come una utilitaria autoctona, fatta con piccole e capaci forze. Non lo si può mettere in pista con le macchine di formula uno quali Gpt, Claude o Gemini. Purtroppo però a queste siamo abituati noi; con queste è inevitabile fare un confronto.

«Non sorprende che ChatMinerva non sappia risolvere l’indovinello del mattone, che non fallisce ormai nessuno. Parliamo di un modello con un numero di parametri (connessioni) di alcuni ordini di grandezza inferiore rispetto a Gpt e simili», dice Antonio Cisternino, ricercatore esperto di AI all’università di Pisa. ChatMinerva è l’evoluzione diretta di Minerva 7B, il large language model lanciato in precedenza dallo stesso gruppo Sapienza NLP, con 7 miliardi di parametri, “pochissimi ora”, dice Cisternino. Navigli annuncia per l’autunno una versione ulteriore, con 20 miliardi di parametri. Gpt 3, lanciato nel 2020, ne aveva 175 miliardi. Da allora OpenAI non ha più dichiarato questi valori, ma analisi indipendenti (di Semianalysis) parlano di quasi 2 mila miliardi di parametri, che il modello ora utilizza ogni volta in piccola parte nelle risposte, grazie a tecniche di efficienza raggiunte.

Le risposte di ChatMinerva risentono di queste limitazioni. “Sono più inclini a errori – allucinazioni – o a non rispettare le istruzione date”, dice Cisternino. Nelle nostre prove: se chiediamo di scrivere un articolo su un tema, non lo fa ma ci riassume una notizia. Se chiediamo di riassumere una notizia invece, ci dà poche righe e non le approfondisce se glielo chiediamo.

Tendenza

Eredità, come e quando inviare la dichiarazione di successione. C’è la precompilata

Barberino’s alla conquista del Nord America, da Manhattan al Canada

Zelensky vede oggi Trump alla Casa Bianca. Attacchi reciproci Kiev-Mosca

Addio pagina bianca, l’AI accorcia il tempo tra il pensiero e la scrittura

Il super El Niño arriva su un pianeta già caldo. Ecco le conseguenze

L’ultimo saluto dell’equipaggio spaziale della ISS, poi il portello della Soyuz MS-28 si chiude

Scoperta la prima esoluna: a 73 anni luce da noi un mondo che sfida le nostre definizioni

Cina, un fulmine colpisce il razzo poco dopo il lancio

“Gli account dei minori non rispettano gli standard di sicurezza”

Una donna tra i vincitori della medaglia Fields, il Nobel della matematica

24MM: Torino-Luna andata e ritorno

orbita attorno a una nana bruna 30 volte più grande di Giove

Tendenza

Come risponde ChatMinerva? La sfida di costruire un ChatGPT italiana

Articoli Correlati