Storie Web mercoledì, Aprile 16
Notiziario

“L’IA è una tecnologia che sta cambiando la civiltà, non è limitata a un solo settore, ma sta trasformando ogni industria che tocca”, ha dichiarato Russell Wald, direttore esecutivo dello Stanford HAI e membro del comitato direttivo dell’AI Index. “L’anno scorso abbiamo assistito a un’accelerazione dell’adozione dell’IA a un ritmo senza precedenti e la sua portata e il suo impatto continueranno a crescere”. “L’Indice AI fornisce ai politici, ai ricercatori e al pubblico i dati necessari per prendere decisioni informate e per garantire che l’IA sia sviluppata con valori incentrati sull’uomo”.

Prestazioni dei modelli

Significativo ad esempio che le prestazioni dell’IA continiano a migliorare. Nel 2023, i ricercatori hanno introdotto nuovi benchmark: MMMU, GPQA e SWE-bench per testare i limiti dei sistemi di IA avanzati. Appena un anno dopo, le prestazioni sono aumentate notevolmente: i punteggi sono cresciuti di 18,8, 48,9 e 67,3 punti percentuali rispettivamente su MMMU, GPQA e SWE-bench. Al di là dei benchmark, i sistemi di IA hanno fatto passi da gigante nella generazione di video di alta qualità e, in alcune situazioni, i modelli di IA agici hanno persino superato gli esseri umani. Ha fatto scalpore uno studio (riportato da Stanford) secondo cui l’AI da sola è riuscita a fare diagnosi migliori dei medici (anche di quelli assistiti dalla stessa IA).

Il ragionamento rimane però una sfida per l’IA, nonostante i proclami entusiasti dei fondatori di queste aziende. Sì, i sistemi basati sull’apprendimento che generano e verificano ipotesi utilizzando metodi simbolici ottengono buoni risultati, anche se non sovrumani, in compiti come i problemi delle Olimpiadi internazionali di matematica. Gli Llm sono soprattutto ancora in ritardo rispetto a benchmark di ragionamento complessi come MMMU e faticano a risolvere in modo affidabile compiti pesanti dal punto di vista logico come l’aritmetica e la pianificazione, anche quando le soluzioni corrette sono dimostrabili. Ciò ne limita l’uso in contesti ad alto rischio e dove l’accuratezza deve essere massima.

Gli Stati Uniti sono ancora in vantaggio per quanto riguarda la quantità di modelli notevoli rilasciati, ma i modelli cinesi stanno recuperando. A gennaio 2024, il miglior modello statunitense superava il miglior modello cinese del 9,26%; nel febbraio 2025, il divario si era ridotto ad appena l’1,70%. Il rapporto ha rilevato risultati simili in altri benchmark relativi al ragionamento, alla matematica e alla codifica.

L’intelligenza artificiale diventa più efficiente, economica e accessibile. Grazie a modelli di piccole dimensioni sempre più capaci, il costo dell’inferenza per un sistema con prestazioni pari a GPT-3.5 è diminuito di oltre 280 volte tra il novembre 2022 e l’ottobre 2024. A livello di hardware, i costi sono diminuiti del 30% all’anno, mentre l’efficienza energetica è migliorata del 40% ogni anno. Anche i modelli a peso aperto stanno colmando il divario con i modelli chiusi, riducendo la differenza di prestazioni dall’8% ad appena l’1,7% su alcuni benchmark in un solo anno. Insieme, queste tendenze stanno rapidamente abbassando le barriere all’IA avanzata.

Condividere.
© 2025 Mahalsa Italia. Tutti i diritti riservati.