Storie Web lunedì, Marzo 10
Notiziario

Dopo i primi esperimenti con Pokémon GO, che hanno evidenziato il potenziale delle AI nella navigazione in ambienti dinamici, i ricercatori del Laboratorio Hao dell’Università della California hanno scelto il classico Super Mario Bros per testare le capacità di adattamento e pianificazione di alcune AI. Al posto dei tradizionali test matematici e logici, i ricercatori hanno messo alla prova le loro capacità decisionali e reattive attraverso una versione emulata del classico gioco retrò, che ha permesso alle AI di controllare Mario attraverso istruzioni ben precise, del tipo “Se un ostacolo o un nemico è vicino, muoviti/salta a sinistra per schivare”, accompagnate da screenshot del gioco, così da poter capire al meglio come agire in ogni situazione. Nonostante l’intrinseca facilità di Super Mario Bros, il gioco Nintendo si è rivelato una sfida complessa per i sistemi di intelligenza artificiale, che hanno dovuto elaborare strategie di gioco complesse e veloci per non dover soccombere in un ambiente imprevedibile.

Le AI migliori (e quelle che hanno deluso)

I risultati del test hanno svelato gerarchie inaspettate. Claude 3.7 di Anthropic, modello AI di ragionamento ibrido che aveva già dimostrato le sue brillanti capacità di gioco su Pokemon, si è distinto come il campione indiscusso, esibendo riflessi degni del miglior giocatore, concatenando salti precisi ed evitando abilmente i nemici. Anche il suo predecessore, Claude 3.5, ha fatto un ottimo lavoro. La sorpresa è arrivata dai cosiddetti modelli “reasoning”, ossia dedicati al ragionamento, come GPT-4o di OpenAI e Gemini 1.5 Pro di Google. Nonostante le loro capacità di ragionamento logico e complesso, di fronte alle esigenze di reazione rapida del gioco si sono trovate in difficoltà, impiegando troppo tempo per calcolare le loro mosse. Una modalità che ha penalizzato i LLM di ragionamento in un gameplay dove la velocità di esecuzione è tutto.

Dagli scacchi ai mondi virtuali: una nuova sfida per l’AI

Benché l’uso di videogiochi retrò per testare l’intelligenza artificiale sia stato un banco di prova sulle capacità di gioco, con tutto quello che comporta, l’esperimento dei ricercatori di San Diego è da recepire più come un esercizio esplorativo, che una rigorosa metodologia di valutazione. La capacità di un’AI di superare il primo livello di Super Mario Bros. ha un valore limitato se rapportata alle differenti applicazioni nel mondo reale, come hanno evidenziato alcuni esperti del settore, convinti che la capacità di giocare a Super Mario – o a qualunque altro videogioco – non abbia una grande attendibilità quando si tratta di analizzare le prestazioni dei modelli AI. “La mia reazione è che c’è una crisi di valutazione. Non so davvero quali parametri guardare in questo momento”, ha dichiarato in un post condiviso su X Andrej Karpathy, ricercatore e membro fondatore di OpenAI. Tuttavia, il test offre spunti interessanti sulle capacità dell’intelligenza artificiale nell’affrontare e gestire situazioni che richiedono coordinazione, adattabilità e decisioni in tempo reale.

Il futuro: AI e videogiochi sempre più complessi

Se Super Mario Bros. ha rappresentato un primo test per valutare la reattività e la capacità di adattamento delle AI, le prossime sfide potrebbero ancora più ambiziose usando videogiochi open-world o su strategici complessi, dove le AI dovranno non solo reagire in tempo reale, ma anche sviluppare tattiche a lungo termine, gestire risorse e adattarsi a scenari imprevedibili. Esperimenti in tal senso sono già stati fatti. AlphaStar, intelligenza artificiale sviluppata da DeepMind di Google, già nel 2019 ha dominato nel complesso videogioco strategico StarCraft II, raggiungendo il livello Grandmaster: un risultato migliore del 99,8% di tutti i giocatori umani. Toccherà alle Ai di nuova generazione battere AlphaStar? La sfida è aperta.

Condividere.
© 2025 Mahalsa Italia. Tutti i diritti riservati.