Amazon fa il suo ingresso nell’arena dell’intelligenza artificiale agentica con il lancio di Nova Act, un sofisticato agente AI multiuso progettato per interagire autonomamente con i browser web nell’esecuzione di compiti quotidiani. L’innovativa tecnologia rappresenta un significativo passo avanti nella strategia dell’azienda di Seattle per conquistare quote di mercato in questo emergente e competitivo settore tecnologico dove sono già presenti Operator di OpenAI e Computer Use di Anthropic.
Il progetto Nova Act e il laboratorio AGI
Nova Act rappresenta il primo prodotto pubblico del laboratorio AGI a San Francisco, un’iniziativa guidata dagli ex ricercatori di OpenAI David Luan e Pieter Abbeel. Entrambi avevano già fondato proprie startup – Luan ha creato Adept, mentre Abbeel è stato cofondatore di Covariant – prima di essere assunti da Amazon lo scorso anno per dirigere i suoi sforzi nel campo degli agenti AI.
David Luan ha spiegato di aver progettato il Nova Act SDK, un toolkit per la creazione di prototipi di agenti, con l’obiettivo di automatizzare in modo affidabile compiti brevi e semplici. Gli strumenti messi a disposizione permettono agli sviluppatori di definire con precisione i momenti in cui è necessario l’intervento umano all’interno di un flusso di lavoro agentico. La speranza è che ciò consenta la realizzazione di applicazioni agentiche più affidabili, anche se non completamente autonome. Gli sviluppatori possono accedere a questi strumenti attraverso il portale nova.amazon.com, che funge anche da vetrina per l’intera gamma di modelli Nova di Amazon.
Funzionalità avanzate e prestazioni
La suite di strumenti di Nova Act include funzionalità avanzate che consentono agli agenti AI di navigare intuitivamente tra pagine web complesse, compilare moduli con dati pertinenti, interagire con elementi interattivi come calendari o selettori di date, e persino comprendere il contesto visivo delle interfacce utente dei siti web, un problema che ha storicamente ostacolato l’efficacia degli agenti automatizzati.
Amazon afferma che Nova Act ha superato le prestazioni degli agenti concorrenti di OpenAI e Anthropic in vari test interni. Ad esempio, nel test ScreenSpot Web Text – che valuta l’interazione di un agente AI con il testo visualizzato sullo schermo – Nova Act ha ottenuto un punteggio del 94%, superando CUA di OpenAI (88%) e Claude 3.7 Sonnet di Anthropic (90%). È comunque da notare che Amazon non ha utilizzato benchmark più diffusi, come WebVoyager, per la valutazione degli agenti.