Trecento dollari al giorno: la cifra che ha scatenato il dibattito. Jason Calacanis, noto investitore tech e co-conduttore del popolare podcast di economia e tecnologia “All In”, ha raccontato pubblicamente – come riporta CIO.com – che la sua organizzazione ha raggiunto quel livello di spesa giornaliera utilizzando le API di Claude per alimentare agenti di intelligenza artificiale e soltanto per sostituire una frazione marginale del lavoro di uno sviluppatore. Chamath Palihapitiya, CEO del fondo di venture capital Social Capital, ha aggiunto durante il podcast che la sua azienda impone budget di token ai migliori sviluppatori, ma che un utilizzo senza limiti può diventare rapidamente insostenibile. «Se aggreghi i dati su tutte le persone, emerge chiaramente una tendenza: a questo punto devono essere almeno il doppio più produttivi di un altro dipendente», ha spiegato. Il problema non è l’AI. È come la si usa Il dibattito, partito dai microfoni del podcast e poi amplificato su X e LinkedIn, ha rapidamente chiarito un punto che molti dipartimenti IT faticano ancora ad accettare: il costo elevato degli agenti AI non è una caratteristica intrinseca della tecnologia, ma una conseguenza diretta del modo in cui viene usata. «Non è un argomento contro gli agenti AI», ha scritto su LinkedIn Ayesha Khanna, CEO di Addo AI, citata da CIO.com. «La domanda è se li stai usando in un modo che abbia senso dal punto di vista economico. La maggior parte dei team non lo fa ancora». Vygandas Pliasas, CEO di Solidmatics, ha spiegato che lasciare agenti costosi e personalizzati girare liberamente via API – invece di usare strumenti di coding dedicati – è la ricetta per la deriva dei costi. «A volte arrivo a 500 dollari in una settimana, e questo con un approccio guidato dall’uomo», ha detto. «Se lasci che gli agenti cancellino e riscrivano codice alla cieca, non stai più davvero controllando il lavoro, e avrei seri dubbi sulla qualità.» Il suo mantra: «L’AI è uno strumento, non un sostituto del cervello. Se ti fidi ciecamente e la lasci girare, raggiungerai quella cifra. E l’output non varrà la pena». Token illimitati e come difendersi
Al cuore del problema c’è la struttura economica dei modelli linguistici di grandi dimensioni: ogni interazione consuma token, e il conto sale in funzione della lunghezza del contesto, del numero di passaggi e degli eventuali retry. Una soluzione, prospettata dagli esperti è quella di utilizzare agenti AI con perimetro d’azione circoscritto, abbinati a un modello più piccolo e in esecuzione locale: una soluzione nettamente più economica. «La differenza tra un uso intelligente degli agenti AI e uno approssimativo può facilmente essere di dieci volte il costo operativo», ha chiarito Kateryna Babenko, analista di Katico. La raccomandazione operativa di Babenko, riportata da CIO.com, è chiara: modellare il volume di token per ciascun task, fare benchmark del costo di inferenza al livello di modello utilizzato, e confrontare quei costi con il costo del lavoro umano nei flussi che si intende automatizzare. «Gli agenti che giustificano il loro costo sono quelli applicati a lavori che nessuno vuole fare
manualmente, dove il task è delimitato, l’output può essere verificato e un essere umano può intercettare gli errori prima che si propaghino». Sul piano pratico, gli esperti consigliano di impostare tetti di spesa rigidi: i principali provider AI permettono di configurare hard cap per chiave API o per organizzazione. Si possono creare chiavi separate per team o singolo ingegnere, con un limite mensile. Per gli strumenti gestiti – Cursor, GitHub Copilot, i piani in abbonamento di Claude – spetta all’IT decidere chi ottiene una licenza e chi fa cosa. Con una postilla importante: se un ingegnere sta producendo feature di alto impatto, forse il suo output equivale a quello che un team di dieci persone produrrebbe in un anno. In quel caso, il costo è giustificato.
Il messaggio che traspare è chiaro: gli agenti AI non sono un costo fisso. Sono un costo variabile operativo, con budget, controlli, responsabilità e ownership da definire fin dal primo giorno. Chi non capisce queste problematiche rischia di pagare un conto davvero salato.







