OpenAI entra ufficialmente nel club più esclusivo della Silicon Valley: quello delle aziende che non si limitano più a scrivere software, ma progettano anche l’hardware su cui quel software gira.
Il nuovo chip si chiama Jalapeño e come missione ha quella di abbassare il costo dell’intelligenza artificiale e aumentare la potenza di calcolo disponibile. L’annuncio è arrivato da OpenAI insieme a Broadcom, il colosso dei semiconduttori che negli ultimi due anni è diventato uno degli attori chiave dell’economia AI. In pratica Jalapeño è il primo chip proprietario di OpenAI, costruito specificamente per una funzione molto precisa: l’inferenza.
Cosa è l’inferenza?
Tradotto dal gergo tecnico: non serve ad addestrare i modelli, ma a farli lavorare. È la differenza tra costruire un cervello e usarlo. L’addestramento è la fase in cui un modello consuma quantità gigantesche di dati e potenza computazionale per imparare. L’inferenza, invece, è ciò che succede ogni volta che un utente scrive una domanda su ChatGPT, chiede a Codex di generare codice o attiva un agente AI.
Il problema: l’AI costa troppo
Ecco perché l’inferenza è diventata fondamentale nella nuova economia degli agenti intelligenti. Negli ultimi due anni il collo di bottiglia dell’intelligenza artificiale è rappresentato dall’hardware, o meglio dai costi per fornire potenza di calcolo sufficiente per fare lavorare le reti neurali. I server costano, l’energia elettrica costa, serve controllare il processo. OpenAI, come quasi tutti, è cresciuta appoggiandosi all’infrastruttura di Microsoft e ai chip Nvidia. Ma c’è un problema strutturale: più cresce ChatGPT, più cresce la bolletta computazionale. Per questo OpenAI ha scelto di spostarsi verso un modello “full stack”: controllare non solo i modelli e i prodotti, ma anche il silicio sottostante. Jalapeño nasce dentro questa strategia.