Artificial Analysis, però, mostra che GLM-5.2 non è tra i modelli più efficienti in token. Nell’Intelligence Index usa 43mila token di output per task, di cui 37mila di reasoning. È più di GLM-5.1, che era a 26mila, e più di MiniMax-M3, a 24mila, Kimi K2.6, a 35mila, e DeepSeek V4 Pro max, a 37mila.
In generale, è per questo motivo che cresce il numero di aziende occidentali che usano modelli cinesi per task meno complessi: il risparmio è evidente.
Il tema del costo si intreccia con quello dell’accesso. Il 12 giugno 2026 Anthropic ha comunicato che il governo statunitense, per motivi di sicurezza nazionale, aveva emesso una direttiva di export control per sospendere l’accesso a Fable 5 e Mythos 5 a qualunque cittadino straniero, dentro o fuori dagli Stati Uniti. L’azienda ha scelto di togliere l’accesso ai due modelli per tutti i clienti e al momento siamo in una fase di negoziazione con il Governo Usa. Il blocco era scattato dopo che il Governo aveva appreso che alcuni attori statali avversari (cinesi e russi) avevano trovato grazie a quei modelli alcune vulnerabilità di importanza critica.
È qui che l’approccio open weights dei modelli cinesi fa la differenza. Un modello scaricabile e gestibile localmente riduce il rischio di revoca unilaterale dell’accesso da parte del provider o di un’autorità straniera. Non elimina però i problemi di sicurezza, compliance e geopolitica, però: attenzione.
Chiariamo: per le aziende occidentali, usare un modello cinese può voler dire due cose molto diverse. La prima è collegarsi via API ai server del provider, per esempio DeepSeek o Z.ai: in questo caso testi, prompt, documenti o codice possono uscire dall’ambiente aziendale e finire sotto regole, contratti e giurisdizioni non occidentali. È qui che nascono i problemi più delicati: protezione dei dati, segreti industriali, compliance, controlli interni e responsabilità in caso di uso improprio.
-U88011105152qkv-1440x752@IlSole24Ore-Web.jpg?r=1170x507)