Negli ultimi giorni, il panorama dell'intelligenza artificiale ha assistito a un evento destinato a ridisegnare le dinamiche competitive del settore. La startup cinese Z.ai, precedentemente nota come Zhipu AI, ha rilasciato GLM-5.2, un modello linguistico di grandi dimensioni con 753 miliardi di parametri, distribuito con licenza open-source MIT. Il modello è progettato per eccellere in compiti di coding autonomo e ingegneria a lungo orizzonte temporale, superando in diversi benchmark i colossi proprietari americani come GPT-5.5 di OpenAI e Claude Opus 4.8 di Anthropic, ma a un costo drasticamente inferiore.
Disponibile immediatamente su Hugging Face e tramite API ufficiale, GLM-5.2 vanta una finestra di contesto di 1 milione di token altamente stabile e piani di abbonamento enterprise a partire da soli 12,60 dollari al mese. La scelta di rilasciare i pesi con licenza MIT è stata accolta con entusiasmo dalla comunità degli sviluppatori, perché consente a qualsiasi azienda di scaricare il modello, personalizzarlo e eseguirlo localmente o su macchine virtuali, pagando solo il costo del calcolo e dell'elettricità. Questa opzione diventa particolarmente appetibile alla luce delle recenti incertezze regolatorie negli Stati Uniti, dove l'amministrazione Trump ha imposto restrizioni all'uso di modelli proprietari come Claude Fable 5 da parte di cittadini stranieri, spingendo Anthropic a ritirare completamente tali modelli.
Sponsored Protocol
Dal punto di vista architetturale, GLM-5.2 introduce IndexShare, una tecnica innovativa che riutilizza lo stesso indexer ogni quattro strati di attenzione sparsa, riducendo i FLOP per token di ben 2,9 volte nella finestra massima. A questo si aggiunge un livello di Multi-Token Prediction (MTP) potenziato per la decodifica speculativa, che aumenta la lunghezza dei token accettati fino al 20%. Inoltre, il modello offre modalità di pensiero selezionabili: "Max", per la massima potenza logica, e "High", che bilancia prestazioni e latenza dimezzando praticamente i token di output rispetto alla modalità Max.
Sponsored Protocol
I benchmark parlano chiaro: su SWE-bench Pro, GLM-5.2 raggiunge 62,1%, superando GPT-5.5 (58,6%) e il suo predecessore GLM-5.1 (58,4%). Su FrontierSWE, si attesta al 74,4%, battendo GPT-5.5 (72,6%) e sfiorando Claude Opus 4.8 (75,1%). Su MCP-Atlas, ottiene 77,0, superando GPT-5.5 (75,3%). Nel test Humanity's Last Exam con strumenti, fa segnare 54,7, meglio di GPT-5.5 (52,2). Nei carichi di lavoro estesi come PostTrainBench e SWE-Marathon, GLM-5.2 si dimostra superiore con 34,3% contro 25,0% e 13,0% contro 12,0% rispettivamente. Anche se perde leggermente su Terminal-Bench 2.1 (81,0 contro 85,0), supera Google Gemini 3.1 Pro (74,0) e conquista il primo posto su Design Arena con un ELO di 1360, battendo perfino Claude Fable 5.
I piani di abbonamento Coding Plan sono studiati per i flussi di lavoro degli sviluppatori: Lite a 12,60 $/mese per piccoli repository, Pro a 50,40 $ per progetti medi, Max a 112 $ per carichi pesanti. L'API costa 1,40 $ per milione di token in input e 4,40 $ per token in output, con un prezzo cache di soli 0,26 $ per milione. A confronto, GPT-5.5 costa 30 $ per output e Claude Opus 4.8 25 $. Come ha osservato l'analista Lisan al Gaib su X, "i laboratori di frontiera ti stanno assolutamente truffando sui prezzi API". La licenza MIT, priva di restrizioni regionali, rappresenta un punto di svolta per le imprese che vogliono evitare il vendor lock-in e le incertezze geopolitiche. La reazione degli sviluppatori è stata immediata: strumenti come Kilo Code, Cline IDE e Eigen AI hanno già integrato il modello. Per chi desidera approfondire il tema della regolamentazione nell'AI, è disponibile l'articolo correlato qui. Per una panoramica generale sui modelli linguistici, si può consultare la voce su Wikipedia.
Sponsored Protocol