Una startup ha aperto un varco nell'economia dell'intelligenza artificiale. Sapient Intelligence ha addestrato da zero un modello linguistico fondamentale da 1 miliardo di parametri con un costo di calcolo di circa 1.500 dollari, utilizzando solo 16 GPU per meno di due giorni. Il modello, chiamato HRM-Text, ha ottenuto risultati competitivi su benchmark come MMLU e GSM8K, sfidando modelli molto più grandi e costosi.
Una architettura che rompe lo scaling dogma
HRM-Text si basa su un'architettura ricorrente gerarchica (HRM) che separa i processi di ragionamento lento e veloce, eliminando la necessità di memorizzare l'intero internet. Invece di sprecare risorse per prevedere token noti, il modello si concentra esclusivamente su coppie istruzione-risposta. Questo approccio ha permesso di ridurre i dati di training a soli 40 miliardi di token, tra 100 e 900 volte meno rispetto ai modelli tradizionali. La stabilizzazione matematica è stata ottenuta con una tecnica chiamata MagicNorm.
Implicazioni per le imprese
Il costo irrisorio dell'addestramento cambia le regole del gioco. Mentre aziende come Amazon continuano a indebitarsi per miliardi nella corsa all'AI, e Warner Music acquisisce startup per tracciare l'uso dell'AI nella musica, Sapient dimostra che un'impresa può creare il proprio motore di ragionamento proprietario con un investimento minimo. Come spiega il CEO Guan Wang, l'AI smette di essere una questione di infrastruttura e diventa una questione di strategia: cosa deve sapere il nostro modello della nostra attività?
I risultati su benchmark come GSM8K (84,5%) e MATH (56,2%) confermano che HRM-Text è competitivo con modelli da 2 a 7 miliardi di parametri, ma con un costo computazionale 400 volte inferiore. Questo apre la strada a un'adozione enterprise massiccia, specialmente in settori regolamentati che richiedono modelli addestrati su dati proprietari senza esporli a frontiere esterne. Il passo successivo sarà integrare il modello in flussi di lavoro reali, come la finanza multi-step, la logica di conformità e l'automazione scientifica.
Articoli correlati: la sfida dei benchmark come GPT-5.5 vs Claude Fable 5 mostra che l'AI è ancora lontana dalla produttività reale, mentre la crescita del 300% degli agenti AI sottolinea l'urgenza per l'Europa di non restare a guardare.
Sponsored Protocol