Anthropic ha accettato di implementare una nuova salvaguardia per i suoi modelli di intelligenza artificiale Fable 5 e Mythos 5, dopo che l'amministrazione Trump aveva imposto restrizioni alla loro distribuzione. La misura, concordata con il Dipartimento del Commercio, mira a ripristinare la fiducia del governo e a superare il blocco imposto a febbraio. Secondo fonti interne, la nuova protezione estende il controllo anche a comportamenti specifici legati alla sicurezza informatica, identificati in uno studio di Amazon.
Il nuovo guardrail blocca richieste su vulnerabilità già note
La salvaguardia introdotta da Anthropic prevede che qualsiasi utente tenti di eludere le restrizioni su Fable 5 riceva una notifica di blocco e la richiesta venga reindirizzata al modello meno avanzato Opus 4.8. Prima della sospensione, le richieste relative a capacità sensibili di cybersecurity e biologia erano già filtrate tramite Opus 4.8. Ora, il perimetro si allarga anche a un particolare comportamento descritto in un paper di Amazon, come spiegato da Katie Moussouris, CEO di Luta Security. Secondo la sua analisi, alcuni utenti riuscivano a aggirare i blocchi chiedendo al modello di correggere codice invece di identificare falle, un espediente che ha spinto l'amministrazione a intervenire.
Sponsored Protocol
Il segretario al Commercio Howard Lutnick ha formalizzato l'accordo in una lettera, sottolineando che Anthropic si è impegnata a rilevare e affrontare proattivamente i rischi di sicurezza. Il Centro per l'IA e l'Innovazione del Dipartimento del Commercio ha giudicato le misure sufficientemente robuste per autorizzare il rilascio di Fable 5. Tuttavia, il Pentagono resta cauto: il segretario alla Difesa Pete Hegseth ha dichiarato che non esiste ancora un percorso chiaro per revocare l'ordine del 28 febbraio che designa Anthropic come rischio per la filiera. La tensione, quindi, non è del tutto rientrata.
Sponsored Protocol
Parallelamente, la Corte Suprema ha emesso una sentenza che favorisce i repubblicani in vista delle elezioni di midterm, consentendo ai partiti di coordinare messaggi e spese con le campagne. La decisione, 6-3, ribalta le precedenti limitazioni e potrebbe dare un vantaggio al Partito Repubblicano, che oggi dispone di maggiori risorse rispetto al Partito Democratico. Il Comitato Nazionale Repubblicano ha chiuso giugno con 125,5 milioni di dollari in cassa, contro i 14,9 milioni dei democratici. L'accesso a tariffe pubblicitarie agevolate, ora esteso anche ai partiti, potrebbe rafforzare la posizione dei candidati repubblicani in difficoltà.
Sponsored Protocol
Per approfondire le dinamiche tra Anthropic e l'amministrazione Trump, leggi l'articolo correlato: Anthropic si piega alla Casa Bianca — e l'Europa rischia di restare a guardare. Un'altra storia interessante è quella degli ex ricercatori DeepMind che hanno trasformato l'AI del poker in una società da 500 milioni. Per un contesto più ampio sulla sicurezza dell'IA, consulta Wikipedia sulla sicurezza dell'intelligenza artificiale.