Anthropic Fable 5: nuova misura di sicurezza per sbloccare il modello • Meteora Web Agency

Anthropic ha accettato di implementare una nuova salvaguardia per i suoi modelli di intelligenza artificiale Fable 5 e Mythos 5, dopo che l'amministrazione Trump aveva imposto restrizioni alla loro distribuzione. La misura, concordata con il Dipartimento del Commercio, mira a ripristinare la fiducia del governo e a superare il blocco imposto a febbraio. Secondo fonti interne, la nuova protezione estende il controllo anche a comportamenti specifici legati alla sicurezza informatica, identificati in uno studio di Amazon.

Il nuovo guardrail blocca richieste su vulnerabilità già note

La salvaguardia introdotta da Anthropic prevede che qualsiasi utente tenti di eludere le restrizioni su Fable 5 riceva una notifica di blocco e la richiesta venga reindirizzata al modello meno avanzato Opus 4.8. Prima della sospensione, le richieste relative a capacità sensibili di cybersecurity e biologia erano già filtrate tramite Opus 4.8. Ora, il perimetro si allarga anche a un particolare comportamento descritto in un paper di Amazon, come spiegato da Katie Moussouris, CEO di Luta Security. Secondo la sua analisi, alcuni utenti riuscivano a aggirare i blocchi chiedendo al modello di correggere codice invece di identificare falle, un espediente che ha spinto l'amministrazione a intervenire.

Il segretario al Commercio Howard Lutnick ha formalizzato l'accordo in una lettera, sottolineando che Anthropic si è impegnata a rilevare e affrontare proattivamente i rischi di sicurezza. Il Centro per l'IA e l'Innovazione del Dipartimento del Commercio ha giudicato le misure sufficientemente robuste per autorizzare il rilascio di Fable 5. Tuttavia, il Pentagono resta cauto: il segretario alla Difesa Pete Hegseth ha dichiarato che non esiste ancora un percorso chiaro per revocare l'ordine del 28 febbraio che designa Anthropic come rischio per la filiera. La tensione, quindi, non è del tutto rientrata.

Parallelamente, la Corte Suprema ha emesso una sentenza che favorisce i repubblicani in vista delle elezioni di midterm, consentendo ai partiti di coordinare messaggi e spese con le campagne. La decisione, 6-3, ribalta le precedenti limitazioni e potrebbe dare un vantaggio al Partito Repubblicano, che oggi dispone di maggiori risorse rispetto al Partito Democratico. Il Comitato Nazionale Repubblicano ha chiuso giugno con 125,5 milioni di dollari in cassa, contro i 14,9 milioni dei democratici. L'accesso a tariffe pubblicitarie agevolate, ora esteso anche ai partiti, potrebbe rafforzare la posizione dei candidati repubblicani in difficoltà.

Per approfondire le dinamiche tra Anthropic e l'amministrazione Trump, leggi l'articolo correlato: Anthropic si piega alla Casa Bianca — e l'Europa rischia di restare a guardare. Un'altra storia interessante è quella degli ex ricercatori DeepMind che hanno trasformato l'AI del poker in una società da 500 milioni. Per un contesto più ampio sulla sicurezza dell'IA, consulta Wikipedia sulla sicurezza dell'intelligenza artificiale.

Fonte: https://www.wired.com/story/anthropic-added-a-new-security-measure-to-get-back-into-the-trump-administrations-good-graces

Anthropic introduce una nuova misura di sicurezza per Fable 5 dopo le restrizioni dell'amministrazione Trump

Il nuovo guardrail blocca richieste su vulnerabilità già note

> AUTHOR_EXTRACTED

Ing. Pietro Maiorana

Costruiamo la presenza digitale che la tua azienda merita.

Rimani sul pezzo

> MW_JOURNAL LATEST_LOGS

Preventivi con Firma Elettronica — Accettati Velocemente e Senza Carta Stress

Samsung Messages cessa di funzionare a luglio 2026: gli utenti migrano forzatamente a Google Messages

Meta blocca la funzione Conversation Focus degli occhiali smart dietro un abbonamento da 20 dollari al mese

Google DeepMind lancia Nano Banana 2 Lite, il modello di generazione immagini più veloce ed economico

Apple aggiunge iPhone 16e ricondizionato allo Store con risparmi fino a 220 dollari