Il 7 aprile Anthropic ha annunciato che il suo modello Claude Mythos Preview ha superato un limite critico per la sicurezza informatica. Per la prima volta, un sistema di intelligenza artificiale ha scoperto autonomamente migliaia di vulnerabilità zero-day nei principali sistemi operativi e browser, chiudendo quello che fino a quel momento era considerato un margine di sicurezza. Il dato è allarmante: mentre GPT-4 nel 2024 poteva sfruttare solo vulnerabilità note, Mythos le trova da solo.
Il margine di sicurezza si è chiuso
Un recente studio dell'Università dell'Illinois mostrava che, senza una descrizione CVE, GPT-4 riusciva a sfruttare solo il 7% di un dataset. Oggi Mythos ha raggiunto l'83,1% nel benchmark CyberGym di riproduzione delle vulnerabilità. In una campagna contro OpenBSD, il costo totale di calcolo è stato inferiore a 20.000 dollari. Le tempistiche di sfruttamento si stanno comprimendo: la CVE-2026-33017 (Langflow, CVSS 9.8) è stata attaccata 20 ore dopo la divulgazione, mentre la CVE-2026-39987 (Marimo, CVSS 9.3) è stata colpita in meno di 10 ore. Il rapporto M-Trends 2026 di Google conferma che lo sfruttamento avviene prima ancora del rilascio della patch.
Perché i processi tradizionali falliscono
Il rapporto Rapid7 2026 indica che il tempo mediano tra pubblicazione CVE e inserimento nel catalogo KEV di CISA è di cinque giorni. Un lasso ormai insostenibile. Molte organizzazioni basano la priorità sul solo punteggio CVSS, ma un CVSS 8.8 con sfruttamento attivo (come Docker CVE-2026-34040) riceve meno attenzione di un CVSS 9.8 teorico. La soluzione proposta è un filtro di prioritizzazione a tre strati: stato KEV CISA, punteggio EPSS (Exploit Prediction Scoring System) e CVSS. Questo approccio, validato su 28.377 vulnerabilità reali, aumenta l'efficienza di 18 volte e riduce del 95% il carico di lavoro urgente.
Azioni concrete per la sicurezza aziendale
La finestra di patch non è più sicura. È necessario adottare un patching event-driven per i servizi critici, con l'obiettivo di applicare la patch in meno di quattro ore dalla dichiarazione di criticità. Parallelamente, occorre mappare il raggio di esplosione delle credenziali per ogni host AI builder (Langflow, Flowise, n8n) e testare i confini di autorizzazione con scenari specifici per agenti AI, come richieste di dimensioni superiori a 1 MB. Come raccomandato dagli esperti, se una patch non può essere applicata entro quattro ore, vanno implementati controlli compensativi immediati: rimozione dell'esposizione internet, rotazione delle credenziali e disabilitazione della funzionalità vulnerabile. Per approfondire il tema della sicurezza offensiva in Italia, leggi il nostro articolo su Ethical Hacking in Italia: metodologia operativa e framework legale.
Il messaggio è chiaro: l'avversario opera in meno di 20 ore. Chi continua con cicli di patch calendariali è già in ritardo. Per maggiori informazioni, consulta il catalogo ufficiale di CISA sulle vulnerabilità note sfruttate: CISA Known Exploited Vulnerabilities Catalog.
Sponsored Protocol