La startup giapponese Sakana AI ha presentato Fugu, un sistema di orchestrazione multi-agente che utilizza una pool di modelli linguistici di vari fornitori per ottenere prestazioni di frontiera attraverso una singola API compatibile con OpenAI. Fugu, che in giapponese significa 'pesce palla', è progettato per offrire resilienza contro il vendor lock-in e i controlli geopolitici sulle esportazioni, un tema diventato caldo dopo che Anthropic ha ritirato l'accesso ai suoi modelli più potenti, Claude Mythos 5 e Claude Fable 5, a seguito di un ordine del governo statunitense.
Fugu supera i benchmark di Claude Fable 5 su LiveCodeBench e GPQA-D
Secondo i dati diffusi da Sakana, Fugu Ultra ha raggiunto un punteggio del 93,2% su LiveCodeBench, un benchmark di codifica aggiornato periodicamente, superando il 89,8% di Claude Fable 5. Anche sulla versione base, Fugu ha ottenuto il 92,9%, dimostrando che un'orchestrazione ben congegnata può eguagliare o superare i modelli monolitici più avanzati. Nel test GPQA-D, composto da 198 domande a scelta multipla di livello universitario in biologia, fisica e chimica, Fugu e Fugu Ultra hanno entrambi totalizzato il 95,5%, battendo il 94,6% del precedente Claude Mythos Preview. Questi risultati suggeriscono che l'approccio collettivo di Fugu è particolarmente efficace su compiti che richiedono più passaggi e competenze diversificate.
Sponsored Protocol
Come funziona l'orchestrazione di Fugu e perché è importante per le imprese
A differenza dei tradizionali router di modelli, che si limitano a smistare una richiesta verso il singolo modello più adatto, Fugu opera come un appaltatore generale: scompone il problema in sottocompiti, li assegna a modelli specializzati, verifica i risultati e sintetizza l'output finale. Il sistema si basa su due articoli di ricerca di Sakana del 2026, TRINITY e Conductor, e utilizza strategie di coordinamento apprese automaticamente. Per l'utente finale, l'intera complessità è nascosta dietro un endpoint API standard. David Ha, CEO e co-fondatore di Sakana (ex Google Brain), ha dichiarato che 'i modelli di orchestrazione sono la prossima frontiera, oltre ai modelli più grandi'. In un contesto in cui l'accesso ai migliori modelli può essere revocato da un giorno all'altro, Fugu offre una soluzione pratica: il sistema può semplicemente instradare le richieste verso altri modelli disponibili, riducendo il rischio di interruzioni.
Sponsored Protocol
Disponibilità geografica limitata e prezzi elevati per Fugu Ultra
Fugu è disponibile da subito in gran parte del mondo, con l'eccezione temporanea dell'Unione Europea e dello Spazio Economico Europeo, mentre Sakana lavora per allineare la propria architettura di routing a black box con il GDPR. I prezzi sono articolati in abbonamenti mensili (Standard a 20 dollari, Pro a 100, Max a 200) e un piano pay-as-you-go. Per la versione Fugu Ultra, il costo è di 5 dollari per milione di token in input e 30 per l'output, che lo colloca tra le opzioni più care, paragonabile a GPT-5.5 di OpenAI. Tuttavia, per carichi di lavoro estremi con contesto superiore a 272mila token, i prezzi salgono rispettivamente a 10 e 45 dollari. Inoltre, Fugu fattura anche i token utilizzati per l'orchestrazione interna, un dettaglio importante per chi pianifica i costi operativi.
Sponsored Protocol
Implicazioni per lo sviluppo di infrastrutture AI resilienti
L'approccio di Sakana rappresenta un cambiamento di paradigma: invece di puntare su un unico modello monolitico, Fugu sfrutta l'intelligenza collettiva di più modelli, riducendo la dipendenza da un singolo fornitore. Questo è particolarmente rilevante per le aziende e le nazioni che vogliono proteggersi da rischi geopolitici e normativi. Come sottolineato nel nostro articolo su Meta e la rivolta dei suoi ingegneri AI, la gestione del talento e delle risorse tecnologiche è cruciale per l'innovazione. Con Fugu, le imprese possono costruire stack AI con ridondanza nativa, garantendo continuità operativa anche in caso di restrizioni improvvise. Tuttavia, la natura proprietaria delle informazioni di routing e l'assenza di trasparenza sui modelli utilizzati sollevano interrogativi sulla sovranità dei dati, come evidenziato da alcuni commenti nella community di sviluppatori.
Sponsored Protocol
Per approfondire il concetto di sistemi multi-agente, si può consultare la voce su Wikipedia.