f in x
Amazon presenta un framework per agenti AI affidabili basato su coerenza e robustezza
> cd .. / HUB_EDITORIALE > Visualizza in Inglese
News

Amazon presenta un framework per agenti AI affidabili basato su coerenza e robustezza

[2026-06-25] Author: Meteora Web

Amazon ha svelato un nuovo approccio per garantire l'affidabilità degli agenti di intelligenza artificiale, superando i tradizionali punteggi EVAL. Bryan Silverthorn, direttore del laboratorio AGI Autonomy di Amazon, ha illustrato in anteprima a VentureBeat il framework che l'azienda presenterà al VB Transform 2026. Il cuore della strategia è un sistema strutturato che valuta gli agenti AI non solo per le prestazioni grezze, ma per coerenza, robustezza, prevedibilità e sicurezza.

I limiti degli EVAL score negli agenti AI

Secondo Silverthorn, i benchmark standard come gli EVAL score offrono solo un'istantanea statica delle performance, incapace di catturare la prevedibilità dell'agente su prompt, ambienti e tipi di input diversi. Questa carenza spiega perché molti leader IT sono riluttanti a concedere permessi di accesso ai sistemi aziendali. Un'indagine di VentureBeat Q2 Pulse Research su oltre 100 senior technology leader ha rivelato che solo il 4% si fida esclusivamente delle barriere di protezione dei modelli. Il 40% teme l'accesso non autorizzato a strumenti o dati, mentre il 27% cita la manipolazione o l'iniezione di prompt come principale preoccupazione.

Sponsored Protocol

Il framework Amazon: sistemi disaccoppiati e controllo umano

L'approccio di Amazon si allontana dall'idea che i modelli possano essere resi sicuri solo tramite barriere interne. Invece, enfatizza sistemi disaccoppiati, come ambienti sandbox dove gli agenti propongono modifiche che vengono poi riviste da un umano prima dell'implementazione. Questa strategia mira a colmare il divario di fiducia, privilegiando interazioni verificabili anche in domini critici come la finanza, dove il danno potenziale di un agente è significativo. Silverthorn ha sottolineato l'importanza di passare da semplici wrapper a singolo agente verso architetture multi-strumento in grado di autocorreggersi durante l'esecuzione.

Sponsored Protocol

Un esempio concreto di come l'AI possa operare in contesti ad alta affidabilità arriva dalla simulazione farmaceutica di Stanford, dove 10.000 agenti AI hanno replicato l'intero ciclo di scoperta dei farmaci, dimostrando che tassi di fallimento potrebbero crollare. Parallelamente, strumenti come Mistral OCR 4 migliorano l'estrazione documentale per le imprese europee, integrando affidabilità nei processi aziendali. Questi sviluppi mostrano come il settore stia cercando di bilanciare capacità e sicurezza.

Il futuro della fiducia negli agenti AI: da VB Transform a Waymo

Al VB Transform 2026, in programma il 14 e 15 luglio a Menlo Park, Silverthorn approfondirà il framework nella sessione "Closing the capability-reliability gap". Un altro intervento chiave sarà quello di Manasi Joshi, direttrice di systems intelligence e machine learning di Waymo, che illustrerà come costruire AI sicura ed efficiente per il mondo fisico. La conferenza rappresenta un'occasione per esplorare soluzioni pratiche al problema della fiducia, un tema sempre più cruciale man mano che gli agenti AI vengono delegati a compiti autonomi nelle aziende.

Sponsored Protocol

Per approfondimenti sulle sfide dell'AI agentica, si può consultare la fonte originale su VentureBeat.

Fonte: https://venturebeat.com/orchestration/amazon-will-present-its-framework-for-engineering-trustworthy-ai-agents-at-vb-transform-2026

Meteora Web

> AUTHOR_EXTRACTED

Meteora Web

[ Read Full Dossier ]

> METEORA_WEB // WEB AGENCY

Costruiamo la presenza digitale che la tua azienda merita.

Siti web, social, pubblicità online, e-commerce e hosting performante: ingegnerizzati con metodo da ingegneri informatici a Sciacca, per tutta Italia.

> MW_JOURNAL

> READ_ALL()