f in x
Rivoluzione AI Modulare: MeMo del MIT e Pinterest Insegnano a Potenziare l'AI Senza Riqualificare
> cd .. / HUB_EDITORIALE > Visualizza in Inglese
News

Rivoluzione AI Modulare: MeMo del MIT e Pinterest Insegnano a Potenziare l'AI Senza Riqualificare

[2026-05-29] Author: Ing. Calogero Bono

L'intelligenza artificiale modulare sta ridefinendo il modo in cui le aziende aggiornano i loro modelli linguistici. Due annunci recenti mostrano come sia possibile migliorare le performance e ridurre i costi senza dover riqualificare l'intero sistema. Il primo arriva dal MIT con il framework MeMo, che consente di sostituire il modello di ragionamento con uno più potente senza alcun ritraining, ottenendo un incremento delle performance fino al 26%. Il secondo viene da Pinterest, che ha smontato il layer visivo di Qwen3-VL per sostituirlo con embedding proprietari, tagliando i costi del 90% e aumentando la precisione del 30%.

Un approccio modulare per l'aggiornamento continuo

MeMo separa la memoria dalla ragione: un piccolo modello dedicato (MEMORY) assorbe nuove conoscenze, mentre il motore di ragionamento (EXECUTIVE) resta congelato. Quando arriva una domanda complessa, l'EXECUTIVE interroga il MEMORY con sotto-domande atomiche e sintetizza la risposta. Questo elimina i problemi di contesto limitato dei sistemi RAG tradizionali e previene il fenomeno del catastrophic forgetting tipico del fine-tuning diretto. Pinterest ha adottato una strategia simile: ha letteralmente estratto il vision encoder di Qwen3-VL e lo ha sostituito con embedding sviluppati internamente, precomputati offline. Il risultato è una latenza 20 volte inferiore e una precisione maggiore, perché gli embedding catturano metadata specifici dei pin e delle immagini.

Perché questa tendenza è cruciale per le imprese

La staticità dei modelli addestrati è stata a lungo il tallone d'Achille dell'AI enterprise. Le soluzioni tradizionali come il fine-tuning sono proibitivamente costose e incompatibili con modelli chiusi. I sistemi RAG soffrono di rumore e limiti di contesto. MeMo e Pinterest dimostrano che una architettura modulare permette aggiornamenti continui a costi sostenibili, proteggendo al contempo le capacità acquisite. Come spiega Daniela Rus del MIT CSAIL, in futuro i modelli di memoria diventeranno componenti standard al pari di caching e indicizzazione. Nel frattempo, Pinterest ha già costruito un taste graph che evolve con le preferenze degli utenti, guidandoli dalla scoperta all'acquisto.

Le implicazioni concrete sono enormi: un'azienda può addestrare un piccolo modello di memoria sui propri dati privati e poi collegarlo ai migliori modelli commerciali senza dover ripetere l'addestramento. Il tutto con un miglioramento misurabile delle performance e una drastica riduzione dei costi di inferenza. Per approfondire, leggi anche Groq e i 650 milioni per l'inferenza AI e la guida SQL per capire come gestire dati strutturati. Per un approfondimento esterno autorevole, consulta l'articolo originale su VentureBeat.

Sponsored Protocol

Ing. Calogero Bono

> AUTHOR_EXTRACTED

Ing. Calogero Bono

Co-founder di Meteora Web. Ingegnere informatico, sviluppo ecosistemi digitali ad alte prestazioni. AI, automazione, SEO tecnica e infrastrutture web. Scrivo di tecnologia per rendere complesso… semplice.

[ Read Full Dossier ]

Hai bisogno di applicare questa strategia?

Esegui il protocollo di contatto per iniziare un progetto con noi.

> INIZIA_PROGETTO

Sponsored

> MW_JOURNAL

> READ_ALL()