Liquid AI, fondata da ex ricercatori del MIT, ha rilasciato oggi il suo modello linguistico più compatto, denominato LFM2.5-230M. Con soli 230 milioni di parametri, questo modello foundation è progettato per eseguire flussi di lavoro agentici direttamente su dispositivi locali, come smartphone, laptop e robot. Secondo l'azienda, la sua ridotta dimensione consente di operare quasi ovunque, superando modelli di dimensioni quadruple in specifici benchmark di estrazione dati.
Architettura ibrida che supera i transformer tradizionali
Il modello LFM2.5-230M abbandona l'architettura standard dei transformer a favore del framework LFM2, un sistema ibrido che combina convoluzioni gated a corto raggio con attention a grouped-query. Questa scelta progettuale permette di gestire contesti lunghi fino a 32K token senza i costi quadratici di memoria tipici dei meccanismi di attention puri. Il footprint di memoria è inferiore a 400MB, consentendo l'esecuzione su hardware fortemente vincolato come il Raspberry Pi 5, dove raggiunge 42 token al secondo, mentre su un Samsung Galaxy S25 Ultra con CPU Snapdragon Gen4 arriva a 213 token al secondo.
Sponsored Protocol
Superiore nell'estrazione dati rispetto a modelli quattro volte più grandi
Nei test di benchmark, LFM2.5-230M ottiene un punteggio di 43.26 su BFCLv3 per il tool calling, dominando il modello IBM Granite 4.0-350M (39.58) e superando ampiamente il Google Gemma 3 1B IT (16.61). Su CaseReportBench per l'estrazione dati, segna 22.51, surclassando il Qwen3.5-0.8B (Instruct). Liquid AI sottolinea che questa efficienza lo rende ideale per pipeline ETL basate su intelligenza artificiale, dove può estrarre dati da PDF, email o form web e strutturarli in JSON senza regole rigide.
Licenza dual-use per sviluppatori e grandi aziende
Il modello è distribuito sotto la LFM Open License v1.0, una licenza commerciale dual-use non OSI. Per sviluppatori indipendenti, ricercatori e startup con ricavi inferiori a 10 milioni di dollari annui, la licenza è gratuita e permette riproduzione, modifica e distribuzione. Le grandi aziende che superano questa soglia devono negoziare un accordo commerciale separato. Questa strategia favorisce l'adozione grassroots proteggendo al contempo la proprietà intellettuale di Liquid AI.
Sponsored Protocol
L'azienda ha dimostrato le capacità del modello su un robot umanoide Unitree G1, dove LFM2.5-230M, eseguito interamente su un modulo NVIDIA Jetson Orin, ha tradotto comandi complessi in piani multi-step, coordinando movimenti come camminare avanti, indietro e inginocchiarsi. Il modello è già disponibile su Hugging Face con supporto nativo per llama.cpp, MLX, vLLM, SGLang e ONNX.
L'ascesa dei modelli compatti segna un cambio di paradigma nel settore dell'intelligenza artificiale. Mentre colossi come OpenAI e Google spingono verso parametri miliardari, la scommessa di Liquid AI sull'efficienza architetturale dimostra che è possibile ottenere prestazioni elevate su dispositivi edge senza dipendere da costose chiamate API cloud. Per le aziende che gestiscono volumi elevati di dati non strutturati, come fatture o telemetria, l'utilizzo di modelli massicci sarebbe economicamente insostenibile. LFM2.5-230M offre un'alternativa concreta per automatizzare l'estrazione a costi ridotti e latenza minima, direttamente sull'hardware locale.
Sponsored Protocol
Per approfondire il tema dell'IA agentica sui dispositivi edge, leggi l'articolo su Notion che chiude Notion Mail per puntare sugli agenti AI. Inoltre, la acquisizione di Cursor da parte di SpaceX evidenzia come la fiducia nella generazione di codice AI sia la prossima frontiera. Per una panoramica sull'impatto dell'IA nel settore finanziario, consulta l'articolo su Google Finance con funzionalità AI.
Fonte esterna: VentureBeat.