OpenAI presenta Jalapeño: il primo chip custom per l'inferenza AI • Meteora Web Agency

OpenAI ha finalmente tolto i veli sul suo primo processore custom, sviluppato in collaborazione con Broadcom. Battezzato Jalapeño, il chip è progettato specificamente per l'inferenza, ovvero l'esecuzione di modelli AI pre-addestrati in risposta ai comandi degli utenti. L'annuncio, dato oggi, segna un passo strategico per ridurre la dipendenza dai GPU Nvidia che dominano il settore.

Jalapeño: un chip progettato su misura per l'inferenza

Il nuovo processore è stato realizzato utilizzando anche i modelli AI di OpenAI per ottimizzare il design. Secondo l'azienda, i primi test mostrano un rapporto performance per watt significativamente superiore rispetto alle alternative attuali. Questo è cruciale perché l'inferenza rappresenta la fase operativa più costosa per l'AI generativa, e ogni riduzione dei costi può avere un impatto enorme sui bilanci aziendali.

Performance energetica e indipendenza da Nvidia

Con Jalapeño, OpenAI segue la scia di Google e Amazon, che hanno già sviluppato chip custom per l'AI. L'obiettivo è duplice: aumentare l'efficienza energetica e ridurre la dipendenza da un singolo fornitore. Il chip è specificamente ottimizzato per modelli di coding in tempo reale, ma è probabile che i carichi di lavoro più intensivi, come il pre-training, continuino a essere eseguiti su hardware Nvidia. Tuttavia, anche piccole riduzioni nei costi di inferenza possono migliorare significativamente i margini.

La visione full-stack di OpenAI

Greg Brockman, presidente di OpenAI, ha spiegato l'approccio in un podcast interno: "Abbiamo una comprensione profonda del carico di lavoro. Cerchiamo workload specifici che sono sottoserviti e costruiamo qualcosa che acceleri ciò che è possibile." Questo si inserisce in una strategia più ampia: OpenAI non sviluppa solo modelli all'avanguardia e prodotti come Codex, ma anche l'infrastruttura sottostante, inclusi chip, kernel, sistemi di memoria, networking e scheduling. Operando su tutta la pila tecnologica, ogni livello può essere ottimizzato per lo stesso obiettivo: rendere i modelli più veloci, affidabili e accessibili. Per un esempio di come i framework multi-agente stanno evolvendo, si veda Anthropic lancia Claude Tag, un agente AI persistente che lavora in Slack. Inoltre, i framework come AutoGen e CrewAI mostrano come la complessità multi-agente richieda infrastrutture sempre più specializzate.

Impatto economico e futuro dell'infrastruttura AI

L'ottimizzazione dell'inferenza è un fattore cruciale per l'economia dell'AI. Con chip custom come Jalapeño, OpenAI punta a ridurre i costi operativi e accelerare l'adozione di agenti AI. L'azienda ha inoltre annunciato che continuerà a investire in data center e sistemi di deployment. Per approfondire il concetto di acceleratore AI, si veda la voce su Wikipedia. Con questa mossa, OpenAI dimostra che il futuro dell'AI passa anche attraverso il controllo dell'hardware.

Fonte: https://techcrunch.com/2026/06/24/openai-unveils-its-first-custom-chip-built-by-broadcom

OpenAI presenta Jalapeño, il suo primo chip custom realizzato con Broadcom per l'inferenza AI

Jalapeño: un chip progettato su misura per l'inferenza

Performance energetica e indipendenza da Nvidia

La visione full-stack di OpenAI

Impatto economico e futuro dell'infrastruttura AI

> AUTHOR_EXTRACTED

Meteora Web

Costruiamo la presenza digitale che la tua azienda merita.

Rimani sul pezzo

> MW_JOURNAL LATEST_LOGS

Stanford simula intero ciclo farmaceutico con 10.000 agenti AI: tasso di fallimento della scoperta farmaci potrebbe crollare

Esplorazione GA4 — Report Funnel e Coorte per Analizzare il Percorso Cliente

NTSB apre indagine sull'incidente mortale in Texas con una Tesla che ha ucciso una pensionata

iPhone Ultra pieghevole di Apple in produzione a luglio nonostante problemi alla cerniera

Google Wallet introduce l'opzione Touchless ID per accelerare i controlli TSA PreCheck