OpenAI ha finalmente tolto i veli sul suo primo processore custom, sviluppato in collaborazione con Broadcom. Battezzato Jalapeño, il chip è progettato specificamente per l'inferenza, ovvero l'esecuzione di modelli AI pre-addestrati in risposta ai comandi degli utenti. L'annuncio, dato oggi, segna un passo strategico per ridurre la dipendenza dai GPU Nvidia che dominano il settore.
Jalapeño: un chip progettato su misura per l'inferenza
Il nuovo processore è stato realizzato utilizzando anche i modelli AI di OpenAI per ottimizzare il design. Secondo l'azienda, i primi test mostrano un rapporto performance per watt significativamente superiore rispetto alle alternative attuali. Questo è cruciale perché l'inferenza rappresenta la fase operativa più costosa per l'AI generativa, e ogni riduzione dei costi può avere un impatto enorme sui bilanci aziendali.
Sponsored Protocol
Performance energetica e indipendenza da Nvidia
Con Jalapeño, OpenAI segue la scia di Google e Amazon, che hanno già sviluppato chip custom per l'AI. L'obiettivo è duplice: aumentare l'efficienza energetica e ridurre la dipendenza da un singolo fornitore. Il chip è specificamente ottimizzato per modelli di coding in tempo reale, ma è probabile che i carichi di lavoro più intensivi, come il pre-training, continuino a essere eseguiti su hardware Nvidia. Tuttavia, anche piccole riduzioni nei costi di inferenza possono migliorare significativamente i margini.
La visione full-stack di OpenAI
Greg Brockman, presidente di OpenAI, ha spiegato l'approccio in un podcast interno: "Abbiamo una comprensione profonda del carico di lavoro. Cerchiamo workload specifici che sono sottoserviti e costruiamo qualcosa che acceleri ciò che è possibile." Questo si inserisce in una strategia più ampia: OpenAI non sviluppa solo modelli all'avanguardia e prodotti come Codex, ma anche l'infrastruttura sottostante, inclusi chip, kernel, sistemi di memoria, networking e scheduling. Operando su tutta la pila tecnologica, ogni livello può essere ottimizzato per lo stesso obiettivo: rendere i modelli più veloci, affidabili e accessibili. Per un esempio di come i framework multi-agente stanno evolvendo, si veda Anthropic lancia Claude Tag, un agente AI persistente che lavora in Slack. Inoltre, i framework come AutoGen e CrewAI mostrano come la complessità multi-agente richieda infrastrutture sempre più specializzate.
Sponsored Protocol
Impatto economico e futuro dell'infrastruttura AI
L'ottimizzazione dell'inferenza è un fattore cruciale per l'economia dell'AI. Con chip custom come Jalapeño, OpenAI punta a ridurre i costi operativi e accelerare l'adozione di agenti AI. L'azienda ha inoltre annunciato che continuerà a investire in data center e sistemi di deployment. Per approfondire il concetto di acceleratore AI, si veda la voce su Wikipedia. Con questa mossa, OpenAI dimostra che il futuro dell'AI passa anche attraverso il controllo dell'hardware.
Sponsored Protocol
Fonte: https://techcrunch.com/2026/06/24/openai-unveils-its-first-custom-chip-built-by-broadcom