Apple Intelligence: il Data Center più Grande del Mondo
L'inferenza distribuita è la prossima tappa dell'Intelligenza Artificiale
Apple non sta perdendo la sfida dell’Intelligenza Artificiale: sta giocando una partita completamente diversa e ha già costruito, senza che nessuno se ne accorgesse, il più grande data center del mondo. La competizione in questo mercato è feroce e riguarda ogni aspetto dell’industria, ma Cupertino possiede un vantaggio unico che gli altri player non avranno la possibilità di eguagliare.
Disclaimer: sono un investitore Apple.
La scommessa di Cupertino: l’AI locale, privata, personale, sicura e distribuita.
Mentre tutti gli altri player hanno investito centinaia di miliardi di dollari per costruire le proprie infrastrutture, la spesa prevista per Apple nel 2026 si ferma intorno ai 15 miliardi. Apple non ha un proprio modello, non possiede molti data center e non usa i dati dei propri utenti per il training. Ciononostante, è l’azienda meglio posizionata per la prossima fase della diffusione dell’AI, quella che sposta l’inferenza on device. Immagina di chiedere un consiglio al tuo amico al tuo fianco (inferenza on device) invece di inviare la richiesta a un esperto che vive dall’altra parte del mondo e aspettare la sua risposta (AI in Cloud).
Il settore dell’AI corre veloce perché la competizione è serrata in ogni aspetto. Le aziende competono sui modelli, sulle applicazioni, sui processori e sui dati. Con geometrie diverse, ogni attore cerca l’integrazione verticale sul maggior numero di queste componenti, rivolgendosi ai fornitori dove non arrivano con le proprie risorse o capacità. Osserviamo un mercato in evoluzione permanente: un anno fa sembrava che Google sarebbe stata spazzata via da OpenAI, poi ha rilasciato Gemini 3. Sembrava che Nvidia fosse irraggiungibile sui processori, ma AMD e Intel sono entrati nella partita. Abbiamo già parlato di quello che accade attorno ad Anthropic.
Anche nello sviluppo software, il mio settore, c’è una competizione spietata: Claude Code, Codex, VSCode con Copilot e Cursor sono ambienti agentici di sviluppo software che ogni mese rilasciano nuove feature cercando di conquistare il mercato. La conseguenza è che, mentre i player spendono centinaia di miliardi per investimenti software e hardware, i prezzi per i consumatori restano bassi e tendono a scendere. C’è chi, tra gli analisti, ha ipotizzato che l’Intelligenza Artificiale diventerà un mercato simile a quello dell’aviazione civile: margini bassi, competizione feroce tra le compagnie aeree con la conseguenza che tutto il valore viene catturato dagli utenti che possono viaggiare dove vogliono, quando vogliono, a prezzi accessibili.
In questo contesto, Apple è stata descritta come incerta, incapace di trovare una propria visione e di competere con Google, Amazon, OpenAI. È in parte così: ci sono stati ritardi nell’integrazione di Apple Intelligence nei prodotti e l’azienda non ha modelli propri efficienti come Gemini, GPT o Opus, tanto che per la prossima fase il fornitore per questa componente sarà Google. Mentre la concorrenza investiva 600 miliardi l’anno (combinati), Cupertino ne spendeva un decimo del più vicino concorrente: appena 15 miliardi la proiezione per il 2026.
Eppure, Apple è l’azienda meglio posizionata per dominare la prossima fase.
Ieri Cupertino ha presentato i nuovi chip M5 Max e Pro, con un design pensato per l’inferenza, il processo che genera le risposte dei modelli AI. I test dimostrano un miglioramento enorme rispetto alla generazione precedente.
C’è una piccola notizia, passata inosservata, comprensibilmente perché si tratta di un fatto molto tecnico e oscuro ai più. Un programmatore ha pubblicato su Substack una serie di tre articoli, spiegando (e pubblicando il codice) come ha bypassato lo strato di software di Apple per accedere direttamente all’Apple Neural Engine (ANE), la parte di processore che si occupa dell’inferenza, su un chip M4. Ha potuto eseguire alcuni test e fare qualcosa che Apple non vuole gli utenti facciano.
I test hanno dimostrato che l’efficienza di ANE, in termini di energia consumata per token generati, è dell’ordine di grandezza dei TPU di Google, i chip usati nei loro data center. È poi riuscito ad addestrare un modello con il Neural Engine, un chip pensato e prodotto esclusivamente per l’inferenza.
Il più grande data center (distribuito) al mondo
Ho chiesto a Gemini e a Grok di fare una ricerca e una stima: quanta potenza di calcolo hanno installato Google, Amazon e Microsoft nei loro data center e qual è la potenza di calcolo combinata se consideriamo i dispositivi Apple attivi?
Apple ha costruito negli anni un enorme data center distribuito su 2.5 miliardi di dispositivi attivi (tra MacBook, MacMini, iPad, iPhone). La potenza totale combinata è di ordini di grandezza superiore a quella dei competitor: Grok stima un equivalente di milioni o decine di milioni di CPU H100 equivalenti (uno standard usato come benchmark nell’industria), gli altri player migliaia o alcuni milioni.
Apple sta giocando una partita diversa: mentre tutti sono impegnati a costruire data center per l’AI in Cloud, integrando verticalmente le principali applicazioni, Cupertino scommette sui modelli locali, sull’inferenza distribuita. Il nuovo chip M5 Pro è in grado di eseguire un modello Open Source interamente on device quattro volte più velocemente della precedente generazione.
L’esecuzione on device offre parecchi vantaggi sia per gli utenti che per i fornitori: minore latenza, maggiore sicurezza e privacy, esecuzione offline. Scaricando i costi energetici sui consumatori, Apple non deve risolvere il problema dei data center: l’ha già risolto.
Larry Ellison, qualche giorno fa, osservava come i modelli sul mercato stiano convergendo perché sono addestrati fondamentalmente sugli stessi dataset: le informazioni che si trovano in rete. Con qualche variazione nella selezione, certo, ma sempre gli stessi dati, pubblici.
Privacy e dati: il bunker di Cupertino
Apple può contare sul patrimonio di dati che gli utenti custodiscono, al sicuro, sui propri dispositivi che sono considerati lo stato dell’arte in termini di privacy e sicurezza di un prodotto consumer (da poco, peraltro, approvato per l’uso in seno alla NATO proprio per queste caratteristiche). Come abbiamo visto, i chip serie M hanno già la capacità di addestrare modelli e l’accordo recentemente siglato con Google, hanno dichiarato, prevede che Gemini venga per lo più eseguito on device.
Apple, pur limitata dalla mancanza di un proprio modello all’altezza dei concorrenti, si sta posizionando come il più grande data center distribuito del mondo, senza spendere centinaia di miliardi per costruire infrastrutture che invecchiano in pochi mesi e sono già osteggiate dalle popolazioni locali perché responsabili dell’aumento incontrollato dei costi dell’energia.
Con una capacità di calcolo già installata e l’incomparabile vantaggio della privacy dei dati on-device, il posizionamento strategico di Apple la rende l’unica azienda in grado di cogliere appieno il potenziale dell’inferenza distribuita.
Per gli abbonati a pagamento, l’analisi che ho fatto con Gemini sulla potenza di calcolo distribuita rispetto ai concorrenti.



