Ogni paio di settimane qualcuno mi chiede cosa farò quando Apple annuncerà il nuovo Siri. La domanda implicita è sempre: non hai paura?

Non ho paura. E voglio spiegare perché, perché penso che l'inquadramento che la maggior parte delle persone porta a questo sia esattamente capovolto.

Cosa sta per accadere

Al WWDC di giugno, o nelle settimane che lo precedono, ci si aspetta ampiamente che Apple annunci un aggiornamento significativo di Siri. Quello che è trapelato finora punta a interazione conversazionale, integrazione più profonda con le app, consapevolezza del contesto personale e – il punto interessante – una partnership backend con un modello cloud di frontiera. I resoconti attuali nominano Google Gemini come partner per "le query che richiedono una ricerca web."

Quando quell'annuncio arriverà, accadranno due cose. La stampa tech lo inquadrerà come Apple che finalmente recupera terreno sull'IA. Una parte dei fondatori e degli investitori dello spazio dell'IA personale entrerà in panico in privato, perché un'azienda con due miliardi di dispositivi e un bilancio da mille miliardi di dollari è ora entrata nel loro mercato.

Entrambe queste reazioni sono sbagliate.

Cosa ti sta dicendo davvero Apple

Apple ha passato vent'anni a posizionarsi come la piattaforma privacy-first. "Ciò che accade sul tuo iPhone resta sul tuo iPhone." Non è uno slogan buttato lì. È il fulcro di come si differenziano da Google, e sono stati disposti a incassare miliardi di dollari di perdite di fatturato per difenderlo.

Se Apple potesse costruire un assistente personale di frontiera interamente sul dispositivo, lo farebbe. Hanno l'hardware, l'OS, la base di utenti e il capitale. Non avrebbero bisogno di Google. Preferirebbero non avere bisogno di Google. Ogni dollaro che instradano verso Gemini è un dollaro del loro margine più una dipendenza strategica da un concorrente diretto.

Lo fanno comunque. Questo ti dice qualcosa di importante: persino Apple non può costruire un'IA personale davvero utile interamente sul dispositivo con gli strumenti a loro disposizione nel 2026. Il framework Apple Intelligence Foundation Models, limitato a macOS Tahoe e a una finestra di contesto da 4k, non basta. Siri ha bisogno di più. Più ragionamento. Più contesto. Più flessibilità. Così Apple fa la cosa che ha passato due decenni a promettere di non fare, e instrada le tue query attraverso i server di qualcun altro.

L'azienda di tecnologia di consumo più ossessionata dalla privacy del pianeta ha appena ammesso di non poter costruire un'IA personale in locale. Leggilo due volte. Ti dice esattamente quanto è difficile il problema, ed esattamente quanto è grande il mercato.

Se il problema fosse facile, Apple l'avrebbe risolto. Se il mercato fosse piccolo, Apple non si darebbe pena. Il fatto che stiano scendendo a compromessi sul principio che sono più celebri per difendere è il segnale più forte possibile che l'IA personale è la categoria del decennio.

La categoria instradata al cloud contro la categoria local-first

Ecco l'inquadramento che ritengo più utile di minaccia-contro-validazione.

L'IA personale si sta dividendo in due categorie. Assistenti personali instradati al cloud e assistenti personali local-first. Da lontano sembrano simili – entrambi rispondono a domande sulla tua vita, entrambi leggono i tuoi messaggi, entrambi sanno chi sono i tuoi amici. Sotto il cofano sono prodotti completamente diversi con modelli di fiducia completamente diversi.

L'IA personale instradata al cloud è Apple con Gemini, Google con la propria stack, Perplexity Personal Computer, Poke, Omi, la maggior parte delle startup ben finanziate dello spazio. Il loro ragionamento avviene sull'hardware di qualcun altro. La loro memoria vive nel database di qualcun altro. La proposta di valore è "il modello più capace possibile, alimentato con la tua vita." La proposta di fiducia è "promettiamo di essere prudenti."

L'IA personale local-first è Ostler e un numero piccolo ma crescente di altri. Ragionamento sulla tua macchina. Memoria sulla tua macchina. Accesso alla rete solo per le query che autorizzi esplicitamente. La proposta di valore è "intelligenza abbastanza buona, con una garanzia di fiducia infrangibile." La proposta di fiducia è architetturale, non contrattuale. Non possiamo far trapelare i tuoi dati perché non li abbiamo.

Entrambe le categorie esisteranno. Entrambe avranno clienti reali. La domanda interessante è quale quota del mercato finisce in ciascuna, e con quale rapidità.

Perché penso che la divisione vada a nostro favore col tempo

Tre ragioni.

Primo, i modelli locali continuano a migliorare a un ritmo cumulativo. La curva costo-qualità per i modelli open-weight è crollata di 280 volte in due anni. Un modello da 9 miliardi di parametri che gira oggi su un Mac Mini fa ciò che due anni fa richiedeva una chiamata al cloud. L'anno prossimo farà di più. A un certo punto il divario di capacità tra cloud e local scende sotto la soglia in cui agli utenti importa, e tutto ciò che resta è il divario di fiducia, che punta nell'altra direzione.

Secondo, la prima grave violazione della privacy nella categoria instradata al cloud rimodellerà la conversazione in modo permanente. Non è ancora successo. Succederà. I prodotti di IA personale si poggiano sui dati più intimi che una piattaforma abbia mai aggregato – i tuoi messaggi, il tuo calendario, i tuoi appuntamenti medici, le tue relazioni, i tuoi pensieri semiformati. La prima volta che una violazione, una citazione in giudizio o una modifica ai termini di servizio esporrà tutto questo su larga scala, ogni prodotto di IA personale instradato al cloud dovrà rispondere della scelta architetturale. Quelli che hanno fatto l'altra scelta no.

Terzo, e questo è il punto più sottile: le cose in cui l'IA personale è brava sono sempre più cose per cui non vuoi un modello di frontiera. "Scrivi una risposta a quel thread su cui eravamo la settimana scorsa" non trae beneficio da mille miliardi di parametri di conoscenza di internet. Trae beneficio dal sapere come scrivi e di cosa stavi parlando per ultimo. Quella conoscenza vive sul tuo dispositivo. Il routing verso il cloud le è attivamente ostile, perché ogni viaggio di query distrugge l'intimità del contesto.

La postura sicura

Non penso che la risposta giusta all'annuncio di Apple sia competere sul loro terreno. Hanno l'integrazione, la distribuzione, il valore predefinito. Non supereremo Apple sulle query generiche assistite dal cloud, e non dovremmo provarci.

La risposta giusta è investire di più nella categoria di cui Apple conferma implicitamente l'esistenza ma che ha scelto di non servire. La categoria in cui l'utente dice: voglio questo, lo voglio buono, e voglio che resti sulla mia macchina. Questa è la scommessa. L'annuncio di Apple, quando arriverà, rende la scommessa più evidente, non meno.

Quindi quando ci sarà la keynote del WWDC, e Siri farà qualcosa di impressionante tramite un partner cloud, e la stampa tech parlerà di come Apple sia finalmente tornata nella corsa all'IA – probabilmente scriveremo un altro post sul blog. Il titolo sarà una variante di grazie per aver validato la categoria. Perché è ciò che sarà.

D'accordo, in disaccordo, pensi che io abbia letto male le indiscrezioni – [email protected].