Toutes les deux semaines, quelqu'un me demande ce que je ferai quand Apple annoncera le nouveau Siri. La question implicite est toujours : vous n'avez pas peur ?

Je n'ai pas peur. Et je veux expliquer pourquoi, car je pense que le cadrage que la plupart des gens apportent à cela est exactement à l'envers.

Ce qui est sur le point de se produire

À la WWDC en juin, ou dans les semaines qui la précèdent, on s'attend largement à ce qu'Apple annonce une mise à niveau significative de Siri. Ce qui a fuité jusqu'à présent pointe vers une interaction conversationnelle, une intégration plus profonde des apps, une conscience du contexte personnel et – le point intéressant – un partenariat backend avec un modèle cloud de pointe. Les reportages actuels nomment Google Gemini comme partenaire pour "les requêtes qui nécessitent une recherche web."

Quand cette annonce tombera, deux choses se produiront. La presse tech la présentera comme Apple rattrapant enfin son retard sur l'IA. Une partie des fondateurs et investisseurs de l'espace IA personnelle paniquera en privé, parce qu'une entreprise avec deux milliards d'appareils et un bilan à mille milliards de dollars vient d'entrer sur leur marché.

Ces deux réactions sont fausses.

Ce qu'Apple vous dit réellement

Apple a passé vingt ans à se positionner comme la plateforme privacy-first. "Ce qui se passe sur votre iPhone reste sur votre iPhone." Ce n'est pas un slogan jetable. C'est la pièce maîtresse de la façon dont ils se différencient de Google, et ils ont été prêts à encaisser des milliards de dollars de pertes de revenus pour le défendre.

Si Apple pouvait construire un assistant personnel de pointe entièrement sur l'appareil, ils le feraient. Ils ont le matériel, l'OS, la base d'utilisateurs et le capital. Ils n'auraient pas besoin de Google. Ils préféreraient ne pas avoir besoin de Google. Chaque dollar qu'ils acheminent vers Gemini est un dollar de leur propre marge plus une dépendance stratégique envers un concurrent direct.

Ils le font quand même. Cela vous dit quelque chose d'important : même Apple ne peut pas construire une IA personnelle véritablement utile entièrement sur l'appareil avec les outils dont ils disposent en 2026. Le framework Apple Intelligence Foundation Models, limité à macOS Tahoe et à une fenêtre de contexte de 4k, ne suffit pas. Siri a besoin de plus. Plus de raisonnement. Plus de contexte. Plus de flexibilité. Alors Apple fait la chose qu'ils ont passé deux décennies à promettre de ne pas faire, et achemine vos requêtes via les serveurs de quelqu'un d'autre.

L'entreprise de tech grand public la plus obsédée par la confidentialité de la planète vient de concéder qu'elle ne peut pas construire une IA personnelle en local. Lisez ça deux fois. Cela vous dit exactement à quel point le problème est difficile, et exactement à quel point le marché est vaste.

Si le problème était facile, Apple l'aurait résolu. Si le marché était petit, Apple ne s'en soucierait pas. Le fait qu'ils fassent un compromis sur le principe qu'ils sont le plus célèbres pour défendre est le signal le plus fort possible que l'IA personnelle est la catégorie de la décennie.

La catégorie routée vers le cloud contre la catégorie local-first

Voici le cadrage que je trouve plus utile que menace-contre-validation.

L'IA personnelle se divise en deux catégories. Les assistants personnels routés vers le cloud et les assistants personnels local-first. De loin, ils se ressemblent – tous deux répondent à des questions sur votre vie, tous deux lisent vos messages, tous deux savent qui sont vos amis. Sous le capot, ce sont des produits entièrement différents avec des modèles de confiance entièrement différents.

L'IA personnelle routée vers le cloud, c'est Apple avec Gemini, Google avec sa propre stack, Perplexity Personal Computer, Poke, Omi, la plupart des startups bien financées de l'espace. Leur raisonnement se produit sur le matériel de quelqu'un d'autre. Leur mémoire vit dans la base de données de quelqu'un d'autre. La proposition de valeur est "le modèle le plus capable possible, nourri de votre vie." La proposition de confiance est "nous promettons d'être prudents."

L'IA personnelle local-first, c'est Ostler et un nombre restreint mais croissant d'autres. Le raisonnement sur votre machine. La mémoire sur votre machine. L'accès réseau uniquement pour les requêtes que vous autorisez explicitement. La proposition de valeur est "une intelligence suffisamment bonne, avec une garantie de confiance incassable." La proposition de confiance est architecturale, pas contractuelle. Nous ne pouvons pas faire fuir vos données parce que nous ne les avons pas.

Les deux catégories existeront. Les deux auront de vrais clients. La question intéressante est de savoir quelle proportion du marché finit dans chacune, et à quelle vitesse.

Pourquoi je pense que le partage tourne en notre faveur avec le temps

Trois raisons.

Premièrement, les modèles locaux ne cessent de s'améliorer à un rythme cumulatif. La courbe coût-qualité des modèles open-weight a chuté d'un facteur 280 en deux ans. Un modèle de 9 milliards de paramètres tournant aujourd'hui sur un Mac Mini fait ce qui nécessitait un appel cloud il y a deux ans. L'année prochaine, il fera plus. À un certain point, l'écart de capacité entre cloud et local descend sous le seuil où les utilisateurs s'en soucient, et tout ce qui reste est l'écart de confiance, qui pointe dans l'autre sens.

Deuxièmement, la première violation grave de confidentialité dans la catégorie routée vers le cloud remodelera la conversation de façon permanente. Cela ne s'est pas encore produit. Cela arrivera. Les produits d'IA personnelle reposent sur les données les plus intimes qu'une plateforme ait jamais agrégées – vos messages, votre calendrier, vos rendez-vous médicaux, vos relations, vos pensées à demi formées. La première fois qu'une violation, une assignation ou un changement de conditions d'utilisation exposera cela à grande échelle, chaque produit d'IA personnelle routé vers le cloud devra répondre du choix d'architecture. Ceux qui ont fait l'autre choix n'auront pas à le faire.

Troisièmement, et c'est le point le plus subtil : les choses dans lesquelles l'IA personnelle excelle sont de plus en plus des choses pour lesquelles vous ne voulez pas d'un modèle de pointe. "Rédige une réponse à ce fil sur lequel nous étions la semaine dernière" ne tire aucun bénéfice de mille milliards de paramètres de connaissance d'internet. Cela tire profit de savoir comment vous écrivez et de quoi vous parliez en dernier. Cette connaissance vit sur votre appareil. Le routage vers le cloud lui est activement hostile, car chaque aller-retour de requête détruit l'intimité du contexte.

La posture confiante

Je ne pense pas que la bonne réponse à l'annonce d'Apple soit de concurrencer sur leur terrain. Ils ont l'intégration, la distribution, le statut par défaut. Nous ne ferons pas plus Apple qu'Apple sur les requêtes générales assistées par le cloud, et nous ne devrions pas essayer.

La bonne réponse est de s'investir davantage dans la catégorie dont Apple confirme implicitement l'existence mais qu'ils ont choisi de ne pas servir. La catégorie où l'utilisateur dit : je veux ceci, je le veux bon, et je veux qu'il reste sur ma machine. Voilà le pari. L'annonce d'Apple, quand qu'elle tombe, rend le pari plus évident, pas moins.

Alors quand la keynote de la WWDC aura lieu, et que Siri fera quelque chose d'impressionnant via un partenaire cloud, et que la presse tech parlera du retour enfin d'Apple dans la course à l'IA – nous écrirons probablement un autre billet de blog. Le titre sera une variante de merci de valider la catégorie. Parce que c'est ce que ce sera.

D'accord, pas d'accord, vous pensez que j'ai mal lu les fuites – [email protected].