Dans la course à la construction d’infrastructures alimentant l’intelligence artificielle, Alphabet Inc. se trouve dans une position intéressante. Google : La société possède une activité de cloud computing saine, fabrique ses propres puces et a conclu des accords avec des sociétés comme Anthropic PBC et Meta Platforms Inc.
Le succès de Google a cependant rendu ses ressources informatiques très utiles, et ses propres chercheurs en IA ont dû s’y mettre.
L’été dernier, Andrew Dai, chercheur au laboratoire d’IA de Google, a découvert un angle mort dans Gemini, le modèle d’IA phare de l’entreprise. Tout en jouant à un jeu de société, Dai prend une photo du plateau et pose une question simple à Gemini : qui est le gagnant ? Il a été surpris et Gemini était confus, ainsi que les exemples des fans. Il connaissait la nécessité de créer une IA pour mieux comprendre ce qui se passait dans les images.
Dai a discuté de son idée avec certains de ses collègues, mais il a rapidement décidé qu’il ne pouvait pas utiliser le logiciel pour résoudre le problème chez Google, a-t-il déclaré dans une interview. Il devait quitter l’entreprise s’il voulait travailler.
Dai est l’un des employés actuels et anciens qui affirment que le leadership de Google dans le développement de l’IA a transformé la puissance de calcul en une ressource précieuse qui peut être utilisée par la plupart des personnes ayant des objectifs hautement prioritaires, tels que l’amélioration de Gemini.
Parfois, les chercheurs en IA pensent qu’ils n’ont pas la puissance de calcul nécessaire pour embaucher des clients, ont déclaré les sources. Les unités de recherche et de cloud computing de Google sont également en concurrence pour utiliser les puces de l’entreprise, appelées unités de processeur ou TPU. Dans le laboratoire DeepMind AI de Google, l’accès à la puissance de calcul influence les objectifs poursuivis par les chercheurs, les dirigeants avec lesquels ils se connectent et la vitesse à laquelle ils travaillent.
“Au sein de Google, chaque TPU compte trois candidats”, a déclaré Oren Etzioni, chercheur chevronné en IA et professeur émérite à l’Université de Washington. “Si vous êtes dans une position vulnérable où vous avez un programme cyclique de diffusion et que vous êtes en concurrence avec un client rentable, c’est une situation difficile à atteindre.”
Google a déclaré dans un communiqué que la société dispose “d’un processus solide et continu qui garantit que nos ressources informatiques sont allouées aux projets les plus importants, équilibrant les besoins des clients et des utilisateurs d’aujourd’hui avec nos investissements à long terme dans l’avancement de la recherche et de l’innovation”. Le PDG d’Alphabet, Sundar Pichai, a déclaré qu’au moment de décider où consacrer la puissance de calcul, les dirigeants de l’entreprise s’efforcent de s’assurer que Google DeepMind dispose des ressources nécessaires pour créer de nouveaux modèles d’IA, “car c’est la base de tout ce que nous faisons”.
Selon Alphabet, le rendement de Google Cloud – une mesure du travail sous contrat non encore enregistré comme chiffre d’affaires – a presque doublé par rapport au trimestre précédent, pour atteindre 460 milliards de dollars. “Nous sommes liés dans un avenir proche”, a déclaré Pichai. “Nous travaillons sur ce temps et cet investissement.” Google dévoilera mardi ses dernières avancées en matière de produits lors de sa conférence annuelle des développeurs à Mountain View.
Les chercheurs en IA ont dit un jour que Google était un endroit où ils pouvaient poursuivre leurs intérêts intellectuels, tout comme une université, mais avec un meilleur salaire et plus de ressources. Les chercheurs de l’entreprise réclament depuis longtemps plus de puissance de calcul, mais jusqu’à récemment, rares étaient les étudiants qui n’avaient pas un besoin urgent de mener des projets significatifs, ont déclaré d’anciens employés. Mais en 2022, le lancement du populaire chatbot OpenAI ChatGPT a incité Google à investir dans de grands modèles vocaux, des programmes d’IA capables de transformer une lettre ou une feuille de conditions à consonance professionnelle en quelques secondes. Maintenant que Google se concentre sur les étudiants qui écrivent du code logiciel, les concurrents ont présenté un produit qui rapporte de l’argent.
Dans le cadre de la stratégie suivie par les meilleurs laboratoires d’IA, “vous devez construire le meilleur modèle de codage au monde, car en fin de compte, personne ne veut être le deuxième derrière l’AGI”, a déclaré Dai, faisant référence à la grande ambition de la Silicon Valley de créer une IA capable de fonctionner de manière humaine. L’idée de consacrer des ressources à d’autres projets, notamment à des projets expérimentaux susceptibles de ne pas générer de revenus, sera plus difficile à justifier pour Google.
Dai a quitté Google pour fonder Elorian, une startup d’IA récemment sortie du mode furtif et spécialisée dans la pensée visuelle, qui, selon Dai, est essentielle pour amener l’IA dans des secteurs comme l’architecture, l’ingénierie et la robotique. Il est l’un des anciens chercheurs en IA de Google qui affirme qu’il est préférable de se lancer dans la puissance informatique en tant que fondateur de startup. Les chercheurs ont déclaré que cela donnerait aux startups la possibilité de trouver de la puissance de calcul à partir de plusieurs sources : elles pourraient utiliser les puces qu’elles souhaitent, sans avoir à naviguer dans la bureaucratie de Google ni à craindre de perdre l’accès si les priorités de l’entreprise changent.
Ioannis Antonoglou, ancien chercheur de Google DeepMind, a déclaré qu’il disposait d’une grande puissance de calcul lorsqu’il travaillait sur AlphaGo, un modèle d’IA conçu pour jouer au jeu de stratégie Go, qui a fait des vagues en battant l’un des meilleurs joueurs du monde. Plus tard, il a participé à la création de Gemini, l’une des initiatives stratégiques majeures de Google. Mais il pensait que l’entreprise ne consacrait pas autant d’efforts au post-formation, un domaine dans lequel les étudiants seraient intéressés par des données liées à des domaines spécifiques, tels que les documents juridiques ou le code informatique.
“Moi et mon co-fondateur, nous pensions que l’apprentissage par renforcement était la prochaine étape”, a déclaré Antonoglou, qui est parti avec son collègue chercheur de DeepMind Misha Laskin en 2024 pour fonder ReflectionAI, une startup dédiée à la création de modèles d’IA à l’air libre. “Il n’était pas clair que Google ou DeepMind emprunteraient cette voie à l’époque.”
Alors que les chercheurs en IA se préparent à apporter leur contribution, l’accès à la puissance de calcul constitue un atout que les entreprises peuvent exploiter. Anna Goldie, ancienne chercheuse de DeepMind, a déclaré que la société lui avait donné des droits sur ses logiciels pour tenter de l’empêcher de partir lancer la startup. Il a finalement quitté et fondé une société appelée Recursive Intelligence avec sa collègue chercheuse de DeepMind, Azalia Mirhoseini, qui a été lancée fin 2025.
Goldie a déclaré qu’il avait été étonné de la quantité de puissance informatique qu’il avait découverte, provenant de diverses sources. Il a refusé de préciser la quantité de puissance de calcul que l’entreprise a reçue après avoir levé 335 millions de dollars, mais a déclaré que cela était similaire à ce qu’on lui avait proposé de rester chez Google.
“Je n’ai pas besoin d’être 10 étages au-dessus de moi pour obtenir l’approbation”, a-t-il déclaré. “Je peux prendre des décisions avec mon co-fondateur pour faire ce qui est le mieux pour l’entreprise. Je peux écouter mes employés et écouter leurs idées.”
Dans les laboratoires d’IA, certains chercheurs travaillent sur des modèles de langage parce que c’est l’essentiel, même si leurs véritables intérêts sont ailleurs, explique Tom McGrath, un chercheur qui a quitté Google en 2023.
“Il y a la carotte du calcul et de la promotion et l’essentiel de la gloire d’organiser une grande campagne de formation”, déclare McGrath, scientifique principal chez Goodfire, une startup qui vise à mieux comprendre le fonctionnement interne des modèles d’IA. “Voilà l’arbre et il n’y a pas de navigateur sans toi.”
C’est un nouveau mode de vie pour certains chercheurs de Google. Pour poursuivre la concurrence en matière d’IA, Google fusionnera en 2023 deux laboratoires d’IA : DeepMind, basé à Londres, qui a une structure plus descendante, et Google Brain, où les chercheurs ont mené des projets dynamiques avec peu de supervision.
Les chercheurs sur le cerveau lui ont donné des crédits pour acheter des puces dans un système interne qui modifiait les prix en fonction de la demande, similaire à celui du marché boursier, ont déclaré Dai et Goldie. Certains chercheurs en ont profité au maximum en collectant des ressources, puis en utilisant les revenus de leurs collègues pendant qu’ils étaient en vacances ou dormaient, a déclaré Goldie. “C’est un moyen puissant de se rassembler et d’accomplir quelque chose”, a déclaré Goldie.
Google dispose toujours d’une réserve de puissance de calcul pour les chercheurs individuels, mais l’offre est limitée lorsque l’entreprise forme de grands modèles d’IA, a déclaré Dai. Les chercheurs se disputent essentiellement des parts du plus petit gâteau.
Ainsi, les chercheurs qui souhaitent davantage de puissance de calcul et se concentrer sur des questions de recherche à court terme trouveront quelque chose qui pourra être inclus dans la prochaine version de Gemini, a déclaré Dai. “Alors le leader pense que c’est mieux.”
Les chercheurs ne peuvent pas toujours se permettre d’obtenir la puissance de calcul qui leur a été promise. En 2024, une importante campagne de formation a contraint Google à interrompre certains projets de recherche pour le trimestre, a déclaré Dai. Certains ont quitté leur emploi.
Les alertes offrent “un niveau de contrôle sur votre propre destin – et plus de clarté si vous payez pour ce gros compte l’année prochaine, vous l’obtiendrez”, a déclaré Dai. “Personne ne te prendra.”
Pour tirer parti de la puissance de calcul à mesure qu’Elorian se développe, Dai a déclaré qu’il s’est concentré sur le recrutement de chercheurs expérimentés avec des ressources limitées.
“Le jeu de l’IA a toujours été doublé”, a déclaré Antonoglou. “L’un, qui possède le plus de logiciels. Le second, qui peut mieux l’utiliser.”
Love écrit pour Bloomberg.







