
Google limite l'utilisation des modèles Gemini par Meta, révélant la grave pénurie de puissance de calcul dans le secteur
Cette restriction, révélée par le Financial Times, a perturbé des projets internes de Meta et contraint le géant des réseaux sociaux à demander à ses employés d'utiliser les tokens d'IA plus efficacement.
Le plafonnement et ses conséquences immédiates
Google a informé Meta vers mars qu'il ne pouvait pas fournir la pleine capacité Gemini que le réseau social souhaitait acheter, selon trois personnes proches du dossier citées par le Financial Times. Ce manque a perturbé et retardé certains projets internes d'IA de Meta, et la restriction reste en vigueur. D'autres clients de Google Cloud ont également été affectés par les contraintes de calcul, mais dans une moindre mesure. Meta a été particulièrement touché en raison de sa demande exceptionnellement élevée pour les modèles de Google.
La réponse de Meta
En raison des restrictions et d'une volonté plus large de rationaliser les coûts liés à l'IA, Meta a encouragé ses employés à être plus efficaces avec les tokens d'IA, les unités qui mesurent l'utilisation des modèles. L'entreprise s'appuyait initialement sur Gemini pour les processus de sécurité, comme la suppression de contenus nuisibles et la lutte contre les escroqueries, mais elle a commencé à transférer les charges de travail vers Muse Spark, un nouveau modèle interne développé au sein de sa division Superintelligence Labs. Ces mouvements internes se sont accélérés après que Meta a supprimé 8 000 emplois en mai, réaffecté 7 000 employés à des postes liés à l'IA et fixé des prévisions de dépenses d'investissement de 115 à 135 milliards de dollars pour 2026.
La propre course aux capacités de Google
Les revenus de Google Cloud ont dépassé 20 milliards de dollars au premier trimestre, mais le PDG Sundar Pichai a déclaré que les contraintes de calcul à court terme ont empêché une croissance encore plus forte et ont contribué à ce que le carnet de commandes de l'unité ait presque doublé d'un trimestre à l'autre pour atteindre plus de 460 milliards de dollars. La pression a poussé Google à signer un accord de 920 millions de dollars par mois début juin pour louer une capacité de calcul à SpaceX d'Elon Musk, qualifiant cela de « capacité de transition » pour répondre à la demande croissante de Gemini Enterprise.Nos revenus Cloud auraient été plus élevés si nous avions pu répondre à la demande.
Un schéma plus large dans le secteur
Cet épisode offre un rare aperçu des goulots d'étranglement d'infrastructure que même les plus grandes entreprises technologiques ne peuvent pas résoudre à coups de dépenses. Malgré des dizaines de milliards de dollars investis dans les puces, les centres de données et l'énergie, la demande pour les charges de travail d'inférence IA croît plus vite que l'offre. Google, qui dépense plus de 180 milliards de dollars en dépenses d'investissement cette année et rationne toujours l'accès à un client aussi important que Meta tout en louant des GPU à une entreprise de fusées, est le signal le plus clair que les infrastructures IA n'ont pas suivi le rythme de la consommation.
- Google informe Meta qu'il ne peut pas fournir la pleine capacité Gemini, perturbant certains projets internes d'IA de Meta
- Les revenus de Google Cloud dépassent 20 milliards de dollars au T1 ; le PDG Pichai déclare que les contraintes de calcul ont limité la croissance
- Meta supprime 8 000 emplois, réaffecte 7 000 employés à l'IA et lance le modèle interne Muse Spark
- Google signe un accord à 920 millions de dollars par mois avec SpaceX pour 110 000 GPU Nvidia comme capacité de transition
La suite
Pour Meta, le plafonnement de Gemini accélère une transition qu'il poursuivait déjà : passer des modèles frontières externes à des alternatives internes capables de gérer des charges de travail critiques à grande échelle. L'ensemble du secteur est confronté à la même tension structurelle, la croissance des revenus et le déploiement des modèles étant tous deux limités par des plafonds physiques de calcul que même des dépenses record n'ont pas réussi à relever assez rapidement.
- Revenus
- 20 mds USD
- Carnet de commandes
- 460 mds USD


