
Google ogranicza Meta dostęp do modeli AI Gemini, ujawniając głęboki niedobór mocy obliczeniowej w branży
Ograniczenie, ujawnione przez Financial Times, zakłóciło wewnętrzne projekty Meta i zmusiło giganta mediów społecznościowych do nakłaniania pracowników do bardziej efektywnego korzystania z tokenów AI.
Ograniczenie i jego bezpośrednie skutki
Google poinformował Meta około marca, że nie może zapewnić pełnej wydajności AI Gemini, jaką chciał zakupić gigant mediów społecznościowych, według trzech osób zaznajomionych ze sprawą, cytowanych przez Financial Times. Niedobór zakłócił i opóźnił niektóre wewnętrzne projekty AI Meta, a ograniczenie nadal obowiązuje. Inni klienci Google Cloud również odczuli ograniczenia mocy obliczeniowej, choć w mniejszym stopniu. Meta została dotknięta szczególnie mocno ze względu na wyjątkowo wysoki popyt na modele Google.
Reakcja Meta
W wyniku ograniczeń i szerszych działań na rzecz usprawnienia kosztów AI, Meta zachęciła pracowników do bardziej efektywnego korzystania z tokenów AI, jednostek mierzących użycie modeli. Firma początkowo polegała na Gemini w procesach bezpieczeństwa, takich jak usuwanie szkodliwych treści i zwalczanie oszustw, ale zaczęła przenosić obciążenia na Muse Spark, nowy wewnętrzny model opracowany w ramach swojego działu Superintelligence Labs. Te wewnętrzne ruchy przyspieszyły po tym, jak Meta zwolniła 8 000 pracowników w maju, przeniosła 7 000 pracowników na stanowiska związane z AI i ustaliła prognozę wydatków kapitałowych na poziomie 115–135 miliardów dolarów na 2026 rok.
Własne zmagania Google z wydajnością
Przychody Google Cloud przekroczyły 20 miliardów dolarów w pierwszym kwartale, ale dyrektor generalny Sundar Pichai powiedział, że krótkoterminowe ograniczenia mocy obliczeniowej uniemożliwiły jeszcze wyższy wzrost i przyczyniły się do prawie podwojenia zaległości jednostki kwartał do kwartału, do ponad 460 miliardów dolarów. Napięcie skłoniło Google do podpisania w czerwcu umowy o wartości 920 milionów dolarów miesięcznie na wynajem mocy obliczeniowej od SpaceX Elona Muska, nazywając to „pomostową przepustowością”, aby sprostać rosnącemu popytowi na Gemini Enterprise.Nasze przychody z chmury byłyby wyższe, gdybyśmy byli w stanie sprostać popytowi.
Szerszy wzorzec branżowy
Ta sytuacja daje rzadki wgląd w wąskie gardła infrastruktury, których nawet największe firmy technologiczne nie są w stanie przezwyciężyć wydatkami. Pomimo dziesiątek miliardów dolarów płynących do chipów, centrów danych i energii, popyt na obciążenia wnioskowania AI rośnie szybciej niż podaż. Google, wydając w tym roku ponad 180 miliardów dolarów na nakłady inwestycyjne i wciąż racjonując dostęp tak dużemu klientowi jak Meta, jednocześnie wynajmując procesory graficzne od firmy rakietowej, jest najwyraźniejszym sygnałem, że rozbudowa infrastruktury AI nie nadąża za konsumpcją.
- Google informuje Meta, że nie może zapewnić pełnej wydajności Gemini, zakłócając niektóre wewnętrzne projekty AI Meta
- Przychody Google Cloud przekraczają 20 mld USD w I kwartale; dyrektor generalny Pichai mówi, że ograniczenia mocy obliczeniowej ograniczyły wzrost
- Meta zwalnia 8 000 pracowników, przenosi 7 000 pracowników do AI i uruchamia wewnętrzny model Muse Spark
- Google podpisuje umowę z SpaceX na 920 mln USD miesięcznie za 110 000 procesorów graficznych Nvidia jako pomostową przepustowość
Co dalej
Dla Meta ograniczenie Gemini przyspiesza transformację, którą już realizowała: przejście od zewnętrznych modeli granicznych do wewnętrznych alternatyw zdolnych do obsługi krytycznych obciążeń na dużą skalę. Szerzej rozumiana branża stoi przed tym samym strukturalnym napięciem, gdzie wzrost przychodów i wdrażanie modeli są ograniczone fizycznymi limitami mocy obliczeniowej, których nawet rekordowe wydatki nie były w stanie wystarczająco szybko podnieść.
- Przychody
- 20 $mld
- Zaległości
- 460 $mld


