KI-generiert·Mehr erfahren
© The Verge
KI & Tech·vor 2 Std.

SpaceX vermietet Colossus 1 an Anthropic, nachdem Latenzprobleme und Hardware-Inkompatibilität Grok-Pläne durchkreuzen

SpaceX hat die gesamte Kapazität seines Rechenzentrums in Memphis an Anthropic vermietet, nachdem Latenzprobleme und eine Fehlanpassung der Hardware das Unternehmen daran gehindert hatten, die Einrichtung zum Training seiner Grok-KI-Modelle zu nutzen. Der Deal bringt 1,25 Milliarden Dollar pro Monat ein.

Technische Hürden

SpaceX hatte geplant, seine hochmodernen Grok-KI-Modelle mit einem Cluster aus drei Rechenzentrums-Campussen zu trainieren. Wie mit der Angelegenheit vertraute Personen Bloomberg mitteilten, stieß das Unternehmen auf Latenzprobleme bei der Verbindung seiner Colossus-1-Anlage in Memphis mit zwei anderen Standorten, die mehr als 16 Kilometer entfernt liegen. Die alternde Netzwerkinfrastruktur verschärfte das Problem. Das Training großer KI-Modelle erfordert ultraschnelle Verbindungen zwischen den Standorten, und die älteren Verbindungen mit niedrigerer Bandbreite verursachten Verzögerungen, die den gesamten Cluster verlangsamten. SpaceX kam zu dem Schluss, dass die Anlage als Mietobjekt mehr Wert generieren würde, als wenn sie ungenutzt bliebe.

Hardware-Inkompatibilität

Die Chip-Konfiguration in Colossus 1 verschlimmerte die Situation. Das Rechenzentrum beherbergt eine Mischung von Nvidia-Chipgenerationen, darunter Hopper- und Blackwell-Systeme sowie ältere Beschleuniger. Colossus 2 und 3 wurden einheitlicher um Nvidias Blackwell-Chips herum gebaut. In einem verteilten Trainingscluster müssen Arbeitslasten synchronisiert bleiben, sodass ältere Prozessoren zu Engpässen führen, indem sie schnellere Beschleuniger zum Warten zwingen. Der Cluster arbeitet nahe an der Geschwindigkeit seiner langsamsten Komponente.

Kommerzieller Geldsegen

Anthropic zahlt nun 1,25 Milliarden Dollar pro Monat für die Nutzung der Anlage, die SpaceXs eigene Ingenieure nicht vollständig nutzen konnten. Zusammen mit einem separaten Google-Deal über 920 Millionen Dollar monatlich für Rechenkapazität kassiert SpaceX rund 2,17 Milliarden Dollar pro Monat für Infrastruktur, die ursprünglich für den internen Gebrauch gebaut wurde. Musk hat das Arrangement mit Anthropic als 180-Tage-Leasingvertrag mit einem gegenseitigen Kündigungsrecht von 90 Tagen beschrieben, wobei die Möglichkeit erhalten bleibt, die Kapazität zurückzufordern.

Wenn die Rechenleistung super knapp wird, habe ich gesagt, dass wir sie irgendwann vielleicht zurückbrauchen.

Monatliche Rechenleistungs-Miete von Colossus 1 und zugehöriger Kapazität · Mio. USD/Monat
Anthropic
1250 Mio. USD/Monat
Google
920 Mio. USD/Monat

IPO-Erzählung in Frage gestellt

Die Enthüllung verkompliziert die Geschichte, die SpaceX während seiner IPO-Roadshow präsentierte. Das Unternehmen hob wiederholt hervor, dass Colossus 1 in nur 122 Tagen gebaut wurde, weit unter dem Branchendurchschnitt. Geschwindigkeit war ein Verkaufsargument. Bloombergs Berichterstattung deutet darauf hin, dass diese Geschwindigkeit ihren Preis hatte: Die Anlage wurde nicht einheitlich genug gebaut, um als Teil eines größeren Trainingsclusters zu dienen.

Groks Zukunft

SpaceX-Finanzvorstand Bret Johnsen sagte, das Unternehmen habe seine internen KI-Dienste, einschließlich Grok, nicht aufgegeben. Die Tür bleibt für SpaceX offen, die Kapazität bei Bedarf zurückzufordern, obwohl Groks Entwicklung dies ungewiss macht. SpaceX plant weiterhin, satellitengestützte KI-Server zu entwickeln, getrennt von den Problemen mit den bodengestützten Clustern.

Memphis

3 Quellen

Pollar Weekly abonnieren

Die Woche in Nachrichten, jeden Freitag. Kostenlos.

Kostenlos. Kein Tracking, keine Werbung. Jederzeit abbestellbar.

Mehr aus Gesellschaft & Wissenschaft