KI-generiert·Mehr erfahren
© Deutsche Welle
KI & Tech·vor 3 Std.

Anthropic veröffentlicht Claude Fable 5 – das leistungsfähigste Modell mit automatischem Sicherheitssystem für risikoreiche Anfragen

Claude Fable 5, die leistungsfähigste KI, die Anthropic je der Allgemeinheit angeboten hat, wurde am Dienstag mit einem automatischen Umleitungssystem veröffentlicht, das bei Fragen zu Cybersicherheit oder Biologie auf ein sichereres Modell umschaltet.

Öffentliche Veröffentlichung eines eingeschränkten Kraftpakets

Anthropic hat am Dienstag (9. Juni) Claude Fable 5 allgemein verfügbar gemacht. Es ist das erste Mal, dass ein Modell aus der fortschrittlichen Mythos-Klasse der Öffentlichkeit zugänglich gemacht wird. Die Mythos-Reihe wurde im April vorgestellt, aber hinter verschlossenen Türen gehalten, weil sie in der Lage ist, Cyber-Sicherheitslücken in kritischen Infrastrukturen – darunter Bankenplattformen und Stromnetze – zu erkennen, die der menschlichen Detektion entgehen. In derselben Woche hatte Anthropic ein Dokument veröffentlicht, in dem große Labore aufgefordert wurden, über eine koordinierte Verlangsamung der KI-Entwicklung nachzudenken, und die Möglichkeit einer „Verlangsamung oder vorübergehenden Pause“ des globalen Fortschritts als „wahrscheinlich eine positive Sache“ beschrieben.

Die Veröffentlichung eines so leistungsstarken Modells birgt Risiken. Ohne Schutzmaßnahmen könnten die Fähigkeiten von Fable 5 in Bereichen wie der Cybersicherheit missbraucht werden, um ernsthaften Schaden anzurichten.

Anthropic

Wie der Sicherheitsfilter funktioniert

Fable 5 enthält ein System, das das Unternehmen als „Doppelspur“ oder „Flugverkehrskontrolle“ bezeichnet. Wenn eine Anfrage eines Nutzers in einen vordefinierten Hochrisikobereich fällt – Cybersicherheit und Biologie sind die beiden am stärksten abgeschirmten Bereiche –, antwortet das Modell nicht direkt. Stattdessen wird die Anfrage an Claude Opus 4.8 weitergeleitet, ein weniger leistungsfähiges, aber sichereres Modell. Anthropic sagt, dieser Ansatz, eine Erweiterung seines Constitutional-AI-Rahmenwerks, erlaube es dem Modell, bei den meisten Aufgaben mit voller Leistung zu arbeiten, während die Ausgabe bei sensiblen Themen begrenzt wird. Die Risikobewertung ist zweigeteilt: die automatisierte Ausnutzung von Softwareschwachstellen und der Missbrauch in den Biowissenschaften.

SWE-Bench Pro Benchmark: Claude Fable 5 vs. Vorgängermodell · %
Claude Fable 5
80.3 %
Claude Opus 4.8
69.2 %

Leistungssprung gegenüber Vorgängermodellen

Benchmarks zeigen einen Generationssprung. Im SWE-Bench Pro, der autonomes Programmieren misst, erzielte Fable 5 80,3 % gegenüber 69,2 % für das bisher beste öffentliche Modell, Claude Opus 4,8 – wobei die Kluft bei längeren und komplexeren Aufgaben noch größer wird. Die Analysefirma Hex berichtete, dass Fable 5 das erste Modell ist, das bei einem Benchmark für komplexe, langwierige Analyseaufgaben die 90 %-Marke überschreitet – eine Verbesserung um zehn Prozentpunkte gegenüber der Opus-Generation. Anthropic sagt, das Modell „übertrifft die Fähigkeiten aller Modelle, die wir je verfügbar gemacht haben“, und verweist auf seine Stärken beim Schreiben und Debuggen von Code, der Beantwortung komplexer Forschungsfragen und der Analyse von Bildern.

Fable 5 übertrifft die Fähigkeiten aller Modelle, die wir je verfügbar gemacht haben.

Anthropic

Getrennte Spuren: Fable für alle, Mythos für Partner

Parallel zur öffentlichen Veröffentlichung bietet Anthropic eine uneingeschränkte Version namens Claude Mythos 5 für Organisationen an, die bereits Zugang zur Mythos-Klasse haben. Dabei handelt es sich hauptsächlich um Cybersicherheitspartner, die im Rahmen des im April 2026 gestarteten Projekts Glasswing eingeschrieben sind, das fortschrittliche KI zum Schutz von Software und kritischer Infrastruktur einsetzt. Anfang Juni wuchs die Mitgliedschaft auf rund 200 Organisationen in mehr als 15 Ländern an. Auch die US-Regierung, die sich in einem Rechtsstreit mit dem Unternehmen befand, testete das Modell aus Sicherheitsbedenken und hat seitdem eine Vereinbarung mit dem Weißen Haus über das Testen leistungsstarker KI-Modelle getroffen.

Widersprüche und Bedenken

Das Timing hat Kritik hervorgerufen. Tage vor der Veröffentlichung forderte Anthropics öffentliches Dokument eine branchenweite Verlangsamung und warnte davor, dass Spitzenmodelle bald beginnen könnten, sich ohne menschliche Aufsicht selbst zu verbessern. Die Veröffentlichung eines Modells genau aus der Mythos-Klasse, die diese Befürchtungen ausgelöst hatte, hat einige Beobachter veranlasst, die Konsistenz des Unternehmens in Frage zu stellen. Bereits zuvor, als Project Glasswing erstmals angekündigt wurde, hatten Kritiker Anthropic vorgeworfen, die Cyber-Bedrohung als Marketingtaktik zu übertreiben. Das Unternehmen versichert, dass die Sicherheitsvorkehrungen von Fable 5 es für die Massennutzung sicher machten, während das uneingeschränkte Mythos 5 streng abgeschottet bleibe.

San Francisco

4 Quellen

Pollar Weekly abonnieren

Die Woche in Nachrichten, jeden Freitag. Kostenlos.

Kostenlos. Kein Tracking, keine Werbung. Jederzeit abbestellbar.

Mehr aus Gesellschaft & Wissenschaft
Johannesburg
Paris · Budapest · Reims · Toulouse · Grenoble