
Anthropic udostępnia publicznie Claude Fable 5, swój najbardziej zaawansowany model, z automatycznym systemem bezpieczeństwa przekierowującym zapytania wysokiego ryzyka
Claude Fable 5, najbardziej zaawansowana sztuczna inteligencja, jaką Anthropic kiedykolwiek udostępnił ogółowi społeczeństwa, została wydana we wtorek z automatycznym systemem przekierowującym, który przełącza na bezpieczniejszy model, gdy użytkownicy zgłębiają tematy związane z cyberbezpieczeństwem lub biologią.
Publiczne udostępnienie ograniczonej potęgi
Anthropic we wtorek (9 czerwca) udostępnił Claude Fable 5 ogółowi, co jest pierwszym przypadkiem, gdy model z zaawansowanej klasy Mythos został wydany publicznie. Linia Mythos została zaprezentowana w kwietniu, ale pozostawała za zamkniętymi drzwiami ze względu na jej zdolność do wykrywania luk w cyberbezpieczeństwie w infrastrukturze krytycznej – w tym platformach bankowych i sieciach energetycznych – które umykają ludzkiej detekcji. W tym samym tygodniu Anthropic opublikował dokument wzywający główne laboratoria do rozważenia skoordynowanego spowolnienia AI, opisując możliwość „spowolnienia lub tymczasowego wstrzymania” globalnego postępu jako „prawdopodobnie pozytywną rzecz”.
Uruchomienie tak potężnego modelu wiąże się z ryzykiem. Bez zabezpieczeń zdolności Fable 5 w dziedzinach takich jak cyberbezpieczeństwo mogą zostać wykorzystane do wyrządzenia poważnych szkód.
Jak działa filtr bezpieczeństwa
Fable 5 zawiera to, co firma opisuje jako system „podwójnego toru” lub „kontroli ruchu lotniczego”. Gdy zapytanie użytkownika trafia do z góry określonego obszaru wysokiego ryzyka – cyberbezpieczeństwo i biologia to dwa najbardziej strzeżone domeny – model nie odpowiada bezpośrednio. Zamiast tego żądanie jest przekazywane do Claude Opus 4.8, mniej wydajnego, ale bezpieczniejszego modelu. Anthropic twierdzi, że to podejście, będące rozszerzeniem jego ram Constitutional AI, pozwala modelowi działać z pełną mocą w większości zadań, jednocześnie ograniczając wyniki w wrażliwych tematach. Obawy dotyczące ryzyka są dwojakie: zautomatyzowane wykorzystywanie luk w oprogramowaniu oraz nadużycia w naukach przyrodniczych.
- Claude Fable 5
- 80.3 %
- Claude Opus 4.8
- 69.2 %
Skok wydajności w porównaniu z poprzednimi modelami
Benchmarki pokazują skok pokoleniowy. W SWE-Bench Pro, który mierzy autonomiczne programowanie, Fable 5 uzyskał 80.3% wobec 69.2% dla poprzedniego najlepszego publicznego modelu, Claude Opus 4.8, przy czym różnica zwiększa się w przypadku dłuższych i bardziej złożonych zadań. Firma analityczna Hex poinformowała, że Fable 5 stał się pierwszym modelem, który przekroczył 90% w benchmarku dla złożonych, długotrwałych zadań analitycznych – poprawa o dziesięć punktów w porównaniu z generacją Opus. Anthropic twierdzi, że model „przekracza możliwości każdego modelu, jaki kiedykolwiek udostępniliśmy”, wskazując na jego siłę w pisaniu i debugowaniu kodu, odpowiadaniu na złożone pytania badawcze i analizowaniu obrazów.
Fable 5 przekracza możliwości każdego modelu, jaki kiedykolwiek udostępniliśmy.
Osobne ścieżki: Fable dla wszystkich, Mythos dla partnerów
Równolegle z publicznym udostępnieniem Anthropic oferuje nieograniczoną wersję o nazwie Claude Mythos 5 organizacjom, które już uzyskały dostęp do klasy Mythos. Są to przede wszystkim partnerzy z zakresu cyberbezpieczeństwa zapisani do Project Glasswing, inicjatywy uruchomionej w kwietniu 2026 roku w celu wykorzystania zaawansowanej AI do ochrony oprogramowania i infrastruktury krytycznej. Na początku czerwca członkostwo wzrosło do około 200 organizacji z ponad 15 krajów. Rząd USA, który był w sporze prawnym z firmą, również przetestował model ze względów bezpieczeństwa i od tego czasu zawarł porozumienie z Białym Domem w sprawie testowania potężnych modeli AI.
Sprzeczności i obawy
Moment wydania spotkał się z krytyką. Na kilka dni przed premierą publiczny dokument Anthropic wzywał do ogólnobranżowego spowolnienia, ostrzegając, że modele graniczne mogą wkrótce zacząć się samodoskonalić bez nadzoru człowieka. Wydanie modelu z tej samej klasy Mythos, która wywołała te obawy, skłoniło niektórych obserwatorów do kwestionowania spójności firmy. Wcześniej, gdy po raz pierwszy ogłoszono Project Glasswing, krytycy oskarżali Anthropic o wyolbrzymianie zagrożenia cybernetycznego jako taktyki marketingowej. Firma utrzymuje, że zabezpieczenia Fable 5 czynią go bezpiecznym do masowego użytku, podczas gdy nieograniczony Mythos 5 pozostaje ściśle kontrolowany.


