
Anthropic wprowadza Claude Sonnet 5, oferując możliwości agentowe zbliżone do Opus 4.8 w znacznie niższej cenie
Anthropic wypuścił średniej klasy model Claude Sonnet 5, oferujący autonomiczne zdolności agentowe zbliżone do flagowego Opus 4.8 przy 60% niższym koszcie, w miarę jak firma przyspiesza w kierunku IPO.
Szczegóły premiery
Sonnet 5 stał się domyślnym modelem dla warstw Claude Free i Pro 30 czerwca, a także jest dostępny dla klientów Max, Team i Enterprise. Anthropic nazywa go „najbardziej agentowym modelem Sonnet do tej pory”, zdolnym do planowania, korzystania z narzędzi takich jak przeglądarki i terminale oraz autonomicznego działania w zadaniach, które wcześniej wymagały większych modeli.
Potrafi tworzyć plany, używać narzędzi takich jak przeglądarki i terminale oraz działać autonomicznie na poziomie, który jeszcze kilka miesięcy temu wymagał większych i droższych modeli.
Testy wydajności zmniejszają dystans do Opus
W teście agentowego kodowania SWE-bench Pro Sonnet 5 uzyskuje 63,2%, w porównaniu do 58,1% Sonnet 4.6 i zbliżając się do 69,2% Opus 4.8. W Terminal-Bench 2.1 osiąga 80,4% wobec 82,7% Opusa. W teście pracy intelektualnej (GDPval-AA v2) Sonnet 5 zdobył 1618 punktów, nieznacznie powyżej 1615 Opusa. W zadaniach agentowych nowy model w znacznym stopniu pokrywa się z flagowym, działając przy niższym koszcie.
- Sonnet 4.6
- 58.1 %
- Sonnet 5
- 63.2 %
- Opus 4.8
- 69.2 %
Ceny i strategia rynkowa
Wstępne ceny API wynoszą 2 USD za milion tokenów wejściowych i 10 USD za milion tokenów wyjściowych do 31 sierpnia. Następnie ceny wzrosną do 3/15 USD według VentureBeat, choć TechCrunch podaje, że cena wyjściowa pozostanie na poziomie 10 USD. Każda z tych wartości utrzymuje Sonnet 5 znacznie poniżej stawek Opus 4.8 (5 USD wejście, 25 USD wyjście) oraz poniżej GPT-5.5 i Gemini 3.1 Pro. Firma chce demokratyzować dostęp do agentowej AI, budując szeroką bazę programistów przed planowanym IPO.
Tło regulacyjne i bezpieczeństwo
Anthropic twierdzi, że Sonnet 5 nie był celowo trenowany na zadaniach cyberbezpieczeństwa i stanowi „znacznie mniejsze zagrożenie w zakresie wykonywania niebezpiecznych zadań cyberbezpieczeństwa” niż modele Opus. Premiera następuje w trakcie rozmów z administracją Trumpa na temat dostępu do modeli. Rząd wcześniej poprosił Anthropic o usunięcie najpotężniejszych modeli (Mythos i Fable) ze względów bezpieczeństwa. Mythos jest teraz dostępny w ograniczonym zakresie, a Fable 5 ma wkrótce powrócić. Administracja poprosiła również OpenAI o rozłożenie w czasie premiery modeli z klasy GPT-5.6.
Krajobraz konkurencyjny
Premiera odzwierciedla podobne agentowe działania OpenAI (GPT-5.6 Sol zapowiedziany w zeszłym tygodniu) i Google (Gemini 3.5 Flash w maju). TechCrunch zauważa, że zdolności agentowe są teraz podstawowym oczekiwaniem, a różnicowanie przesuwa się w stronę kosztów i niezawodności. Axios informuje, że użytkownicy korporacyjni odchodzą od czatów na rzecz delegowania autonomicznych zadań agentom AI. Ruch Anthropic następuje również w obliczu rosnącej wrażliwości na koszty AI, która skłoniła niektórych programistów do tańszych chińskich modeli.


