Anthropic wydaje Claude Opus 4.1

Anthropic udostępnia Claude Opus 4.1 – aktualizację flagowego modelu, która znacząco poprawia jakość kodowania i precyzję wyszukiwania informacji.

Karolina Ceroń

Loading the Elevenlabs Text to Speech AudioNative Player…

Claude Opus 4.1 to ulepszona wersja modelu Opus 4, dostępna od dziś dla użytkowników płatnych i w: Claude Code, Amazon Bedrock i Google Cloud Vertex AI. Cena pozostaje bez zmian, a różnice w wydajności są – jak zapewnia Anthropic – wyraźnie odczuwalne.

Nowa wersja osiąga 74,5% na benchmarku SWE-bench Verified. To istotna poprawa zdolności kodowania i najwyższy wynik w historii modeli Anthropic, przewyższający zarówno Opus 4 (72,5%), jak i Sonnet 3.7 (62,3%).


Porównanie skuteczności modeli Claude w zadaniach kodowania (SWE-bench Verified). Źródło: Anthropic

W testach Claude Opus 4.1 wykazał także lepsze śledzenie szczegółów, sprawność w refaktoryzacji kodu oraz umiejętność precyzyjnego rozumowania przy użyciu extended thinking – trybu wydłużonego myślenia wykorzystującego do 64 tys. tokenów. W benchmarkach TAU-bench model działał w wieloetapowych scenariuszach obejmujących nawet do 100 kroków (średnio poniżej 30), wykonując rozumowanie i używając narzędzi w oddzielnych etapach. Claude Opus 4.1 używa dwóch narzędzi: bash i edytora plików opartego na zamianie ciągów tekstowych. W przeciwieństwie do Sonnet 3.7. nie korzysta już z osobnego narzędzia planującego.

Model pracuje na tej samej architekturze, ale z nowym zakresem możliwości – szczególnie w wieloetapowych zadaniach i refaktoryzacji kodu, a jego wyniki są porównywane z modelem o3 od OpenAI oraz Gemini 2.5 Pro od Google.

Wyniki Claude Opus 4.1 na tle innych modeli. Źródło: Anthropic

Współtwórczyni newslettera AI Flash, studentka psychologii i pasjonatka sztucznej inteligencji. Interesuję się wpływem nowych technologii na człowieka, a w wolnych chwilach eksperymentuję z generatywną grafiką w Midjourney.

Podziel się

Może Cię zainteresować