Anthropic wydaje Claude Opus 4.1

Anthropic udostępnia Claude Opus 4.1 – aktualizację flagowego modelu, która znacząco poprawia jakość kodowania i precyzję wyszukiwania informacji.

Karolina Ceroń

5 sie 2025

Claude Opus 4.1 to ulepszona wersja modelu Opus 4, dostępna od dziś dla użytkowników płatnych i w: Claude Code, Amazon Bedrock i Google Cloud Vertex AI. Cena pozostaje bez zmian, a różnice w wydajności są – jak zapewnia Anthropic – wyraźnie odczuwalne.

Nowa wersja osiąga 74,5% na benchmarku SWE-bench Verified. To istotna poprawa zdolności kodowania i najwyższy wynik w historii modeli Anthropic, przewyższający zarówno Opus 4 (72,5%), jak i Sonnet 3.7 (62,3%).

*Porównanie skuteczności modeli Claude w zadaniach kodowania (SWE-bench Verified). Źródło: Anthropic*

W testach Claude Opus 4.1 wykazał także lepsze śledzenie szczegółów, sprawność w refaktoryzacji kodu oraz umiejętność precyzyjnego rozumowania przy użyciu extended thinking – trybu wydłużonego myślenia wykorzystującego do 64 tys. tokenów. W benchmarkach TAU-bench model działał w wieloetapowych scenariuszach obejmujących nawet do 100 kroków (średnio poniżej 30), wykonując rozumowanie i używając narzędzi w oddzielnych etapach. Claude Opus 4.1 używa dwóch narzędzi: bash i edytora plików opartego na zamianie ciągów tekstowych. W przeciwieństwie do Sonnet 3.7. nie korzysta już z osobnego narzędzia planującego.

Model pracuje na tej samej architekturze, ale z nowym zakresem możliwości – szczególnie w wieloetapowych zadaniach i refaktoryzacji kodu, a jego wyniki są porównywane z modelem o3 od OpenAI oraz Gemini 2.5 Pro od Google.

*Wyniki Claude Opus 4.1 na tle innych modeli*. *Źródło: Anthropic*

Karolina Ceroń

Współtwórczyni newslettera AI Flash, studentka psychologii i pasjonatka sztucznej inteligencji. Interesuję się wpływem nowych technologii na człowieka, a w wolnych chwilach eksperymentuję z generatywną grafiką w Midjourney.

Podziel się

AI, Anthropic, claude

Podziel się

Może Cię zainteresować

Karolina Ceroń

Premiera GPT-5.2. Nowa seria modeli do zadań specjalnych

OpenAI udostępnia serię GPT-5.2, stworzoną z myślą o profesjonalnej pracy. Według deklaracji twórców, nowe modele mają lepiej radzić sobie z kodowaniem, analizą danych i długimi dokumentami, popełniając przy tym znacznie mniej błędów.

12.12
Karolina Ceroń

Mistral 3: Premiera nowej generacji modeli open-weight

Mistral AI prezentuje rodzinę modeli Mistral 3. Obejmuje ona wariant Large w architekturze MoE oraz serię Ministral na urządzenia lokalne. Wszystkie modele udostępniono na licencji Apache 2.0.

04.12
Karolina Ceroń

Claude Opus 4.5 : nowa jakość w kodowaniu?

Anthropic prezentuje Opus 4.5 – model, który ma przewyższać inżynierów w testach technicznych, kosztując przy tym ułamek ceny poprzednika.

27.11
Karolina Ceroń

Nano Banana Pro: Precyzja, tekst i weryfikacja

Google wprowadza Nano Banana Pro – model oparty na architekturze Gemini 3 Pro. Nowe rozwiązanie oferuje zaawansowaną obsługę tekstu, kontrolę nad oświetleniem oraz wbudowaną weryfikację SynthID.

21.11