Grok łagodnieje? Nowy model od xAI

xAI wprowadza Groka 4.1 – najnowszą wersję swojego modelu językowego. Firma deklaruje znaczącą poprawę w zakresie rozumienia intencji, spójności wypowiedzi oraz redukcji błędów, co ma przełożyć się na wyższą jakość interakcji z użytkownikami.

Karolina Ceroń

Loading the Elevenlabs Text to Speech AudioNative Player…

xAI wprowadza Grok 4.1 – nowy model ma wprowadzić bardziej naturalny i angażujący styl rozmowy, większą empatię (podobnie jak GPT 5.1) oraz kreatywność, przy jednoczesnym zachowaniu wysokiej wiarygodności odpowiedzi. 

Co się zmieniło w praktyce?

Według xAI największe postępy dotyczą płynności dialogu, wyczucia kontekstu emocjonalnego i spójności osobowości. Model ma lepiej rozumieć subtelne intencje rozmówców, a jednocześnie pozostać szczery i maksymalnie pomocny. Te cechy uzyskano dzięki rozbudowanemu etapowi uczenia ze wzmocnieniem (reinforcement learning).

Twórcy obiecują też, że popracowali nad dwiema irytującymi cechami AI:

  • Kłamanie: Model ma być bardziej odporny na presję i rzadziej mijać się z prawdą, nawet gdy próbujemy go do tego zmusić podchwytliwymi pytaniami.
  • Przytakiwanie: Ograniczono tendencję bota do zgadzania się ze wszystkim, co napiszemy, tylko po to, by być miłym – nawet jeśli piszemy bzdury.

Dwa tygodnie cichych testów

Zanim oficjalnie ogłoszono premierę, xAI zrobiło mały eksperyment. Przez dwa tygodnie, od 1 do 14 listopada 2025 roku, część osób korzystających z serwisu rozmawiała już z nowym Grokiem, nawet o tym nie wiedząc. Wstępne wersje Grok 4.1 stopniowo obsługiwały coraz większy procent rzeczywistego ruchu. W ślepych testach porównawczych użytkownicy woleli odpowiedzi Grok 4.1 w 64,78% przypadków w stosunku do poprzedniej wersji produkcyjnej wersji.

Grok 4.1 plasuje się bardzo wysoko w popularnych rankingach takich jak LMArena, zarówno w trybie z dodatkowym rozumowaniem, jak i w szybkiej wersji bez myślenia.

Źródło: LMArena

xAI szczególnie podkreśla postępy w zadaniach wymagających empatii i umiejętności interpersonalnych. Wewnętrzne testy miały pokazać, że Grok 4.1 lepiej rozumie, o co nam tak naprawdę chodzi, gdy zadajemy pytanie, i potrafi dostosować ton rozmowy.

Ma to być widoczne także w zadaniach kreatywnych. Kiedy poprosimy go o napisanie opowiadania czy maila, styl ma być bardziej spójny i mniej chaotyczny. W benchmarku EQ-Bench3 nowa wersja osiąga jedne z najwyższych wyników spośród publicznie dostępnych modeli. Podobnie dobrze wypada w testach kreatywnego pisania (Creative Writing v3).

Źródło: xAI

Mniej halucynacji

Każdy, kto korzystał z AI, wie, że modele lubią czasem popłynąć i zmyślić fakt lub dwa. xAI zapewnia, że wzięło ten problem na warsztat. Dzięki dodatkowym zabiegom w fazie post-trainingu Grok 4.1 ma popełniać zauważalnie mniej błędów faktograficznych w odpowiedziach na pytania informacyjne – zarówno w testach wewnętrznych jak i na publicznym benchmarku FActScore.

Źródło: xAI

Bezpieczniej, ale nadal w stylu Groka

Model przeszedł rozbudowane testy bezpieczeństwa zgodnie z Risk Management Framework xAI. Grok ma odmawiać, gdy poprosimy go o coś nielegalnego (np. przepis na niebezpieczną substancję), ale nie powinien nas cenzurować w tematach, które są po prostu kontrowersyjne lub dyskusyjne.

Wygląda więc na to, że xAI próbuje trudnej sztuki: chce ucywilizować naczelnego buntownika wśród chatbotów, nie zabijając przy tym jego ducha. Czas pokaże, czy Grok faktycznie złagodniał, czy tylko nauczył się lepiej ukrywać swoje rogi przed cenzorami.

Współtwórczyni newslettera AI Flash, studentka psychologii i pasjonatka sztucznej inteligencji. Interesuję się wpływem nowych technologii na człowieka, a w wolnych chwilach eksperymentuję z generatywną grafiką w Midjourney.

Podziel się

Może Cię zainteresować