🔒 Bielik-R szykuje się do lotu?

Modele „myślące” typu R to standard, który znajduje się już niemal we wszystkich wiodących rodzinach dużych modeli językowych. Nasz rodzimy Bielik również trzyma rękę na pulsie i podejmuje pierwsze próby stworzenia wersji, która będzie umiała przeprowadzać logiczne wnioskowanie w języku polskim.

Remgiusz Kinas

31 mar 2025

Koncepcja modeli językowych zdolnych do „myślenia” rozpowszechniła się wraz z wprowadzeniem przez OpenAI modelu o1. Modele tego typu przez pewien czas analizują problem, zanim udzielą odpowiedzi. Generują tzw. łańcuchy myśli (chain-of-thought), które pomagają im obrać właściwy kierunek w rozwiązywaniu zadań. Dzięki temu zwiększają szanse na podanie poprawnego rozwiązania.

Podobnie jak inne modele LLM, polski model językowy Bielik został wytrenowany na ogromnych zbiorach danych tekstowych. Pierwszym etapem był pretrening, czyli nauka przewidywania kolejnego tokena na podstawie tekstu wejściowego. Wybór kolejnych faz tworzenia modeli zależy od przyjętej strategii twórców – zwykle to instrukcyjne uczenie nadzorowane (instruction fine-tuning). Etapy treningowe mogą obejmować m.in. techniki uczenia ze wzmocnieniem (Reinforcement Learning, RL). Jedną z najskuteczniejszych jest Reinforcement Learning from Human Feedback (RLHF), czyli takie uczenie ze wzmocnieniem, w którym ocenę efektów wystawia człowiek. To rozwiązanie spopularyzowane przez OpenAI jako element treningu ChatGPT. Proces ten pozwala bardziej precyzyjnie sterować zachowaniem modelu i dostosować formę oraz treść odpowiedzi do preferencji odbiorcy. Typową już dzisiaj metodę uczenia przez wzmacnianie postanowiliśmy wykorzystać w procesie uczenia modelu Bielik. A skoro światowym standardem stały się aktualnie modele typu R (reasoning), czyli te „myślące”, to zadaliśmy sobie pytanie: czy uda nam się stworzyć model, który będzie generował łańcuchy myśli w języku polskim? I czy będzie gotowy, by wyjść z laboratorium i przyjąć formę pełnoprawnego modelu Bielik-R?

Ten artykuł jest częścią drukowanej edycji hAI Magazine. Aby go przeczytać w całości, wykup dostęp on-line

29,99 zł miesięcznie

Wykup dostęp

Zaloguj Pakiety

Remgiusz Kinas

Specjalista w dziedzinie sztucznej inteligencji. Zaangażowany w projekty badawczo-rozwojowe dot. wizji komputerowej i generatywnej AI (tworzenia modeli LLM/vLLM). Aktywnie uczestniczy w życiu społeczności SpeakLeash skupionej wokół polskiego modelu językowego Bielik. Ma tytuł podwójnego Grand Mastera Kaggle.

Podziel się

Może Cię zainteresować

Kamil Świdziński

hAI Magazine patronem medialnym AI Creative Fest 2025

Już 11 czerwca br. Station Legii w Warszawie zamieni się w centrum kreatywności i nowoczesnych technologii. Jako patron medialny wydarzenia serdecznie zapraszamy do udziału oraz odwiedzenia naszego stoiska. Do zobaczenia!

02.06
prof. dr hab. Dariusz Jemielniak

Sztuczna Patointeligencja: Welcome to the Muppet Show

Tekst powstał w ramach współpracy z Nową Fantastyką.

02.06
Kamil Świdziński

🔒 Rozmawiaj, słuchaj, a nawet oglądaj swoje notatki. Brzmi jak fikcja?

A jednak to rzeczywistość. NotebookLM zamienia dokumentalny chaos w przejrzystą wiedzę, którą możesz konsumować po swojemu. I to (prawie zawsze) po polsku.

28.05
Monika Dobrzeniecka

Rewolucja w szpitalnictwie?

Konkurs MCSC Hospital Leadership Innovation. Tworzysz rozwiązania oparte na AI? Sprawdź, jak Twoja technologia może ratować życie.

26.05

🔒 Bielik-R szykuje się do lotu?

Ten artykuł jest częścią drukowanej edycji hAI Magazine. Aby go przeczytać w całości, wykup dostęp on-line

29,99 zł miesięcznie

Podziel się

Podziel się

Może Cię zainteresować

hAI Magazine patronem medialnym AI Creative Fest 2025

Sztuczna Patointeligencja: Welcome to the Muppet Show

🔒 Rozmawiaj, słuchaj, a nawet oglądaj swoje notatki. Brzmi jak fikcja?

Rewolucja w szpitalnictwie?