🔒 BERT – klasycznie na topie

Na początku było słowo, po nim też i kolejne, czytane do przodu i wstecz. Dwukierunkowy enkoder swego czasu wszedł na salony z rozmachem i królował długo – sceny ustąpił dopiero LLM-om, ale z dala od blichtru do dziś robi karierę. Szczególnie tam, gdzie stawką jest stabilność i bezpieczeństwo.

Aleksander Obuchowski

31 mar 2025

Kiedy mówimy o modelach języka, mamy na myśli przede wszystkim modele generatywne, takie jak GPT, Claude czy Gemini, których zadaniem jest odpowiadanie na pytania, wykonywanie poleceń czy tworzenie treści. Tak naprawdę modelowanie języka nie musi jednak wcale opierać się na generowaniu tekstu, gdyż modelowanie oznacza tutaj opracowanie modelu (matematycznego, probabilistycznego) opisującego język. Gdy przyjrzymy się drzewu genealogicznemu modeli języka, zobaczymy, że dzieli się ono na trzy główne gałęzie. W pierwszej znajdują się doskonale nam znane generatywne modele języka, oparte na dekoderach z architektury transformera, w drugiej z kolei – modele oparte na enkoderach, które nie są nastawione na generowanie tekstu, tylko na tworzenie jego reprezentacji (wektorów słów i zdań). Poprzez naukę nienadzorowaną uczą się „rozumieć” język i umieszczać zdania o podobnym znaczeniu blisko siebie.

Enkodery nie mogą na przykład samodzielnie pełnić funkcji asystenta, ale są elementami większych systemów uczenia maszynowego. Reprezentacje, które tworzą, można wykorzystywać choćby w systemach Retrieval Augmented Generation (RAG), wyszukiwarkach czy systemach rekomendacyjnych, które nie mogłyby działać bez dobrej reprezentacji tekstu. Ponadto są podstawą dla modeli uczenia maszynowego dedykowanych konkretnym zadaniom, takim jak klasyfikacja czy ekstrakcja informacji.

Ten artykuł jest częścią drukowanej edycji hAI Magazine. Aby go przeczytać w całości, wykup dostęp on-line

29,99 zł miesięcznie

Wykup dostęp

Zaloguj Pakiety

Aleksander Obuchowski

Współzałożyciel grupy badawczej TheLion.ai. Współzałożyciel i CTO Medalion Technology. Znalazł się na liście Forbes „25 under 25”.

Podziel się

Może Cię zainteresować

Kamil Świdziński

hAI Magazine patronem medialnym AI Creative Fest 2025

Już 11 czerwca br. Station Legii w Warszawie zamieni się w centrum kreatywności i nowoczesnych technologii. Jako patron medialny wydarzenia serdecznie zapraszamy do udziału oraz odwiedzenia naszego stoiska. Do zobaczenia!

02.06
prof. dr hab. Dariusz Jemielniak

Sztuczna Patointeligencja: Welcome to the Muppet Show

Tekst powstał w ramach współpracy z Nową Fantastyką.

02.06
Kamil Świdziński

🔒 Rozmawiaj, słuchaj, a nawet oglądaj swoje notatki. Brzmi jak fikcja?

A jednak to rzeczywistość. NotebookLM zamienia dokumentalny chaos w przejrzystą wiedzę, którą możesz konsumować po swojemu. I to (prawie zawsze) po polsku.

28.05
Monika Dobrzeniecka

Rewolucja w szpitalnictwie?

Konkurs MCSC Hospital Leadership Innovation. Tworzysz rozwiązania oparte na AI? Sprawdź, jak Twoja technologia może ratować życie.

26.05

🔒 BERT – klasycznie na topie

Ten artykuł jest częścią drukowanej edycji hAI Magazine. Aby go przeczytać w całości, wykup dostęp on-line

29,99 zł miesięcznie

Podziel się

Podziel się

Może Cię zainteresować

hAI Magazine patronem medialnym AI Creative Fest 2025

Sztuczna Patointeligencja: Welcome to the Muppet Show

🔒 Rozmawiaj, słuchaj, a nawet oglądaj swoje notatki. Brzmi jak fikcja?

Rewolucja w szpitalnictwie?