Modele językowe

Jakie są modele językowe, czym się różnią i do czego służą?

29 sie 2024

Rozwój ludzkości opiera się na korowodzie rewolucji wprowadzających do życia nowe rozwiązania technologiczne. Doświadczyliśmy już rewolucji przemysłowej, motoryzacyjnej czy środków masowego przekazu, a teraz przyszedł czas na rewolucję AI – generatywną rewolucję, najczęściej kojarzoną z dużymi modelami językowymi, zwanymi skrótowo LLM-ami (ang. Large Language Models).

Rewolucja AI, której obecnie doświadczamy, zaczęła się o wiele wcześniej niż wielu z nas przypuszcza. Jedni wymieniają konkurs ImageNet z 2012 roku i zwycięstwo sieci konwolucyjnej AlexNet jako pierwszy silny sygnał nadejścia ery głębokich sieci neuronowych, ci bardziej skupieni na automatycznym przetwarzaniu języka (Natural Language Processing – NLP) wskazują skuteczne zastosowanie sieci rekurencyjnych LSTM lub słynny artykuł naukowy pt. Attention Is All You Need z 2017 roku. Zaproponowano w nim nową architekturę sieci o nazwie Transformer, która obecnie stała się architekturą pierwszego wyboru przy budowie nowoczesnych LLM-ów. Kluczowym, rewolucyjnym właśnie elementem architektury Transformer jest tytułowy mechanizm uwagi, zwany też mechanizmem atencji (ang. attention), pozwalający efektywnie uwzględniać relacje między słowami w różnej odległości od siebie i rozróżniać kontekst znaczenia. Ale po kolei, zanim odpowiemy na pytanie, czym jest ten enigmatyczny LLM, warto wprowadzić na scenę dwa pojęcia – model językowy, jego neuronową wersję, oraz pewną kategoryzacje tychże modeli.

Ten artykuł jest częścią płatnej edycji hAI Magazine. Aby go przeczytać w całości, wykup dostęp on-line

29,99 zł miesięcznie

Wykup dostęp

Zaloguj Pakiety

dr inż. Marek Kozłowski

Kierownik AI LAB w OPI – Państwowym Instytucie Badawczym

Podziel się

językowe, llm, modele

Podziel się

Może Cię zainteresować

Tomasz Gancarczyk

Pohamuj swój LLM. Sztuka zmuszania AI do konkretów

Mimo próśb i gróźb modele LLM trudno jest za pomocą samych promptów skłonić do konsekwentnego odpowiadania w konkretnym formacie.

17.12
Sebastian Kondracki

Bielik lokalnie – praktyczne wdrożenie małych modeli językowych

Bielik wylądował! Mały model językowy, który pojawił się na przełomie sierpnia i września 2024 roku, zdobył wysokie noty w testach benchmarków i tym samym uznanie użytkowników.

17.12
Sebastian Kawecki

Chińscy eksperci wykorzystali LLM Mety podczas tworzenia narzędzia AI dla chińskiej armii

Według danych pozyskanych przez agencję informacyjną Reuters, LLM Mety – Llamy użyto w pracach nad narzędziem AI ChatBIT, które ma wspierać chińskie siły zbrojne.

05.12
Jeremiasz Krok

Boom na AI wpływa na rynek półprzewodników. Czy czeka nas kryzys?

ChatGPT, Midjourney, czy Gemini to narzędzia, których raczej przedstawiać nie trzeba. Ale biją one nie tylko rekordy popularności, ponieważ mają także gigantyczny wpływ na rynek półprzewodników.

28.10