{"id":9448,"date":"2025-03-31T10:00:00","date_gmt":"2025-03-31T08:00:00","guid":{"rendered":"https:\/\/haimagazine.com\/?p=9448"},"modified":"2025-06-18T10:33:58","modified_gmt":"2025-06-18T08:33:58","slug":"rozpoznaj-labradora-chociaz-go-ledwo-znasz-czyli-few-shot-learning","status":"publish","type":"post","link":"https:\/\/haimagazine.com\/pl\/hai-magazine\/numer-4\/rozpoznaj-labradora-chociaz-go-ledwo-znasz-czyli-few-shot-learning\/","title":{"rendered":"\ud83d\udd12 Rozpoznaj labradora&#8230; chocia\u017c go ledwo znasz, czyli few-shot learning"},"content":{"rendered":"<p class=\"wp-block-paragraph\">Standardowe uczenie nadzorowane jest bardzo skuteczne, jednak bywa niepraktyczne \u2013 trudno pozyska\u0107 etykietowane przyk\u0142ady treningowe ze wzgl\u0119du na wysokie koszty czy cho\u0107by ograniczon\u0105 dost\u0119pno\u015b\u0107 istniej\u0105cych pr\u00f3bek. Jednym z obiecuj\u0105cych pr\u00f3b rozwi\u0105zania problemu niedoboru danych etykietowanych jest <em>few-shot learning<\/em>, kt\u00f3ry umo\u017cliwia modelom efektywne uczenie si\u0119 i generalizowanie wiedzy na podstawie zaledwie kilku przyk\u0142ad\u00f3w treningowych.<\/p><h4 class=\"wp-block-heading\"><strong>Czym jest <\/strong><strong><em>few-shot learning<\/em><\/strong><strong>?<\/strong><\/h4><p class=\"wp-block-paragraph\"><em>Few-shot learning<\/em> to <em>framework<\/em> uczenia maszynowego, w kt\u00f3rym model AI uczy si\u0119 dokonywa\u0107 trafnych prognoz, trenuj\u0105c na bardzo ma\u0142ej liczbie oznaczonych przyk\u0142ad\u00f3w. To rozwi\u0105zanie zazwyczaj stosowane do trenowania modeli w zadaniach klasyfikacyjnych, gdy brakuje odpowiednio du\u017cej liczby danych. Jego przeciwie\u0144stwem jest tradycyjne uczenie nadzorowane, kt\u00f3re zazwyczaj wykorzystuje setki (lub tysi\u0105ce) oznaczonych danych w wielu rundach (epokach) treningu, aby nauczy\u0107 modele AI rozpoznawania klas danych. Rozpatrzmy prosty przyk\u0142ad. Chcemy zbudowa\u0107 model, kt\u00f3ry okre\u015bli, jak\u0105 ras\u0119 psa przedstawia obraz \u2013 golden retriever czy labrador retriever, a do dyspozycji mamy tylko 25 obrazk\u00f3w.<\/p><p class=\"wp-block-paragraph\">Dysponujemy ograniczon\u0105 liczb\u0105 przyk\u0142ad\u00f3w oraz przypisanymi do nich etykietami, opartymi na wiedzy eksperckiej, kt\u00f3ra okre\u015bla, czy dany obraz przedstawia golden retrievera, czy labradora retrievera. Model musi nauczy\u0107 si\u0119 rozr\u00f3\u017cnia\u0107 te rasy na podstawie niewielkiej liczby pr\u00f3bek, wykorzystuj\u0105c kluczowe cechy, takie jak d\u0142ugo\u015b\u0107 sier\u015bci, kszta\u0142t uszu i proporcje cia\u0142a.<\/p><p class=\"has-text-align-center wp-block-paragraph\"> <img loading=\"lazy\" decoding=\"async\" width=\"800\" height=\"787\" class=\"wp-image-9878\" style=\"width: 800px;\" src=\"https:\/\/haimagazine.com\/wp-content\/uploads\/2025\/03\/135_1.png\" alt=\"\" srcset=\"https:\/\/haimagazine.com\/wp-content\/uploads\/2025\/03\/135_1.png 428w, https:\/\/haimagazine.com\/wp-content\/uploads\/2025\/03\/135_1-300x295.png 300w\" sizes=\"auto, (max-width: 800px) 100vw, 800px\" \/><br>Rysunek1. Zestaw zdj\u0119\u0107 ps\u00f3w, kt\u00f3ry mo\u017ce by\u0107 wykorzystany w treningu modeli <em>few-shot learning<\/em> do nauki rozpoznawania nowych klas przy ograniczonej liczbie przyk\u0142ad\u00f3w.<\/p><p class=\"wp-block-paragraph\">Gdy do dyspozycji jest niewiele oznaczonych pr\u00f3bek, trenowanie modelu od podstaw za pomoc\u0105 uczenia nadzorowanego \u2013 zw\u0142aszcza modelu o du\u017cej liczbie parametr\u00f3w \u2013 cz\u0119sto prowadzi do przeuczenia. Do takich modeli nale\u017c\u0105 konwolucyjne sieci neuronowe (CNN) stosowane w wizji komputerowej czy sieci oparte na transformerach u\u017cywane w przetwarzaniu j\u0119zyka naturalnego (NLP). Model mo\u017ce osi\u0105ga\u0107 dobre wyniki na danych testowych, ale s\u0142abe na danych rzeczywistych. Zebranie wystarczaj\u0105co du\u017cej liczby danych, aby unikn\u0105\u0107 przeuczenia, bywa jednak istotnym wyzwaniem w procesie trenowania modeli.<\/p><p class=\"wp-block-paragraph\"><em>Few-shot learning<\/em> definiuje si\u0119 poprzez natur\u0119 problemu uczenia, a nie przez zastosowanie konkretnej metody czy struktury modelu. Mo\u017ce wykorzystywa\u0107 szerok\u0105 gam\u0119 algorytm\u00f3w i architektur sieci neuronowych \u2013 wi\u0119kszo\u015b\u0107 metod opiera si\u0119 na <em>transfer learning<\/em>, <em>metalearning<\/em> lub ich kombinacji. <em>Few-shot learning<\/em> mo\u017cna r\u00f3wnie\u017c stosowa\u0107 do zada\u0144 regresji, wi\u0119kszo\u015b\u0107 literatury dotycz\u0105cej FSL koncentruje si\u0119 na zastosowaniach klasyfikacyjnych.<\/p><h4 class=\"wp-block-heading\"><strong>Uczenie transferowe<\/strong><\/h4><p class=\"wp-block-paragraph\">Metody uczenia transferowego (<em>transfer learning<\/em>) koncentruj\u0105 si\u0119 na adaptacji wst\u0119pnie wytrenowanego modelu do nauki nowych zada\u0144 lub klas danych, kt\u00f3rych wcze\u015bniej nie uwzgl\u0119dniono.<\/p><p class=\"wp-block-paragraph\">Uczenie transferowe oferuje praktyczne rozwi\u0105zanie poprzez wykorzystanie u\u017cytecznych cech i reprezentacji, kt\u00f3re model ju\u017c wytrenowa\u0142. Jednym z prostszych rozwi\u0105za\u0144 jest dostrajanie (<em>fine-tuning<\/em>) modelu klasyfikacyjnego, aby wykonywa\u0142 to samo zadanie dla nowej klasy, korzystaj\u0105c z uczenia nadzorowanego na niewielkiej liczbie oznaczonych przyk\u0142ad\u00f3w.<\/p><p class=\"wp-block-paragraph\">Bardziej z\u0142o\u017cone metody uczenia transferowego adaptuj\u0105 wst\u0119pnie wytrenowan\u0105 sie\u0107 neuronow\u0105 poprzez zmiany w jej architekturze, np. zast\u0119puj\u0105c lub ponownie trenuj\u0105c zewn\u0119trzne warstwy sieci, gdzie nast\u0119puje finalna klasyfikacja, a jednocze\u015bnie zachowuj\u0105 przy tym wewn\u0119trzne warstwy odpowiedzialne za ekstrakcj\u0119 cech. Zamra\u017canie (lub inaczej: regularyzacja zmian wagi) wszystkich warstw poza zewn\u0119trznymi pozwala unikn\u0105\u0107 \u201ekatastrofalnego zapominania\u201d wcze\u015bniej nabytej wiedzy. Dzi\u0119ki temu proces uczenia w kontek\u015bcie <em>few-shot<\/em> jest znacznie szybszy.<\/p><p class=\"wp-block-paragraph\">Uczenie transferowe okazuje si\u0119 najbardziej skuteczne, gdy pocz\u0105tkowy trening modelu jest zbli\u017cony do nowego zadania. Na przyk\u0142ad model wytrenowany na klasyfikacji r\u00f3\u017cnych ras ps\u00f3w dobrze uog\u00f3lnia na niewidziane wcze\u015bniej rasy po dostrojeniu przy u\u017cyciu niewielkiej liczby oznaczonych pr\u00f3bek. Wynika to z faktu, \u017ce wagi filtr\u00f3w u\u017cywanych przez sie\u0107 neuronow\u0105 do konwolucji s\u0105 ju\u017c zoptymalizowane do wychwytywania cech istotnych dla klasyfikacji zwierz\u0105t (takich jak kszta\u0142t uszu, d\u0142ugo\u015b\u0107 sier\u015bci, proporcje cia\u0142a). Jednak zastosowanie <em>few-shot learning<\/em> do nauki tego samego modelu w celu rozpoznawania pojazd\u00f3w przyniesie mniej satysfakcjonuj\u0105ce wyniki, je\u015bli by\u0142 on wst\u0119pnie trenowany na zadaniu rozpoznawania ras zwierz\u0105t.<\/p><p class=\"wp-block-paragraph\">Proces dostrajania wcze\u015bniej wytrenowanego modelu do nowego zadania klasyfikacyjnego przy ograniczonej liczbie danych.<\/p><p class=\"has-text-align-center wp-block-paragraph\"> <img loading=\"lazy\" decoding=\"async\" width=\"800\" height=\"393\" class=\"wp-image-9880\" style=\"width: 800px;\" src=\"https:\/\/haimagazine.com\/wp-content\/uploads\/2025\/03\/136_1.png\" alt=\"\" srcset=\"https:\/\/haimagazine.com\/wp-content\/uploads\/2025\/03\/136_1.png 979w, https:\/\/haimagazine.com\/wp-content\/uploads\/2025\/03\/136_1-300x147.png 300w, https:\/\/haimagazine.com\/wp-content\/uploads\/2025\/03\/136_1-768x377.png 768w, https:\/\/haimagazine.com\/wp-content\/uploads\/2025\/03\/136_1-600x295.png 600w\" sizes=\"auto, (max-width: 800px) 100vw, 800px\" \/><br>Rysunek 2. Proces dostrajania wcze\u015bniej wytrenowanego modelu do nowego zadania klasyfikacyjnego przy ograniczonej liczbie danych.<\/p><h4 class=\"wp-block-heading\"><strong>Metalearning<\/strong><\/h4><p class=\"wp-block-paragraph\">W przeciwie\u0144stwie do uczenia transferowego, w kt\u00f3rym klasyfikator jest wst\u0119pnie trenowany na wielu klasach, a nast\u0119pnie dostrajany do specjalnych zada\u0144 (a zestaw treningowy zawiera te same klasy, kt\u00f3re pojawi\u0105 si\u0119 podczas testowania), <em>metalearning<\/em> zak\u0142ada szersze i bardziej og\u00f3lne podej\u015bcie. Jedn\u0105 z metod s\u0105 sieci prototypowe. Sieci prototypowe nie ucz\u0105 si\u0119 konkretnych kategorii, tylko raczej sposobu klasyfikowania nowych klas na podstawie kilku przyk\u0142ad\u00f3w. Zamiast zapami\u0119tywa\u0107 poszczeg\u00f3lne pr\u00f3bki, model oblicza ich \u201eprototypy\u201d, czyli \u015brednie reprezentacje danych klas. Nowe obrazy s\u0105 nast\u0119pnie klasyfikowane na podstawie ich odleg\u0142o\u015bci od tych prototyp\u00f3w w przestrzeni cech.<\/p><p class=\"wp-block-paragraph\">G\u0142\u00f3wnym celem jest wytrenowanie modelu, kt\u00f3ry podczas wielu epizod\u00f3w treningowych nauczy si\u0119 ocenia\u0107 stopie\u0144 podobie\u0144stwa mi\u0119dzy punktami danych nale\u017c\u0105cymi do r\u00f3\u017cnych klas \u2013 nawet takich, kt\u00f3rych wcze\u015bniej nie widzia\u0142. Zdobyta w ten spos\u00f3b wiedza mo\u017ce nast\u0119pnie zosta\u0107 wykorzystana do rozwi\u0105zywania bardziej specyficznych zada\u0144, takich jak klasyfikacja.<\/p><p class=\"wp-block-paragraph\">Zamiast klasycznego podzia\u0142u na zbi\u00f3r treningowy i testowy w prototypowych sieciach model trenuje si\u0119 w wielu epizodach. W ka\u017cdym epizodzie wybieramy N klas, a ka\u017cda klasa zawiera jedynie K przyk\u0142ad\u00f3w, co tworzy tzw. <em>support set<\/em>. Model testujemy na nowych przyk\u0142adach z tych samych klas, tworz\u0105c <em>query set<\/em>. Najpierw obliczamy reprezentacje dla <em>support set<\/em>, wykorzystuj\u0105c sie\u0107 neuronow\u0105. Nast\u0119pnie wyznaczamy \u015bredni\u0105 wszystkich reprezentacji dla ka\u017cdej klasy \u2013 wynik ten stanowi prototyp danej klasy. Podczas klasyfikacji nowych przyk\u0142ad\u00f3w obliczamy ich reprezentacje i mierzymy odleg\u0142o\u015b\u0107 od ka\u017cdego prototypu. Przypisujemy przyk\u0142ad do klasy, kt\u00f3rej prototyp jest najbli\u017cej w przestrzeni cech.<\/p><p class=\"has-text-align-center wp-block-paragraph\"> <img loading=\"lazy\" decoding=\"async\" width=\"800\" height=\"698\" class=\"wp-image-9882\" style=\"width: 800px;\" src=\"https:\/\/haimagazine.com\/wp-content\/uploads\/2025\/03\/137_1.png\" alt=\"\" srcset=\"https:\/\/haimagazine.com\/wp-content\/uploads\/2025\/03\/137_1.png 575w, https:\/\/haimagazine.com\/wp-content\/uploads\/2025\/03\/137_1-300x262.png 300w\" sizes=\"auto, (max-width: 800px) 100vw, 800px\" \/><br>Rysunek 3. Model uczy si\u0119 klasyfikacji na podstawie epizod\u00f3w sk\u0142adaj\u0105cych si\u0119z support set (zbioru wsparcia) i query set (zbioru zapyta\u0144).<\/p><p class=\"wp-block-paragraph\">Taka technika jest bardzo skuteczna dla zbioru danych Omniglot, zawieraj\u0105cym 1623 r\u00f3\u017cne klasy pisma r\u0119cznego, przy czym ka\u017cda klasa ma tu tylko 20 przyk\u0142ad\u00f3w! Okazuje si\u0119, \u017ce taki model bardzo szybko zyskuje du\u017c\u0105 dok\u0142adno\u015b\u0107.<\/p><h4 class=\"wp-block-heading\"><strong>Obiecuj\u0105ca metoda<\/strong><\/h4><p class=\"has-background wp-block-paragraph\" style=\"background-color:#f1ede7\"><em>Few-shot learning<\/em> to obiecuj\u0105ca metoda radzenia sobie z problemem niedoboru oznaczonych danych, znajduj\u0105ca zastosowanie w wielu dziedzinach, takich jak przetwarzanie obraz\u00f3w, NLP oraz analiza danych biomedycznych. W przysz\u0142o\u015bci dalszy rozw\u00f3j technik <em>metalearning<\/em> i <em>transfer learning<\/em> mo\u017ce jeszcze bardziej zwi\u0119kszy\u0107 skuteczno\u015b\u0107 modeli uczonych na ograniczonej liczbie przyk\u0142ad\u00f3w.<\/p><p class=\"wp-block-paragraph\"><\/p>","protected":false},"excerpt":{"rendered":"<p>Je\u015bli chcesz nauczy\u0107 model dokonywania trafnych prognoz, ale masz ma\u0142o oznaczonych przy- k\u0142ad\u00f3w, skorzystaj z metody few-shot learning<\/p>\n","protected":false},"author":255,"featured_media":9875,"comment_status":"closed","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"_acf_changed":false,"rank_math_lock_modified_date":false,"footnotes":""},"categories":[612,763,402,754],"tags":[],"popular":[],"difficulty-level":[36],"ppma_author":[635],"class_list":["post-9448","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-numer-4","category-ai_praktyka","category-hai-magazine","category-hai_premium","difficulty-level-easy"],"acf":[],"authors":[{"term_id":635,"user_id":255,"is_guest":0,"slug":"marcin-wierzbinski","display_name":"Marcin Wierzbi\u0144ski","avatar_url":{"url":"https:\/\/haimagazine.com\/wp-content\/uploads\/2025\/03\/IMG_0951-scaled.jpeg","url2x":"https:\/\/haimagazine.com\/wp-content\/uploads\/2025\/03\/IMG_0951-scaled.jpeg"},"first_name":"Marcin","last_name":"Wierzbi\u0144ski","user_url":"","job_title":"","description":"Analityk danych, badacz AI i wyk\u0142adowca. Doktorant na UW, stypendysta Instytutu Maxa Plancka w Berlinie. Specjalizuje si\u0119 w uczeniu maszynowym, analizie danych genetycznych oraz przetwarzaniu danych na du\u017c\u0105 skal\u0119. Wsp\u00f3\u0142pracowa\u0142 m.in. z deepsense.ai i Sano Centre for Computational Medicine."}],"_links":{"self":[{"href":"https:\/\/haimagazine.com\/pl\/wp-json\/wp\/v2\/posts\/9448","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/haimagazine.com\/pl\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/haimagazine.com\/pl\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/haimagazine.com\/pl\/wp-json\/wp\/v2\/users\/255"}],"replies":[{"embeddable":true,"href":"https:\/\/haimagazine.com\/pl\/wp-json\/wp\/v2\/comments?post=9448"}],"version-history":[{"count":3,"href":"https:\/\/haimagazine.com\/pl\/wp-json\/wp\/v2\/posts\/9448\/revisions"}],"predecessor-version":[{"id":9884,"href":"https:\/\/haimagazine.com\/pl\/wp-json\/wp\/v2\/posts\/9448\/revisions\/9884"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/haimagazine.com\/pl\/wp-json\/wp\/v2\/media\/9875"}],"wp:attachment":[{"href":"https:\/\/haimagazine.com\/pl\/wp-json\/wp\/v2\/media?parent=9448"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/haimagazine.com\/pl\/wp-json\/wp\/v2\/categories?post=9448"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/haimagazine.com\/pl\/wp-json\/wp\/v2\/tags?post=9448"},{"taxonomy":"popular","embeddable":true,"href":"https:\/\/haimagazine.com\/pl\/wp-json\/wp\/v2\/popular?post=9448"},{"taxonomy":"difficulty-level","embeddable":true,"href":"https:\/\/haimagazine.com\/pl\/wp-json\/wp\/v2\/difficulty-level?post=9448"},{"taxonomy":"author","embeddable":true,"href":"https:\/\/haimagazine.com\/pl\/wp-json\/wp\/v2\/ppma_author?post=9448"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}