Twój koszyk jest obecnie pusty!
Inez Okulska: Jesteś w kręgu inżynierów ML znany jako pierwszy zawodnik Kaggle. Wyjaśnisz, czym jest ta platforma?
Darek Kłeczek*: Kaggle to międzynarodowa społeczność licząca kilkanaście milionów osób, skupionych wokół sztucznej inteligencji i uczenia maszynowego. Platforma oferuje użytkownikom możliwość wspólnej nauki, rywalizacji oraz dzielenia się wiedzą, szczególnie na czterech płaszczyznach: zawody w rozwiązywaniu problemów z zakresu uczenia maszynowego, udostępnianie zbiorów danych treningowych, publikacja kodu do trenowania modeli oraz forum dyskusyjne.
IO: Jak na nią trafiłeś, jak to się stało, że się tym aż tak zainteresowałeś?
DK: Zainteresowałem się Kaggle na poważnie około pięciu lat temu, po rekomendacji Jeremy’ego Howarda w jego kursie fast.ai. Wziąłem wtedy udział w dwóch zawodach. W pierwszych niespodziewanie zdobyłem medal, a w drugich poniosłem porażkę już w finałowej klasyfikacji. To doświadczenie uświadomiło mi, jak wiele mogę się nauczyć, a rywalizacja dodatkowo mnie motywowała.
IO: A nie miałeś ochoty właśnie tego rzucić, skoro byłeś tak blisko finału i się nie udało? Emocje mogły łatwo wziąć górę…
DK: Zawsze lubiłem współzawodnictwo, ale dopiero w uczeniu maszynowym udało mi się wejść na naprawdę wysoki poziom. Uwielbiam adrenalinę związaną z zawodami, rywalizacja daje mi dodatkową motywację. Jednocześnie Kaggle potrafi uzależniać – jeden ze słynnych zawodników nazwał Kaggle „legalnym narkotykiem”. Aktualnie próbuję odpocząć trochę od zawodów, ale nie jest to łatwe!
IO: Za dużo już było tej adrenaliny?
DK: Nie tylko adrenalina, ale w ogóle emocje! W trakcie zawodów cały czas znamy nasz wynik i miejsce na „publicznym leaderboardzie”, natomiast ostateczna klasyfikacja pokazywana jest dopiero po zakończeniu zawodów. Zdarzyło mi się przeskoczyć z drugiego na pierwsze miejsce ostatecznej klasyfikacji (euforia), ale też spaść wiele pozycji w dół, co uczy pokory. W finałowej fazie jednych zawodów byłem na urlopie z żoną i córką na Warmii. Gdy one szły spać, ja wychodziłem z laptopem na korytarz, żeby zaimplementować nowe eksperymenty.
Występowałem wtedy w zespole, co daje dodatkową motywację – w końcu nie chcesz zawieść innych. I udało się, otrzymaliśmy wtedy złoty medal i nagrodę finansową. I to finalne rozwiązanie, które wygrało, kończyłem jeszcze w aucie, w drodze powrotnej do Warszawy. Tu należą się podziękowania dla mojej żony, która oprócz bycia świetnym kierowcą była i jest dla mnie olbrzymim wsparciem, a to też niełatwe w trakcie tak emocjonujących zawodów!
IO: A co symbolizują oznaczenia, które można zdobyć na platformie – jak to działa, po co, co Ci to dało?
DK: Większość firm zatrudniających osoby z doświadczeniem w obszarze sztucznej inteligencji oczekuje doświadczenia w przemyśle bądź nauce, nierzadko wymagany jest doktorat w tym obszarze. Ja sam zainteresowałem się AI na poważnie na zaawansowanym etapie kariery, a Kaggle pozwolił mi się pokazać i udowodnić swoje umiejętności.
W zawodach rywalizujemy z tysiącami osób, często ekspertami w danym temacie, zajmującymi się naukowo danym problemem itp. Wygrywanie bądź zdobywanie medali w takich zawodach (złoty medal zdobywa zwykle pierwszych 10 zespołów spośród kilkuset bądź kilku tysięcy) to dowód kompetencji. Taki praktyczny tytuł, obok tytułów naukowych czy zawodowych.
Co więcej, możemy również rywalizować zespołowo – sam poznałem wielu świetnych ekspertów z kilku kontynentów, współpracując z nimi m.in. przy lokalizacji białek w organellach komórkowych, na podstawie zdjęć mikroskopowych, rekomendacji jednostek lekcyjnych pod kątem konkretnych programów nauczania, przewidywaniu stabilności termicznej enzymów czy innych bardzo ciekawych zadaniach. Ale przede wszystkim sam uwierzyłem w swoje umiejętności, mogłem je w praktyce rozwijać, dostałem możliwość pracy w tym obszarze w wiodących firmach.
IO: Czyli nie tylko współzawodnictwo i nuta rywalizacji, ale po prostu ciągła, niezwykle praktyczna nauka?
DK: Tak! Kaggle odegrało fundamentalną rolę w moim procesie uczenia się sztucznej inteligencji, podam tylko kilka przykładów. W uczeniu maszynowym jakość modeli sprawdzana jest na danych testowych, ale tak naprawdę istotna jest jakość modeli na produkcji. Kaggle symuluje tę sytuację poprzez „prywatny leaderboard” (tabelę zwycięskich wyników) – nasze modele oceniane są na osobnym zbiorze danych po zakończeniu zawodów. Dzięki temu nauczyłem się, jak efektywnie walidować modele, co jest jedną z kluczowych umiejętności w tym zawodzie, bo zrobić prototyp to jedno, a obronić się na produkcji, w realnym zastosowaniu to drugie.
Trenowanie modeli jest procesem bardzo eksperymentalnym – im więcej bardziej zróżnicowanych eksperymentów jesteśmy w stanie wykonać, tym lepsza będzie jakość finalnego modelu. Kaggle nauczył mnie szybkiego eksperymentowania i pomógł nabyć intuicję, jakie eksperymenty mają największe szanse na powodzenie.
Żeby odnieść sukces w zawodach, trzeba szybko przyswoić najnowszą wiedzę w danej dziedzinie. Dzięki temu nauczyłem się sprawnie odsiewać i czytać publikacje naukowe z zakresu sztucznej inteligencji, ale również nie ufać im bezgranicznie. W ramach zawodów testowane są tysiące metod, ale tylko nieliczne z nich sprawdzają się w praktyce, najlepszym ze sposobów weryfikacji danej metody jest przeprowadzenie eksperymentu.
IO: A co poza Kaggle? W jaki sposób, gdzie zdobywałeś wiedzę i umiejętności związane z rozwojem narzędzi AI?
DK: Swoją przygodę ze sztuczną inteligencją zacząłem od kursów internetowych prowadzonych przez takich nauczycieli jak Andrew Ng czy wspomniany już Jeremy Howard. Czymś niesamowitym jest dla mnie możliwość uczenia się od najlepszych na świecie nauczycieli – wystarczy znajomość angielskiego i dostęp do internetu, ich kursy dostępne są całkiem za darmo. Możemy się poczuć, jakbyśmy siedzieli w MIT, Stanfordzie czy innych prestiżowych uczelniach. A reszta to już praktyka i stałe poszerzanie wiedzy. Tylko niestety czasu jest zawsze za mało, więc często odbywa się to kosztem innych zainteresowań: większość książek, które przeczytałem w ostatnich latach, dotyczy właśnie sztucznej inteligencji.
Darek Kłeczek
Senior Research Scientist w Snowflake. Jeden z dziewięciu osób na świecie posiadających tytuł Grandmaster we wszystkich czterech kategoriach na Kaggle, z kilkunastoma medalami w międzynarodowych zawodach