Funkcja straty

Co oznacza, jak działa i dlaczego jest tak ważna w uczeniu modeli?

Jedną z głównych gałęzi sztucznej inteligencji jest nadzorowane uczenie maszynowe (ang. supervised learning). Jest to obszar skupiający się na algorytmach, które uczą się dokonywania predykcji lub szeroko pojętego klasyfikowania obiektów na przykładach, dla których dysponujemy danymi wejściowymi (opis obiektu/sytuacji) oraz przypisanymi im danymi wyjściowymi (wielkość/cecha obiektu, które chcemy przewidywać lub odgadywać). Przykładowo, na podstawie zbioru treningowego (ang. training data) złożonego ze zdjęć osób (zdjęcie – obiekt wejściowy) i informacji o wieku danej osoby (wiek – wartość wyjściowa) możemy uczyć algorytm odgadywania wieku osoby na zdjęciu.

Uczenie algorytmu polega na szukaniu zależności między obrazem a wiekiem, która pozwala jak najlepiej odgadywać wiek. Powstaje zatem pytanie, co oznacza „najlepiej”? W związku z tym, że wszystko w algorytmach sztucznej inteligencji opiera się na obliczeniach, niezbędne w naszym przypadku jest matematyczne określenie tego, jak dobry jest algorytm. W tym celu definiuje się tzw. funkcję straty (ang. loss function), która służy właśnie do tego, aby zmierzyć adekwatność wartości podawanej przez algorytm względem prawdziwej wartości wyjściowej w pojedynczym przykładzie.

Ten artykuł jest częścią drukowanej edycji hAI Magazine. Aby go przeczytać w całości, wykup dostęp on-line

25 zł miesięcznie

Wykup dostęp

Norbert Ryciak

Data scientist z zawodu, pasji i wykształcenia. Lubi dzielić się wiedzą i angażuje się w różnorodne formy nauczania

Podziel się

Może Cię zainteresować