🔒 Modele wizyjne

Modele wizyjne (ang. computer vision models) to gałąź sztucznej inteligencji, która zajmuje się uczeniem maszyn interpretacji i rozumienia świata widzialnego. W najprostszym ujęciu to sztuka przekształcania danych obrazowych w użyteczne informacje i decyzje.

Sztuka ta obejmuje ona szereg technik i algorytmów, które pozwalają komputerom na analizę, przetwarzanie i „rozumienie” obrazów i filmów w sposób zbliżony do ludzkiego. Dla komputera obraz to nic innego jak tablica liczb (Rys. 1). Każdy piksel (czyli najmniejszy kwadratowy fragment obrazu, coś jak znak w słowie) jest reprezentowany przez wartość lub zestaw wartości (w przypadku obrazów kolorowych). Modele wizyjne przetwarzają te liczby przez szereg warstw, każda z nich wyodrębnia coraz bardziej złożone cechy – od prostych krawędzi obiektów po całe obiekty widoczne na zdjęciach.


Rys. 1. Ilustracja sposobu, w jaki komputer widzi obraz

Ten artykuł jest częścią płatnej edycji hAI Magazine.

Miesiąc za darmo dla nowych czytelników

Aktywuj

Współzałożycielka TheLion.ai, grupy badawczej tworzącej rozwiązania AI. Specjalizuje się w zastosowaniach sztucznej inteligencji w medycynie, łącząc pracę inżynierów i specjalistów ochrony zdrowia oraz prowadząc zajęcia z deep learningu na Politechnice Gdańskiej.

Share

You might be interested in