🔒 Modele wizyjne

Modele wizyjne (ang. computer vision models) to gałąź sztucznej inteligencji, która zajmuje się uczeniem maszyn interpretacji i rozumienia świata widzialnego. W najprostszym ujęciu to sztuka przekształcania danych obrazowych w użyteczne informacje i decyzje.

Sztuka ta obejmuje ona szereg technik i algorytmów, które pozwalają komputerom na analizę, przetwarzanie i „rozumienie” obrazów i filmów w sposób zbliżony do ludzkiego. Dla komputera obraz to nic innego jak tablica liczb (Rys. 1). Każdy piksel (czyli najmniejszy kwadratowy fragment obrazu, coś jak znak w słowie) jest reprezentowany przez wartość lub zestaw wartości (w przypadku obrazów kolorowych). Modele wizyjne przetwarzają te liczby przez szereg warstw, każda z nich wyodrębnia coraz bardziej złożone cechy – od prostych krawędzi obiektów po całe obiekty widoczne na zdjęciach.


Rys. 1. Ilustracja sposobu, w jaki komputer widzi obraz

Ten artykuł jest częścią drukowanej edycji hAI Magazine. Aby go przeczytać w całości, wykup dostęp on-line

29,99 zł miesięcznie

Wykup dostęp

Barbara Klaudel

Współzałożycielka grupy badawczejTheLion.AI. Wykładowczyni, Top100 kobiet w AI/Data Science, Forbes 25 under 25.

Podziel się

Może Cię zainteresować