Sztuczna inteligencja, ale zagrożenia prawdziwe. Czy Twoje systemy AI są odporne na ataki?

Wraz z pojawieniem się każdej zmieniającej świat technologii pojawiają się również nieznane wcześniej zagrożenia. Gdy w Ameryce zaczęto stosować automatyczne centrale telefoniczne, dociekliwi użytkownicy – znani jako phreakerzy – wyszukiwali sposoby na darmowe nawiązywanie połączeń pomiędzy miastami lub stanami.

Mikolaj Kowalczyk

4 lis 2024

Popularyzacja poczty elektronicznej w latach dziewięćdziesiątych XX wieku pozwoliła na rozwój rozpowszechnianych za pomocą wiadomości „wirusów”, a rozwój technologii webowych dostarczył cyberprzestępcom nowych metod kradzieży danych i uzyskiwania dostępu do systemów. Smartfony z kolei stały się idealnym celem dla aplikacji typu spyware, takich jak Pegasus. Nie jest więc zaskoczeniem, że pojawienie się aplikacji wykorzystujących sztuczną inteligencję (w szczególności duże modele językowe) otwiera przed hakerami nowe furtki pozwalające na nadużycia. W tym artykule omówię niektóre charakterystyczne dla AI podatności oraz pokażę, jak można się przed nimi uchronić.

Prompt injection

Jednym z zagrożeń, na jakie możemy natknąć się w aplikacji wykorzystującej duże modele językowe, jest prompt injection (brakuje eleganckiego tłumaczenia na język polski, a „wstrzyknięcie monitu” brzmi bardzo nieintuicyjnie – przyp. red.). Osoby posiadające elementarną wiedzę z zakresu bezpieczeństwa aplikacji internetowych mogą w prosty sposób wyrobić sobie intuicję w obszarze tej podatności poprzez analogię do SQL Injection, które pozwala na nieautoryzowany odczyt, usunięcie lub modyfikację treści w bazie danych (każdy programista przynajmniej raz widział komiks XKCD, którego bohaterem jest Bobby Tables). Dla pozostałych to zagrożenie można opisać jako sytuację, w której atakujący tworzy prompt sprawiający, że duży model językowy ignoruje swoje pierwotne instrukcje (takie jak monit systemowy) i zaczyna wykonywać nieautoryzowane przez twórcę działania. Przykładem może być generowanie kodu Python przez facebookowego bota obsługującego profil firmy HR lub zmuszenie ChatGPT do zwracania przepisów pozwalających na produkcję nielegalnych substancji psychoaktywnych lub ładunków wybuchowych. Twórcy standardu bezpieczeństwa dla aplikacji zintegrowanych z LLM – OWASP Top10 for Large Language Models – wyróżniają dwa rodzaje prompt injection: bezpośrednie oraz pośrednie.

Ten artykuł jest częścią drukowanej edycji hAI Magazine. Aby go przeczytać w całości, wykup dostęp on-line

29,99 zł miesięcznie

Wykup dostęp

Zaloguj Pakiety

Mikolaj Kowalczyk

Podziel się

Może Cię zainteresować

Karolina Ceroń

Nowy priorytet OpenAI – ochrona nieletnich

Po fali krytyki i pozwie po śmierci nastolatka, OpenAI zaostrza zasady dla nieletnich. ChatGPT może zawiadomić rodziców, a w sytuacjach alarmowych – nawet policję. Ochrona staje się ważniejsza niż swoboda.

17.09
Katarzyna Łukawska

Edukacja 2.0 – dzieci w cieniu sztucznej inteligencji

Jowita Michalska w książce Szkoła w czasach AI (MT Biznes, 2024) szuka odpowiedzi na pytanie, czy placówki oświatowe są gotowe na przyjęcie sztucznej inteligencji.

17.09
Redakcja

GPT Codex: kolejna rewolucja w kodowaniu

OpenAI wypuściło na rynek GPT-5-Codex – specjalną wersję modelu GPT-5 zoptymalizowaną do zadań programistycznych. Nowy model łączy szybkość interaktywnych sesji z możliwością długotrwałej, samodzielnej pracy nad dużymi projektami.

17.09
Redakcja

AI na poziomie doktora? „To nonsens”

Algorytmy rozwiązują skomplikowane zadania matematyczne, generują prace naukowe i stawiają hipotezy. To sprawia, że niektórzy chętnie przyklejają do nich etykietę „poziom doktora”. Jeden z głównych twórców AI na świecie, laureat Nagrody Nobla…

16.09

Sztuczna inteligencja, ale zagrożenia prawdziwe. Czy Twoje systemy AI są odporne na ataki?

Prompt injection

Ten artykuł jest częścią drukowanej edycji hAI Magazine. Aby go przeczytać w całości, wykup dostęp on-line

29,99 zł miesięcznie

Podziel się

Podziel się

Może Cię zainteresować

Nowy priorytet OpenAI – ochrona nieletnich

Edukacja 2.0 – dzieci w cieniu sztucznej inteligencji

GPT Codex: kolejna rewolucja w kodowaniu

AI na poziomie doktora? „To nonsens”