DeepSeek, czyli chińska alternatywa dla zachodnich modeli językowych

Chiński odpowiednik ChatGPT to świetny przykład na to, jak można tworzyć zaawansowane modele językowe szybciej i taniej bez utraty jakości. Czy jego ekspansja może zmienić układ sił na rynku AI?

A może użytkownicy podejdą do niego z rezerwą ze względu na cenzurę i kwestie bezpieczeństwa danych?

Koszt rozwoju DeepSeeka budzi wiele spekulacji – niektóre źródła podają, że był on wyjątkowo niski, inne sugerują, że to element wojny informacyjnej. A jednak chiński model potrafił rzucić wyzwanie konkurentom z Zachodu. Był w stanie to zrobić dzięki architekturze Mixture-of-Experts (MoE), która sprawia, że model nie musi angażować całej mocy obliczeniowej przy rozpatrywaniu każdego zapytania. W wersji V2, która ma 236 miliardów parametrów, jednorazowo aktywuje się jedynie 21 miliardów. Efekt? Mniejsze zużycie zasobów i większa szybkość działania.

Szkolenie DeepSeek V3 trwało zaledwie dwa miesiące i odbyło się na układach nVidia H800, a jego koszt wyniósł jedynie 6 miliona dolarów. Inne modele AI pochłaniają dziesiątki, a nawet setki milionów w amerykańskiej walucie. DeepSeek nie tylko efektywnie zarządza zasobami, ale także oferuje multimodalność, czyli zdolność do przetwarzania zarówno tekstu, jak i obrazów. Może generować opisy zdjęć, odpowiadać na pytania dotyczące grafik czy tłumaczyć teksty umieszczone na obrazach. To z kolei otwiera drogę do szerokiego wachlarza zastosowań – od asystentów AI po zaawansowane systemy wyszukiwania.

DeepSeek zachwyca wydajnością, ale budzi kontrowersje

Oczywiście model z Państwa Środka nie jest wolny od ograniczeń. Chińskie władze ściśle kontrolują jego funkcjonowanie – wersja online nie odpowiada na przykład na pytania dotyczące polityki. Choć warto dodać, że uruchomiony model na lokalnym sprzęcie jest już wolny od rządowych zaostrzeń. Niemniej, pojawiają się obawy o bezpieczeństwo danych. 29 stycznia 2025 roku firma Wiz Research ujawniła ich wyciek – ponad milion rekordów, w tym klucze API i historię czatów użytkowników. Problem szybko załatano, ale poziom ochrony prywatności nadal budzi wątpliwości.

DeepSeek rozwija się w błyskawicznym tempie i przyciąga uwagę użytkowników na całym świecie. Już 25 stycznia 2025 roku aplikacja osiągnęła milion pobrań, a trzy dni później – 28 stycznia – liczba ta przekroczyła trzy miliony.  Azjatycki model z pewnością pokazuje jednak, że AI nie jest już domeną Zachodu – Chiny potrafią tworzyć rozwiązania na najwyższym poziomie. Model jest tani, szybki i wszechstronny. Dla jednych to przyszłość, dla innych – powód do ostrożności.

dr hab. | AI popularyzatorka | Dydaktyk | Mikrobiolog | Naukowiec | Pasjonatka podróży i nowych technologii

Podziel się

Może Cię zainteresować