DeepSeek, czyli chińska alternatywa dla zachodnich modeli językowych

Chiński odpowiednik ChatGPT to świetny przykład na to, jak można tworzyć zaawansowane modele językowe szybciej i taniej bez utraty jakości. Czy jego ekspansja może zmienić układ sił na rynku AI?

dr hab. Anita Ciesielska

5 lut 2025

A może użytkownicy podejdą do niego z rezerwą ze względu na cenzurę i kwestie bezpieczeństwa danych?

Koszt rozwoju DeepSeeka budzi wiele spekulacji – niektóre źródła podają, że był on wyjątkowo niski, inne sugerują, że to element wojny informacyjnej. A jednak chiński model potrafił rzucić wyzwanie konkurentom z Zachodu. Był w stanie to zrobić dzięki architekturze Mixture-of-Experts (MoE), która sprawia, że model nie musi angażować całej mocy obliczeniowej przy rozpatrywaniu każdego zapytania. W wersji V2, która ma 236 miliardów parametrów, jednorazowo aktywuje się jedynie 21 miliardów. Efekt? Mniejsze zużycie zasobów i większa szybkość działania.

Szkolenie DeepSeek V3 trwało zaledwie dwa miesiące i odbyło się na układach nVidia H800, a jego koszt wyniósł jedynie 6 miliona dolarów. Inne modele AI pochłaniają dziesiątki, a nawet setki milionów w amerykańskiej walucie. DeepSeek nie tylko efektywnie zarządza zasobami, ale także oferuje multimodalność, czyli zdolność do przetwarzania zarówno tekstu, jak i obrazów. Może generować opisy zdjęć, odpowiadać na pytania dotyczące grafik czy tłumaczyć teksty umieszczone na obrazach. To z kolei otwiera drogę do szerokiego wachlarza zastosowań – od asystentów AI po zaawansowane systemy wyszukiwania.

DeepSeek zachwyca wydajnością, ale budzi kontrowersje

Oczywiście model z Państwa Środka nie jest wolny od ograniczeń. Chińskie władze ściśle kontrolują jego funkcjonowanie – wersja online nie odpowiada na przykład na pytania dotyczące polityki. Choć warto dodać, że uruchomiony model na lokalnym sprzęcie jest już wolny od rządowych zaostrzeń. Niemniej, pojawiają się obawy o bezpieczeństwo danych. 29 stycznia 2025 roku firma Wiz Research ujawniła ich wyciek – ponad milion rekordów, w tym klucze API i historię czatów użytkowników. Problem szybko załatano, ale poziom ochrony prywatności nadal budzi wątpliwości.

DeepSeek rozwija się w błyskawicznym tempie i przyciąga uwagę użytkowników na całym świecie. Już 25 stycznia 2025 roku aplikacja osiągnęła milion pobrań, a trzy dni później – 28 stycznia – liczba ta przekroczyła trzy miliony. Azjatycki model z pewnością pokazuje jednak, że AI nie jest już domeną Zachodu – Chiny potrafią tworzyć rozwiązania na najwyższym poziomie. Model jest tani, szybki i wszechstronny. Dla jednych to przyszłość, dla innych – powód do ostrożności.

dr hab. Anita Ciesielska

Ekspertka AI w nauce i edukacji | Nauczycielka akademicka | Badaczka | Wydział Biologii i Ochrony Środowiska | Uniwersytet Łódzki

Podziel się

deepseek

Podziel się

Może Cię zainteresować

Paulina Dalka-Kubaczyk, dr hab. Anita Ciesielska

NotebookLM: multimodalne narzędzie AI do nauki

Tekst powstał w ramach cyklu AI-ready University. Tym razem omawiam rozwiązanie od Google – zarówno dla nauczycieli jak i uczniów.

09.09
dr hab. Anita Ciesielska, Paulina Dalka-Kubaczyk

Jak przygotować test z wykorzystaniem modeli konwersacyjnych?

Tworzenie testów na podstawie wykładów, artykułów czy prezentacji to jedno z najbardziej czasochłonnych zadań w pracy dydaktyka. A co, gdyby tę pracę mógłby wykonać za nas asystent AI?

31.07
Paulina Dalka-Kubaczyk, dr hab. Anita Ciesielska

Wygeneruj, dostosuj i ucz – Diffit w praktyce

AI-ready University: zobacz krok po kroku, jak wykorzystać AI do tworzenia materiałów edukacyjnych.

16.06
dr hab. Anita Ciesielska, Paulina Dalka-Kubaczyk

AI-ready University by CampusAI: nowa edukacyjna przestrzeń w ramach Industry Hub

Sztuczna inteligencja wkracza na uczelnie. Jedni witają ją z ekscytacją, inni z niepokojem. Czy AI zmieni sposób, w jaki uczymy? A może zmieni… nas, wykładowców? A co, jeśli największym wyzwaniem nie jest…

30.04

DeepSeek, czyli chińska alternatywa dla zachodnich modeli językowych

DeepSeek zachwyca wydajnością, ale budzi kontrowersje

Podziel się

Podziel się

Może Cię zainteresować

NotebookLM: multimodalne narzędzie AI do nauki

Jak przygotować test z wykorzystaniem modeli konwersacyjnych?

Wygeneruj, dostosuj i ucz – Diffit w praktyce

AI-ready University by CampusAI: nowa edukacyjna przestrzeń w ramach Industry Hub