Cudze chwalicie, swego nie znacie. Jak wypada Bielik v2 na tle konkurencji?

Polacy nie gęsi, swój model językowy też mają. I zaktualizowana wersja, jak pokazują wyniki na arenie, jest w stanie dorównać zagranicznym odpowiednikom. Poznaj nowe parametry i funkcję chatbota od SpeakLeash.

Polski model językowy Bielik v2 już wylądował. Jakie parametry?

Najnowsza wersja modelu Bielik v2 to owoc współpracy Fundacji SpeakLeash i Academic Computer Centre CYFRONET AGH. Jego twórcy zapewniają, że polski model języka ma być „kolejnym kamieniem milowym w rozwoju sztucznej inteligencji w naszym kraju”.  I dodają, że Bielik v2 wpisuje się w trend zdecentralizowanej sztucznej inteligencji, dostępnej dla każdego, dostosowanej do lokalnych potrzeb – również poprzez uwzględnianie uwarunkowań prawnych oraz kulturowych. Nowy model jest także bezpieczniejszy ze względu na brak zależności od tech-gigantów (choć dla porządku należy dodać, że nie został wytrenowany zupełnie od zera, lecz opracowany na podstawie modelu Mistral-7B-v0.2).

Bielik v2 od środka – jak wyglądają nowe parametry?

Rozmiar polskiego modelu sztucznej inteligencji został zwiększony z 7 (w wersji pierwszej) do 11 miliardów parametrów, co pozwoliło na lepsze zrozumienie i generowanie jakościowych odpowiedzi w języku polskim. W ramach aktualizacji mamy do dyspozycji także szersze okno kontekstowe wynoszące aż 32 768 tokenów, dzięki czemu model może przetwarzać dłuższe teksty i wykonywać bardziej złożone zadania. Twórcy ulepszyli także bazę treningową, poprzez dodanie większej ilości wysokiej jakości danych, które były pozyskiwane w sposób bezpieczny i z poszanowaniem praw autorskich. Warto dodać również informację o poprawionym NLP, które przekłada się na lepsze wyniki m.in. przy podsumowaniu tekstów czy rozpoznawaniu jednostek nazewniczych. 

Nie wiesz jak poradzi sobie Bielik v2 przy Twoich zadaniach? Sprawdź model na arenie!

Przedstawiciele SpeakLeash od samego początku podchodzili do tematu trenowania polskiej sztucznej inteligencji w zupełnie inny sposób niż zagraniczne odpowiedniki. Wykorzystują do tego tzw. arenę, czyli ogólnie dostępną platformę, na której każdy użytkownik może wybrać Bielika v2 i porównać go z innymi modelami, takimi jak GPT-4o mini, Mistral Large 2, Llama-3.1-405B czy Qwen2-72B, oraz ocenić, który z nich udzielił lepszej odpowiedzi na konkretne pytanie.

Jak widzimy na poniższej grafice, Najnowszy model Bielik v2 stoczył już takich 165 bitew, w których zwyciężył aż 119 razy, co daje mu skuteczność na poziomie 80,41 proc.

Źródło: https://arena.speakleash.org.pl/leaderboard | Dane z dnia 5 września 2024 roku, godz. 14:25

Sprawdzić różne modele konkurujące z Bielikiem możesz na polu walki tutaj.

Jakie funkcje dostępne są w Bieliku? Znasz je doskonale z usług ChatGPT i Perplexity

Pierwszą, choć niekoniecznie nową, funkcją jest chatbot, którego zapewne dobrze znacie chociażby w ChatGPT. Twórcy postanowili udostępnić szerzej swój model, który ma prosty i przyjazny interfejs.

Źródło: chat.bielik.ai

W przeciwieństwie do amerykańskiego konkurenta, rodzime rozwiązanie na razie nie posiada jednak archiwum chatów. Każde przejście do innej zakładki lub odświeżenie strony sprawi, że odbyta rozmowa po prostu zniknie. Warto zatem kopiować wyniki, np. do notatnika, by nie stracić do nich dostępu. 

Drugą, nową funkcjonalnością jest Newsroom, którą znamy już z takich rozwiązań jak Copilot czy Perplexity. W prosty sposób możemy zrobić szybki research w postaci podsumowania informacji z sieci na określony temat. Aby uzyskać sprecyzowane wyniki, użytkownicy mogą zaznaczyć przybliżony czas publikacji interesujących nas informacji. 

Nowa funkcja Newsroom w polskim modelu językowym Bielik v2. Źródło: chat.bielik.ai

Narzędzie zostało udostępnione w wersji beta i jak sami twórcy zauważają, Bielik może wciąż jeszcze popełniać błędy, a informacje uzyskane z Newsroomu należy zawsze zweryfikować. Możemy to zrobić już bezpośrednio z zakładki, poprzez przejście na koniec podsumowania. Tam pojawiają się linki do 5 źródeł, z których Bielik skorzystał. Aby uzyskać lepsze wyniki, możemy zawęzić okres, który nas interesuje:

  • kiedykolwiek (WWW + News),
  • ostatnia godzina (tylko news),
  • ostatnie 24 godziny (tylko news),
  • ostatni tydzień (tylko news),
  • ostatni miesiąc (tylko news).

Wspomniane narzędzie może sprawdzić się na przykład, jeżeli korzystamy z czytników RSS do pozyskiwania informacji z sieci. Jednak w odróżnieniu od tych aplikacji, Newsroom Bielika przygotowuje podsumowanie. Wystarczy napisać prosty prompt „Podsumuj najnowsze informacje z zakresu technologii w Polsce, które dotyczyły sztucznej inteligencji”. To także ciekawy sposób na wykorzystanie potencjału badania informacji na temat marki, konkurencji czy konkretnych osób, o których się pisało w internecie. Moglibyśmy porównać Newsroom do usług nastawionych stricte na monitoring marek, jak np. Brand24 od Michała Sadowskiego (TU możesz przeczytać jego artykuł z hAI Magazine nr 1 na temat narzędzi AI, które poleca).

Bielik v2 w wersji online i offline. Oto, gdzie znaleźć polski model

Omówione powyżej funkcjonalności znajdziemy na stronie twórców SpeakLeash. To właśnie w tym miejscu, użytkownicy będą mogli korzystać z najnowszych modeli Bielika. Oczywiście w dalszym ciągu możemy za pomocą HuggingFace za darmo pozyskać kod źródłowy, który pozwoli nam odpalić model na własnym sprzęcie, żeby np. zbudować własny system RAG (o tym jak budować wydajne RAGi pisał Sebastian Kondracki, główny leader powstania Bielika, w artykule z hAI Magazine nr 1 – do przeczytania TU). Misją SpeakLeash jest udostępnienie szerokiego dostępu do sztucznej inteligencji mówiącej po polsku, tak by spełniała ona potrzeby rodzimych użytkowników. 

Skusicie się, by zajrzeć na Arenę? Zachęcamy!

Autor

  • Kamil Świdziński

    Śledzę najnowsze technologiczne trendy, w tym AI. Jako Innovation Manager jestem blisko nowych rozwiązań współpracując ze startupami.

    View all posts

Kamil Świdziński

Śledzę najnowsze technologiczne trendy, w tym AI. Jako Innovation Manager jestem blisko nowych rozwiązań współpracując ze startupami.

Podziel się

Może Cię zainteresować