Naucz się, jak wykorzystywać AI w badaniach. Darmowe warsztaty dla naukowców

XIV edycja warsztatów dla naukowców CLARIN-PL w praktyce badawczej odbędzie się 23-24 września w Poznaniu. Z obsługi najnowszych narzędzi możesz podszkolić się za darmo!

Warsztaty dla naukowców CLARIN-PL

Warsztaty dla naukowców już we wrześniu!

CLARIN-PL w praktyce badawczej to cykl warsztatów dla naukowców, którzy w swoich badaniach chcą zacząć wykorzystywać najnowsze osiągnięcia w zakresie maszynowego przetwarzania języka i AI. Podczas spotkania badacze z Centrum Technologii Językowych przedstawią narzędzia i zasoby opracowane w celu przetwarzania języka. Nie zabraknie też praktycznych inspiracji, czyli konkretnych przykładów wykorzystania tych technologii w badaniach z zakresu nauk humanistycznych i społecznych.

Udział w warsztatach jest bezpłatny, wystarczy zapisać się przez formularz. Jednak liczba miejsc jest ograniczona i w przypadku  zbyt dużej liczby chętnych, przy wyborze uczestników organizatorzy będą brali pod uwagę opisane w zgłoszeniu zainteresowania badawcze i projekty.

Najbliższa edycja współorganizowana jest przez Centrum Technologii Językowych CLARIN-PL, Wydział Neofilologii oraz Wydział Filologii Polskiej i Klasycznej UAM. Szczegółowe informacje o wydarzeniu oraz formularz zapisów można znaleźć na stronie organizatora.

Jakie rozwiązania proponuje CLARIN?

Polskie konsorcjum naukowe za cel przyjmuje ułatwienie pracy badawczej z bardzo dużymi zbiorami tekstów, a dzieje się to dzięki elektronicznym zasobom językowym i narzędziom do pracy z bazami tekstów. Co ważne, wszystkie rozwiązania są tu tworzone z myślą o języku polskim, co sprawia, że są wyjątkowo użyteczne dla rodzimych badaczy, szczególnie zajmujących się naukami humanistycznymi i społecznymi. W zasobach CLARIN-PL można znaleźć już gotowe do przeszukiwania korpusy, czyli zbiory reprezentacyjnych tekstów z danej dziedziny/obszaru, np.:

  • ChronoPress – korpus składający się z ok. 100 tys. fragmentów teksów prasowych obejmujących lata 1945-1964, a docelowo – stulecie polskiej niepodległości (1918-2018);
  • KPWr – Korpus Języka Polskiego Politechniki Wrocławskiej, uwzględniający mówione i pisane dokumenty dostępne na licencji Creative Commons;
  • Korpus Dyskursu Parlamentarnego – obejmujący zapisy posiedzeń plenarnych Sejmu i Senatu RP.

Jednak infrastruktura polskiego konsorcjum może pomóc nie tylko w badaniach dotyczących już wskazanych obszarów. Dzięki Korpusomatowi w zasadzie każdy może stworzyć własną bazę tekstów i przeszukiwać ją za pomocą dostępnych w narzędziu funkcji – dostępne są m.in. obszerne statystyki korpusu: słowa kluczowe, lista frekwencyjna, słownictwo charakterystyczne, kolokacje czy dane stylometryczne lub można odpytać korpus, formułując własne zapytanie, które pozwala odnaleźć konkretne przykłady z tekstów w całej bazie (np. konteksty użycia danej frazy/słowa). Zintegrowane w Korpusomacie rozwiązania umożliwiają także automatyczne porównywanie dwóch korpusów, analizę wydźwięku czy wydobywanie z tekstu specjalistycznej terminologii. Większość z tych funkcji jest dostępna równolegle w oddzielnych narzędziach – gotowych do wykorzystania tylko w danym celu (np. TermoPL do wykrywania terminów, Wydźwięk do analizy wydźwięku emocjonalnego, ComCorp do porównywania cech językowych korpusów czy Respa do wydobywania słów kluczowych).

Ze wszystkich narzędzi udostępnianych online można korzystać bezpłatnie. A badaczom zainteresowanym praktycznym zastosowaniem infrastruktury CLARIN w badaniach polecamy udział we wrześniowych warsztatach, na których z pewnością nie zabraknie przykładów i inspiracji!

Autor

Katarzyna Jachymek

Od zawsze ze słowami: jak nie czyta, to pisze, a jak nie pisze, to redaguje. Dla równowagi śpiewa i tańczy swinga.

Podziel się

Może Cię zainteresować