Przegląd ciekawych projektów naukowych AI – maj 2024

Jak to się robi w nauce?

Artykuł do pobrania TUTAJ

Na tropie halucynacji

Badacze z Politechniki Wrocławskiej – Teddy Ferdinand, Przemysław Kazienko oraz Jan Kocoń prowadzą intensywne prace mające na celu opracowanie mechanizmu do wykrywania halucynacji wielkich modeli językowych. Dr Jan Kocoń jest również kierownikiem naukowym projektu PLLuM (Polish Large Language Model), w którym tworzony jest własny, od podstaw trenowany model językowy z dużym udziałem danych polskojęzycznych. Oprócz praktycznych zastosowań własnego „polskiego” modelu, ważnym aspektem projektu było stworzenie środowiska badawczego, które pozwalałoby na otwieranie „czarnej skrzynki” wielkich modeli generatywnych i mierzenie się z ich niedoskonałościami.

Jedną – być może najbardziej dotkliwą – bolączką są tzw. „halucynacje”, czyli wypowiedzi zbyt „kreatywne” tam, gdzie kreatywności nie oczekujemy, np. w przytaczaniu faktów. 

Badacze niedawno opublikowali pracę Into the Unknown: Self-Learning Large Language Models, która jest poświęcona wykorzystaniu mechanizmu detekcji halucynacji w sieciach neuronowych do wykrywania luk w wiedzy modelu, a także propozycji dostrajania preferencji modelu w stronę zadawania sensownych pytań o własną niewiedzę. Okazuje się bowiem, że istotnym krokiem w badaniu źródeł i procesu powstawania owych niewygodnych halucynacji jest zmuszenie modelu do przyznawania się, że czegoś nie wie, „uświadamiania” sobie tego, po to, by wykrywszy własną niewiedzę, mógł na nią według opracowanej procedury zareagować – i tę wiedzę nadrobić.

Zero Waste Machine Learning

Grupa badawcza IDEAS NCBR wprowadza nową koncepcję w uczeniu maszynowym – „Zero Waste Machine Learning”, która koncentruje się na maksymalnej wydajności i minimalizacji marnotrawstwa zasobów obliczeniowych.

Projekt znajduje zastosowanie w branży medycznej, gdzie precyzyjne i szybkie reakcje robotów chirurgicznych mogą znacznie poprawić bezpieczeństwo pacjentów oraz komfort pracy chirurgów. Podejście „zero waste” w uczeniu maszynowym opiera się na recyklingu obliczeniowym – wykorzystaniu wyników obliczeń z poprzednich etapów oraz na ciągłym uczeniu, które pozwala modelom na akumulację i wykorzystanie wiedzy zdobytej w trakcie poprzednich epizodów uczenia. To podejście prowadzi do efektywniejszego i bardziej ekologicznego wykorzystania zasobów obliczeniowych.

AI w laboratorium

Na Uniwersytecie Jagiellońskim prowadzone są badania nad wykorzystaniem AI do przyspieszenia procesów odkrywania nowych leków. Modele sztucznej inteligencji stosowane są do analizy interakcji między cząsteczkami chemicznymi a białkami, co może przyczynić się do znalezienia nowych celów terapeutycznych. Ponadto badaczki i badacze UJ opracowali pierwszą na świecie metodę szybkiej identyfikacji bakterii i grzybów na zdjęciach z mikroskopów świetlnych, wykorzystując głębokie sieci neuronowe.

System umożliwia przesyłanie mikroskopowych zdjęć mikroorganizmów, na podstawie których generowany jest raport wraz z listą obecnych gatunków bakterii. Metoda ta, mająca duży potencjał rozwoju i zastosowania nie tylko w medycynie, ale też w przemyśle czy badaniach naukowych, została opatentowana na terenie Unii Europejskiej.

https://www.uj.edu.pl/wiadomosci/-/journal_content/56_INSTANCE_d82lKZvhit4m/10172/156321685

DeMeTeR: interpretacja modeli dyfuzyjnych poprzez analizę reprezentacji

Projekt DeMeTer, prowadzony przez Uniwersytet Warszawski, to ambitna inicjatywa mająca na celu rozwój i wdrażanie przełomowych technologii w obszarze wyjaśnialnej sztucznej inteligencji. Skupia się na zaawansowanym przetwarzaniu danych statystycznych oraz analizie sygnałów multimedialnych, takich jak mowa, obrazy, filmy i dane pochodzące z gier komputerowych, w celu eksploracji potencjału modeli dyfuzyjnych w kontekście metod wyjaśnialności.

https://ncn.gov.pl/sites/default/files/listy-rankingowe/2023-10-12-prbis9kij4c/streszczenia/598712-en.pdf

CampusAI

CampusAI to Twój przewodnik po świecie AI, stworzony zarówno dla początkujących, jak i dla ekspertów. Dzięki CampusAI każdy może odkryć i wykorzystać potencjał generatywnej sztucznej inteligencji.

Podziel się

Może Cię zainteresować