{"id":6787,"date":"2024-12-17T18:30:00","date_gmt":"2024-12-17T17:30:00","guid":{"rendered":"https:\/\/haimagazine.com\/?p=6787"},"modified":"2025-06-26T10:18:32","modified_gmt":"2025-06-26T08:18:32","slug":"macierz-pojecie-jak-to-wyjasnic-zabawa-w-superpozycje","status":"publish","type":"post","link":"https:\/\/haimagazine.com\/pl\/hai-magazine\/macierz-pojecie-jak-to-wyjasnic-zabawa-w-superpozycje\/","title":{"rendered":"\ud83d\udd12 Macierz poj\u0119cie, jak to wyja\u015bni\u0107? Zabawa w superpozycje"},"content":{"rendered":"<p class=\"wp-block-paragraph\"><mark style=\"background-color:rgba(0, 0, 0, 0);color:#106ef0\" class=\"has-inline-color\"> <\/mark><\/p><figure class=\"wp-block-table\"><table class=\"has-background\" style=\"background-color:#e5d9f6;border-style:none;border-width:0px\"><tbody><tr><td><mark style=\"background-color:rgba(0, 0, 0, 0);color:#106ef0\" class=\"has-inline-color\"><code>\u201e\u2026ma\u0107, nie teraz!\", zd\u0105\u017cy\u0142 jeszcze pomy\u015ble\u0107, zanim bezw\u0142adnie osun\u0105\u0142 si\u0119 na pod\u0142og\u0119. Doprowadzi\u0142 ich przecie\u017c dok\u0142adnie do miejsca, do kt\u00f3rego chcia\u0142 ich doprowadzi\u0107. Byli o krok od zauwa\u017cenia czego\u015b naprawd\u0119 wa\u017cnego. Widzia\u0142 emocje na ich twarzach. Uwielbia\u0142 to, tak jak uwielbia\u0142 swoich uczni\u00f3w. <\/code><br><code>\u2013 Paul Broca. \u2013 Kilkana\u015bcie minut wcze\u015bniej zapisa\u0142 na tablicy imi\u0119 s\u0142ynnego neurologa, o kt\u00f3rym z wypiekami na twarzy dyskutowali ju\u017c od kilku kwadrans\u00f3w. \u2013 Mia\u0142 du\u017co szcz\u0119\u015bcia, to prawda, i gdyby nie trafi\u0142 mu si\u0119 tak unikalny pacjent, nie dokona\u0142by wielkiego odkrycia, ale mo\u017cemy te\u017c powiedzie\u0107, \u017ce przypadkowe odkrycia przytrafiaj\u0105 si\u0119 dobrze przygotowanym. <\/code><br><code>\u2013 To ja mam pytanie \u2013 us\u0142ysza\u0142 g\u0142os za plecami. \u2013 Ten pacjent rozumia\u0142 innych, ale sam potrafi\u0142 powiedzie\u0107 tylko jedno s\u0142owo, tak? I jak Broca odkry\u0142, \u017ce Leborgne ma uszkodzony pewien obszar w m\u00f3zgu, to uzna\u0142, \u017ce to ten obszar produkuje s\u0142owa. No i super, ale co ze s\u0142owami pisanymi? <\/code><br><code>\u2013 A jak my\u015blicie? <\/code><br><code>\u2013 Ja my\u015bl\u0119, \u017ce wtedy pisanie te\u017c wysiada. I je\u015bli to prawda, to z tego wynika\u0142oby, \u017ce obszar Broki generuje ca\u0142y j\u0119zyk. U\u015bmiechn\u0105\u0142 si\u0119 i napisa\u0142 na tablicy imi\u0119 i nazwisko drugiego s\u0142ynnego lekarza: \u201eCarl Wernicke\". <\/code><br><code>\u2013 Bynajmniej. Kontrprzyk\u0142ad, obszar Wernickego. Uszkodzenie tego obszaru m\u00f3zgu, znajduj\u0105cego si\u0119 tu\u017c obok obszaru Broki, nie odbiera zdolno\u015bci budowania wypowiedzi, ale odbiera zdolno\u015b\u0107 rozumienia j\u0119zyka. Po jego uszkodzeniu mo\u017cna potrafi\u0107 skonstruowa\u0107 wypowied\u017a, ale nie b\u0119dzie ona mia\u0142a sensu. Czyli pojawi si\u0119 struktura gramatyczna, ale wype\u0142niona s\u0142owami, kt\u00f3re nie b\u0119d\u0105 sk\u0142ada\u0142y si\u0119 na sp\u00f3jny przekaz. Na przyk\u0142ad na pytanie \u201eco dzisiaj robisz?\" mog\u0142aby pa\u015b\u0107 odpowied\u017a: \u201ezostali\u015bmy tutaj z wod\u0105 w tej chwili i rozmawiamy z lud\u017ami tam dla nich. Oni nurkuj\u0105 dla nich teraz, ale zaraz b\u0119d\u0105 trzymali wod\u0119, z odrobin\u0105 szcz\u0119\u015bcia, dla niego\". <\/code><br><code>\u2013 A czy wtedy opr\u00f3cz rozumienia wysiada te\u017c logiczne rozumowanie? <\/code><br><code>\u2013 Ano nie \u2013 inne zdolno\u015bci zostaj\u0105 bez szwanku. I co mo\u017ce z tego wynika\u0107? <\/code><br><code>\u2013 \u017be w tych dw\u00f3ch obszarach \u2013 i Broki, i Wernickego \u2013 musi by\u0107 zainstalowany j\u0119zyk \u2013 do\u0142\u0105czy\u0142 kto\u015b z ty\u0142u \u2013 w jednym mamy mechaniczne sk\u0142adanie my\u015bli w s\u0142owa, a w drugim rozumienie poj\u0119\u0107 i relacji pomi\u0119dzy nimi. I obstawiam, \u017ce inne stworzenia tego nie maj\u0105 i w\u0142a\u015bnie dlatego nie maj\u0105 matematyki, co nale\u017ca\u0142o dowie\u015b\u0107. Oklaski, kurtyna, dzi\u0119kuj\u0119, Nobla odbior\u0119 w paczkomacie. <\/code><br><code>\u2013 Wyborne! \u2013 u\u015bmiechn\u0105\u0142 si\u0119. \u2013 Wspania\u0142a hipoteza, kt\u00f3r\u0105 z przyjemno\u015bci\u0105 obal\u0119. Obszary Broki i Wernickego funkcjonuj\u0105 doskonale na przyk\u0142ad w g\u0142owach szympans\u00f3w. Ich uszkodzenie nie wp\u0142ywa ani troch\u0119 na ich zdolno\u015b\u0107 porozumiewania si\u0119. A uwierzcie mi, \u017ce robi\u0105 to naprawd\u0119 wspaniale. I tak, ich m\u00f3zgi s\u0105 prawie takie same jak nasze. \u2013 Zatrzyma\u0142 si\u0119 na moment. \u2013 W\u0142a\u015bnie wpadli\u015bcie na trop tego, sk\u0105d bior\u0105 si\u0119 j\u0119zyk i umiej\u0119tno\u015b\u0107 logicznego my\u015blenia. Jak rodzi si\u0119 matematyka? \u2013 Ponownie zrobi\u0142 pauz\u0119, ale tym razem o wiele za d\u0142ug\u0105. Najpierw poczu\u0142 dziwne mrowienie w nogach, potem w szcz\u0119ce, usta odm\u00f3wi\u0142y wsp\u00f3\u0142pracy i zdo\u0142a\u0142 ju\u017c tylko prychn\u0105\u0107, zabulgota\u0107 bez tre\u015bci.<\/code><\/mark><\/td><\/tr><\/tbody><\/table><\/figure><p class=\"wp-block-paragraph\">Wiele wskazuje na to, \u017ce kluczem do rozwi\u0105zania zagadek j\u0119zyka i logicznego my\u015blenia jest interpretowalno\u015b\u0107 modeli AI. Tak, interpretowalno\u015b\u0107 modeli sztucznej inteligencji, a nie ludzkiego m\u00f3zgu. Zinterpretowa\u0107 to znaczy wyja\u015bni\u0107 relacje pomi\u0119dzy sygna\u0142ami, kt\u00f3re zmuszaj\u0105 model do odpowiedzi, czyli np. promptami a sygna\u0142ami generowanymi przez model, np. tekstami odpowiedzi na prompt. Chodzi o to, aby w zrozumia\u0142y i przekonuj\u0105cy dla nas spos\u00f3b pokaza\u0107, czego model si\u0119 nauczy\u0142 i w jaki spos\u00f3b t\u0119 wiedz\u0119 wykorzystuje. <\/p><p class=\"has-text-align-center wp-block-paragraph\">  <img loading=\"lazy\" decoding=\"async\" width=\"400\" height=\"319\" class=\"wp-image-7093\" style=\"width: 400px;\" src=\"https:\/\/haimagazine.com\/wp-content\/uploads\/2024\/12\/123_1-1.png\" alt=\"\" srcset=\"https:\/\/haimagazine.com\/wp-content\/uploads\/2024\/12\/123_1-1.png 775w, https:\/\/haimagazine.com\/wp-content\/uploads\/2024\/12\/123_1-1-300x240.png 300w, https:\/\/haimagazine.com\/wp-content\/uploads\/2024\/12\/123_1-1-768x613.png 768w, https:\/\/haimagazine.com\/wp-content\/uploads\/2024\/12\/123_1-1-600x479.png 600w\" sizes=\"auto, (max-width: 400px) 100vw, 400px\" \/><\/p><p class=\"wp-block-paragraph\">Je\u017celi potrafiliby\u015bmy zinterpretowa\u0107 to, co w trakcie generowania tekst\u00f3w, obraz\u00f3w lub film\u00f3w robi\u0105 wielkie modele j\u0119zykowe, wizyjne lub wielomodalne, to mo\u017ce nauczyliby\u015bmy si\u0119 jeszcze lepiej je budowa\u0107. Kto wie, mo\u017ce zrozumieliby\u015bmy r\u00f3wnie\u017c lepiej mechanizmy dzia\u0142ania naszych w\u0142asnych umys\u0142\u00f3w. <\/p><p class=\"has-text-align-center wp-block-paragraph\"> <img loading=\"lazy\" decoding=\"async\" width=\"400\" height=\"390\" class=\"wp-image-7095\" style=\"width: 400px;\" src=\"https:\/\/haimagazine.com\/wp-content\/uploads\/2024\/12\/123_2-1.png\" alt=\"\" srcset=\"https:\/\/haimagazine.com\/wp-content\/uploads\/2024\/12\/123_2-1.png 791w, https:\/\/haimagazine.com\/wp-content\/uploads\/2024\/12\/123_2-1-300x292.png 300w, https:\/\/haimagazine.com\/wp-content\/uploads\/2024\/12\/123_2-1-768x749.png 768w, https:\/\/haimagazine.com\/wp-content\/uploads\/2024\/12\/123_2-1-600x585.png 600w\" sizes=\"auto, (max-width: 400px) 100vw, 400px\" \/><\/p><p class=\"wp-block-paragraph\">Wszystko to brzmi pi\u0119knie, inspiruj\u0105co i wygl\u0105da jak ambitny program badawczy. Ale oczywi\u015bcie od razu pojawia si\u0119 kilka pyta\u0144. Co to w og\u00f3le, u licha, znaczy \u201eprzekonuj\u0105co zinterpretowa\u0107&#8221;? Jak oceni\u0107 jako\u015b\u0107 interpretacji? I jak unikn\u0105\u0107 wpisanych w ni\u0105 organicznie wieloznaczno\u015bci i paradoks\u00f3w? <\/p><p class=\"wp-block-paragraph\">No i czy da si\u0119 to zaprogramowa\u0107 w Pythonie?<\/p><h4 class=\"wp-block-heading\">Droga na skr\u00f3ty<\/h4><p class=\"wp-block-paragraph\"> Jednym ze sposob\u00f3w na uporanie si\u0119 z tymi pytaniami jest powi\u0105zanie poj\u0119cia interpretowalno\u015bci z jakim\u015b obiektem matematycznym. Taki obiekt mo\u017cna podda\u0107 rygorystycznej analizie logicznej i zbada\u0107 symulacyjnie. Bardzo dobrym pomys\u0142em mo\u017ce by\u0107 skonstruowanie przekszta\u0142cenia matematycznego, takiego jak funkcja, kt\u00f3re spe\u0142nia szereg warunk\u00f3w powi\u0105zanych z poj\u0119ciem interpretowalno\u015bci. Warunki takie powinny oczywi\u015bcie da\u0107 si\u0119 zapisa\u0107 jako uk\u0142ad r\u00f3wna\u0144 i nier\u00f3wno\u015bci i da\u0107 si\u0119 rozwi\u0105za\u0107 albo nie. Ten drugi przypadek jest ciekawszy, bo brak rozwi\u0105zania ukazuje sprzeczno\u015bci w naszym rozumowaniu. Ach, jeszcze jedno, poszukiwanie tego rozwi\u0105zania to w\u0142a\u015bnie zadanie uczenia maszynowego.<\/p><p class=\"wp-block-paragraph\">Pomy\u015blmy wi\u0119c o tym, czego mo\u017cemy oczekiwa\u0107 od interpretowalno\u015bci. By\u0142oby fajnie, gdyby pomaga\u0142a ona prognozowa\u0107 to, co zrobi model AI, czyli t\u0142umaczy\u0142a wewn\u0119trzne mechanizmy modelu na j\u0119zyk por\u00f3wna\u0144 lub poj\u0119\u0107 odwo\u0142uj\u0105cych si\u0119 do naszej dojrza\u0142ej intuicji. By\u0142oby r\u00f3wnie\u017c fajnie, gdyby ta prognoza da\u0142a si\u0119 szybko policzy\u0107 (czyli mia\u0142a niewielk\u0105 z\u0142o\u017cono\u015b\u0107 obliczeniow\u0105) i odnosi\u0142a si\u0119 do w\u0142a\u015bciwego kontekstu. <\/p><p class=\"wp-block-paragraph\">To mo\u017ce zabrzmie\u0107 niedorzecznie, ale kluczowe elementy tego pomys\u0142u rzeczywi\u015bcie mo\u017cna skonstruowa\u0107 z poj\u0119\u0107 matematycznych.Na przyk\u0142ad mo\u017cna celowo zmienia\u0107 parametry modelu i mierzy\u0107 r\u00f3\u017cnice pomi\u0119dzy generowanymi reakcjami, a potem zamodelowa\u0107 zaobserwowane zale\u017cno\u015bci przy pomocy innego modelu. Taki model mo\u017cna nazwa\u0107 interpretacj\u0105, a jak\u017ce! Mo\u017cna nast\u0119pnie oszacowa\u0107 liczb\u0119 operacji matematycznych (mno\u017cenie, dodawanie, dzielenie) niezb\u0119dnych do obliczenia takiej interpretacji. W ko\u0144cu mo\u017cna mierzy\u0107 odleg\u0142o\u015bci interpretacji (prognozowanych reakcji modelu) od ich kontekstu w przestrzeni reprezentacji wektorowych, czyli tzw. embedding\u00f3w. I oczywi\u015bcie mo\u017cna co\u015b takiego zaprogramowa\u0107 i zbada\u0107 poprzez symulacj\u0119.<\/p><p class=\"wp-block-paragraph\">Czyli wychodzi na to, \u017ce jednak musimy zacz\u0105\u0107 od matematyki. Nie ma drogi na skr\u00f3ty. Mamy jednak dobry plan. Zaczniemy od podstawowych poj\u0119\u0107, a potem b\u0119dziemy przy nich majstrowa\u0107, zadawa\u0107 niewygodne pytania i bawi\u0107 si\u0119 nimi jak zabawkami.<\/p><h4 class=\"wp-block-heading\">S\u0142ownik poj\u0119\u0107<\/h4><p class=\"wp-block-paragraph\">Macierz to jeden z najwa\u017cniejszych obiekt\u00f3w w matematyce, mo\u017ce najwa\u017cniejszy. Wygl\u0105da jak tabela \u2013 ma wiersze i kolumny, kt\u00f3re mog\u0105 by\u0107 wype\u0142nione liczbami, symbolami lub innymi obiektami matematycznymi, np. mniejszymi macierzami. Bo w sumie dlaczego nie? Oczywi\u015bcie by mog\u0142y nazywa\u0107 si\u0119 macierzami, musz\u0105 przestrzega\u0107 odpowiednich zasad dodawania i mno\u017cenia.<\/p><p class=\"wp-block-paragraph\">Modele AI s\u0105 zbudowane z bardzo wielu odpowiednio dodawanych do siebie i mno\u017conych przez siebie macierzy. Wyniki tych operacji s\u0105 nast\u0119pnie oceniane przez tzw. funkcj\u0119 aktywacji, kt\u00f3ra dzia\u0142a mniej wi\u0119cej w ten spos\u00f3b, \u017ce aktywuje si\u0119, czyli przekazuje dalej wynik, tylko je\u015bli przekracza on odpowiedni\u0105 warto\u015b\u0107. Przypomina to dzia\u0142anie filtra, kt\u00f3ry zatrzymuje to, co niechciane, a przepuszcza to, co po\u017c\u0105dane. <\/p><p class=\"wp-block-paragraph\">Jedn\u0105 z najcz\u0119\u015bciej wykorzystywanych funkcji aktywacji jest ReLU.<\/p><p class=\"wp-block-paragraph\"> <img loading=\"lazy\" decoding=\"async\" width=\"300\" height=\"52\" class=\"wp-image-7098\" style=\"width: 300px;\" src=\"https:\/\/haimagazine.com\/wp-content\/uploads\/2024\/12\/124_1.png\" alt=\"\" srcset=\"https:\/\/haimagazine.com\/wp-content\/uploads\/2024\/12\/124_1.png 340w, https:\/\/haimagazine.com\/wp-content\/uploads\/2024\/12\/124_1-300x52.png 300w\" sizes=\"auto, (max-width: 300px) 100vw, 300px\" \/><\/p><p class=\"wp-block-paragraph\">Przepuszcza ona w nienaruszonej postaci te elementy wektora x=[x<sub>1<\/sub>, x<sub>2<\/sub>, &#8230;,x<sub>n<\/sub>] , kt\u00f3re s\u0105 dodatnie, a zatrzymuje i zamienia w zero (po przyj\u0119ciu warto\u015bci zerowej nie b\u0119d\u0105 mia\u0142y wp\u0142ywu na kolejne operacje) elementy ujemne. Warstwa neuron\u00f3w w sztucznej sieci neuronowej z aktywacj\u0105 ReLU ma posta\u0107 r\u00f3wnania:<\/p><p class=\"wp-block-paragraph\"> <img loading=\"lazy\" decoding=\"async\" width=\"300\" height=\"54\" class=\"wp-image-7100\" style=\"width: 300px;\" src=\"https:\/\/haimagazine.com\/wp-content\/uploads\/2024\/12\/124_2.png\" alt=\"\" srcset=\"https:\/\/haimagazine.com\/wp-content\/uploads\/2024\/12\/124_2.png 330w, https:\/\/haimagazine.com\/wp-content\/uploads\/2024\/12\/124_2-300x54.png 300w\" sizes=\"auto, (max-width: 300px) 100vw, 300px\" \/><\/p><p class=\"wp-block-paragraph\">Neuronem numer<strong> <\/strong>k w takiej warstwie jest wtedy r\u00f3wnanie:<\/p><p class=\"wp-block-paragraph\"> <img loading=\"lazy\" decoding=\"async\" width=\"300\" height=\"80\" class=\"wp-image-7102\" style=\"width: 300px;\" src=\"https:\/\/haimagazine.com\/wp-content\/uploads\/2024\/12\/124_3.png\" alt=\"\" srcset=\"https:\/\/haimagazine.com\/wp-content\/uploads\/2024\/12\/124_3.png 430w, https:\/\/haimagazine.com\/wp-content\/uploads\/2024\/12\/124_3-300x80.png 300w\" sizes=\"auto, (max-width: 300px) 100vw, 300px\" \/><\/p><p class=\"wp-block-paragraph\">czyli zestaw operacji obliczaj\u0105cych warto\u015b\u0107 wsp\u00f3\u0142rz\u0119dnej y<sub>k<\/sub> generowanego wektora y.<\/p><p class=\"wp-block-paragraph\">G\u0142\u0119boka (wielowarstwowa) sie\u0107 neuronowa jest z\u0142o\u017ceniem bardzo wielu takich r\u00f3wna\u0144. Dla przyk\u0142adu, je\u015bli pobudzimy sygna\u0142em x sie\u0107 z\u0142o\u017con\u0105 z dw\u00f3ch warstw z aktywacj\u0105 ReLU, to odpowied\u017a b\u0119dzie opisana r\u00f3wnaniem:<\/p><p class=\"wp-block-paragraph\"> <img loading=\"lazy\" decoding=\"async\" width=\"400\" height=\"45\" class=\"wp-image-7104\" style=\"width: 400px;\" src=\"https:\/\/haimagazine.com\/wp-content\/uploads\/2024\/12\/124_4.png\" alt=\"\" srcset=\"https:\/\/haimagazine.com\/wp-content\/uploads\/2024\/12\/124_4.png 572w, https:\/\/haimagazine.com\/wp-content\/uploads\/2024\/12\/124_4-300x34.png 300w\" sizes=\"auto, (max-width: 400px) 100vw, 400px\" \/><\/p><p class=\"wp-block-paragraph\">Trenowanie sieci (modelu AI) polega na dobieraniu element\u00f3w wielu macierzy W<sub>k<\/sub>, k = 1,2,&#8230;,m w taki spos\u00f3b, aby neurony generowa\u0142y dobre odpowiedzi. Jest to zadanie optymalizacji, czyli inaczej zadanie uczenia maszynowego.<\/p><p class=\"wp-block-paragraph\">I tyle. To s\u0142ownik podstawowych poj\u0119\u0107, z kt\u00f3rych utkane s\u0105 modele AI. Mno\u017cenie i dodawanie, wybieranie liczb wi\u0119kszych od zera, wszystko proste do zinterpretowania. To prawda, jest tych operacji tak na oko w choler\u0119, ale za to wszystko wida\u0107. Znamy wewn\u0119trzn\u0105 struktur\u0119 po\u0142\u0105cze\u0144 neuron\u00f3w i mo\u017cemy bawi\u0107 si\u0119 do woli ich po\u0142\u0105czeniami. Powinni\u015bmy bez problemu poradzi\u0107 sobie ze zinterpretowaniem<br>tego, co i gdzie robi\u0105 modele AI, kiedy z nimi rozmawiamy. Prawda?<\/p><h4 class=\"wp-block-heading\">Co by tu jeszcze zepsu\u0107?<\/h4><figure class=\"wp-block-table\"><table class=\"has-background has-fixed-layout\" style=\"background-color:#e5d9f6;border-style:none;border-width:0px\"><tbody><tr><td><mark style=\"background-color:rgba(0, 0, 0, 0);color:#106ef0\" class=\"has-inline-color\"><code>Kiedy kilka dni temu odzyska\u0142 przytomno\u015b\u0107, nie pami\u0119ta\u0142, co si\u0119 sta\u0142o, ani tego, \u017ce uczniowie wezwali pomoc, ani nawet jazdy do szpitala. Przewr\u00f3ci\u0142 si\u0119 i bole\u015bnie poobija\u0142, cho\u0107 nie by\u0142o wiadomo dlaczego. Na szcz\u0119\u015bcie pami\u0119ta\u0142, jak si\u0119 nazywa, i rozumia\u0142, gdzie jest. To go uspokaja\u0142o, przynajmniej troch\u0119.<br>\u2013 Pan si\u0119 u\u015bmiechnie! \u2013 powiedzia\u0142 lekarz, wchodz\u0105c do szpitalnego pokoju.<br>\u2013 Co?<br>\u2013 Udar, ale niewielki. Mo\u017cna powiedzie\u0107, ma\u0142y. Jakby by\u0142 wi\u0119kszy, to co innego, sporo by si\u0119 pewnie w panu zepsu\u0142o.<br>Ale ten by\u0142 ma\u0142y, wi\u0119c pan si\u0119 u\u015bmiechnie! <\/code><br><code>S\u0119k w tym, \u017ce nie m\u00f3g\u0142.<\/code><\/mark><\/td><\/tr><\/tbody><\/table><\/figure><p class=\"wp-block-paragraph\">To, jak z\u0142o\u017cone s\u0105 wielowarstwowe sieci neuronowe, bardzo utrudnia ich analiz\u0119. Dlatego dobrym pomys\u0142em jest skonstruowanie prostego eksperymentu z ma\u0142ym modelem, modelem zabawk\u0105, kt\u00f3rego dzia\u0142anie b\u0119dzie mo\u017cna dok\u0142adnie obejrze\u0107 i wyja\u015bni\u0107, np. w\u0142\u0105czaj\u0105c i wy\u0142\u0105czaj\u0105c jego poszczeg\u00f3lne elementy. <\/p><p class=\"wp-block-paragraph\">I to w\u0142a\u015bnie zrobi\u0142 zesp\u00f3\u0142 naukowy Anthropic (transformer-circuits.pub), kt\u00f3ry prowadzi badania nad interpretowalno\u015bci\u0105 wielkich modeli j\u0119zykowych oraz rozwija modele z rodziny Claude (claude.ai). Przestudiujmy ten pomys\u0142 oraz fascynuj\u0105ce odkrycie, kt\u00f3rego dokonano po drodze.<\/p><p class=\"wp-block-paragraph\">Za\u0142\u00f3\u017cmy, \u017ce bawimy si\u0119 dwuwarstwow\u0105 sieci\u0105 z aktywacjami ReLU i tym samym zestawem wag W<strong> <\/strong>w obu warstwach. Za\u0142\u00f3\u017cmy, \u017ce chcemy nauczy\u0107 t\u0119 sie\u0107 odtwarzania sygna\u0142u, kt\u00f3ry j\u0105 wzbudzi\u0142. Odpowiada to sytuacji, w kt\u00f3rej pokazujemy modelowi AI nasze zdj\u0119cie, a ten odtwarza obraz bez wprowadzania \u017cadnych zniekszta\u0142ce\u0144 lub halucynacji.<\/p><p class=\"wp-block-paragraph\">Musimy w tym celu rozwi\u0105za\u0107 nast\u0119puj\u0105ce zadanie uczenia maszynowego:<\/p><p class=\"wp-block-paragraph\"> <img loading=\"lazy\" decoding=\"async\" width=\"400\" height=\"40\" class=\"wp-image-7106\" style=\"width: 400px;\" src=\"https:\/\/haimagazine.com\/wp-content\/uploads\/2024\/12\/124_5.png\" alt=\"\" srcset=\"https:\/\/haimagazine.com\/wp-content\/uploads\/2024\/12\/124_5.png 602w, https:\/\/haimagazine.com\/wp-content\/uploads\/2024\/12\/124_5-300x30.png 300w, https:\/\/haimagazine.com\/wp-content\/uploads\/2024\/12\/124_5-600x60.png 600w\" sizes=\"auto, (max-width: 400px) 100vw, 400px\" \/><\/p><p class=\"wp-block-paragraph\">To bardzo pi\u0119knie postawione zadanie optymalizacji: nale\u017cy znale\u017a\u0107 macierz W, kt\u00f3ra wygeneruje sygna\u0142 tak podobny do sygna\u0142u pobudzaj\u0105cego X, jak to tylko mo\u017cliwe. Innymi s\u0142owy, uczymy sie\u0107 kopiowania. Wiemy zatem dok\u0142adnie, co sie\u0107 ma wygenerowa\u0107. Dzi\u0119ki temu b\u0119dzie nam \u0142atwiej analizowa\u0107 wszelkie halucynacje lub b\u0142\u0119dy w kopiowaniu, na przyk\u0142ad spowodowane majstrowaniem przy parametrach modelu. No a rozwi\u0105zanie tego zadania to w\u0142a\u015bnie obiekt matematyczny, kt\u00f3ry mo\u017cemy powi\u0105za\u0107 z poj\u0119ciem interpretowalno\u015bci.<\/p><p class=\"wp-block-paragraph\">I super, mo\u017cemy si\u0119 u\u015bmiechn\u0105\u0107, nawet pomimo stoj\u0105cych przed nami trudno\u015bci! Mamy wspania\u0142\u0105 zabawk\u0119, kt\u00f3r\u0105 da si\u0119 rozebra\u0107 na cz\u0119\u015bci, zajrze\u0107 do \u015brodka i z\u0142o\u017cy\u0107 z powrotem. Trzeba jednak zapanowa\u0107 nad przebiegiem eksperymentu oraz zdecydowa\u0107, czego dok\u0142adnie i w jakich warunkach b\u0119dziemy uczy\u0107 model.<\/p><p class=\"wp-block-paragraph\">Po pierwsze, b\u0119dziemy stopniowo i w losowy spos\u00f3b wype\u0142nia\u0107 zerami wektory zbioru treningowego. M\u00f3g\u0142bym powiedzie\u0107 potocznie, \u017ce wektory b\u0119d\u0105 stawa\u0142y si\u0119 po prostu coraz rzadsze. Taki rzadki sygna\u0142 mo\u017cna por\u00f3wna\u0107 na przyk\u0142ad do konstelacji gwiazd na czarnym niebie. Sygna\u0142em g\u0119stym by\u0142aby <em>Gwia\u017adzista noc<\/em> Vincenta van Gogha. Wype\u0142nianie wektor\u00f3w zerami mo\u017cna te\u017c por\u00f3wna\u0107 do celowego wy\u0142\u0105czania fragment\u00f3w sygna\u0142\u00f3w wzbudzaj\u0105cych sie\u0107.<\/p><p class=\"wp-block-paragraph\">Po drugie, b\u0119dziemy uczy\u0107 sie\u0107, kt\u00f3ra ma zbyt ma\u0142o neuron\u00f3w. To znaczy, b\u0119dzie ich mniej ni\u017c sk\u0142adowych sygna\u0142u (element\u00f3w odtwarzanego wektora). No bo inaczej jest nuda, nic si\u0119 nie dzieje, wagi s\u0105 tak nieciekawe, \u017ce sygna\u0142 a\u017c chce wylecie\u0107 z sieci. I wylatuje, nienaruszony.<\/p><p class=\"wp-block-paragraph\">Je\u015bli jednak neuron\u00f3w b\u0119dzie za ma\u0142o, proces uczenia b\u0119dzie mia\u0142 problem. Sie\u0107 b\u0119dzie mia\u0142a k\u0142opoty z wiern\u0105 rekonstrukcj\u0105, bo pojawi\u0105 si\u0119 ograniczenia, nie wszystko b\u0119dzie mo\u017cliwe. I tego w\u0142a\u015bnie chcemy. Bo dzi\u0119ki temu b\u0119dziemy mieli szans\u0119 zaobserwowa\u0107, czego ucz\u0105 si\u0119 neurony.<\/p><p class=\"wp-block-paragraph\">Zgoda, brzmi to troch\u0119 strasznie, ale m\u00f3wimy przecie\u017c o interpretowaniu my\u015bli sztucznej inteligencji! Wi\u0119c tak, mo\u017cemy si\u0119 u\u015bmiechn\u0105\u0107 i na pocz\u0105tek co\u015b spektakularnie zepsu\u0107.<\/p><h4 class=\"wp-block-heading\">\u0141a\u0144cuch my\u015bli, czyli strumie\u0144 \u015bwiadomo\u015bci<\/h4><p class=\"wp-block-paragraph\">Je\u017celi wy\u0142\u0105czymy aktywacje ReLU i ograniczymy si\u0119 do jednej pr\u00f3bki danych, zadanie uczenia przyjmie o wiele przyjemniejsz\u0105 posta\u0107:<\/p><p class=\"wp-block-paragraph\"> <img loading=\"lazy\" decoding=\"async\" width=\"400\" height=\"55\" class=\"wp-image-7108\" style=\"width: 400px;\" src=\"https:\/\/haimagazine.com\/wp-content\/uploads\/2024\/12\/124_6.png\" alt=\"\" srcset=\"https:\/\/haimagazine.com\/wp-content\/uploads\/2024\/12\/124_6.png 442w, https:\/\/haimagazine.com\/wp-content\/uploads\/2024\/12\/124_6-300x41.png 300w\" sizes=\"auto, (max-width: 400px) 100vw, 400px\" \/><\/p><p class=\"wp-block-paragraph\">Takie zadanie mo\u017cemy przeanalizowa\u0107 i zinterpretowa\u0107 w trymiga! Wykorzystamy do tego nie tylko pot\u0119\u017cn\u0105, ale i legendarn\u0105 metod\u0119 rozwi\u0105zywania problem\u00f3w matematycznych \u201eprzez przyjrzenie si\u0119\u201d. <\/p><p class=\"wp-block-paragraph\">Metoda dzia\u0142a tak: przygl\u0105damy si\u0119 problemowi (najlepiej z powag\u0105 na twarzy) i m\u00f3wimy, jakie jest jego rozwi\u0105zanie.<\/p><p class=\"wp-block-paragraph\"><em>Ostrze\u017cenie:<\/em> poni\u017cszy akapit przedstawia przyk\u0142adowy strumie\u0144 matematycznej \u015bwiadomo\u015bci, kt\u00f3ry mo\u017ce wartko wystrzeli\u0107 podczas takiego aktu przygl\u0105dania si\u0119 i tym samym wp\u0142yn\u0105\u0107 na samopoczucie czytelnika. Zaleca si\u0119 ostro\u017cno\u015b\u0107 i daleko posuni\u0119t\u0105 wyrozumia\u0142o\u015b\u0107:<\/p><p class=\"wp-block-paragraph\">\u2026b\u0142\u0105d b\u0119dzie najmniejszy, gdy go nie b\u0119dzie, czyli W<sup>T<\/sup>Wx \u2248 x, wi\u0119c W<sub>T<\/sub>W musi przypomina\u0107 macierzow\u0105 wersj\u0119 jedynki, ale musi to by\u0107 te\u017c jako\u015b po\u0142\u0105czone z x, wi\u0119c \u2013 je\u017celi korzystamy z pseudoodwrotno\u015bci, to dla ca\u0142ego zbioru treningowego mamy W<sup>T<\/sup>Wx \u2248 XX<sup>\u271d<\/sup>, czyli w sumie tak, jakby\u015bmy rzutowali na przestrze\u0144 kolumnow\u0105\u2026<\/p><p class=\"wp-block-paragraph\">Czyli t\u0142umacz\u0105c na ludzki j\u0119zyk: dzi\u0119ki uproszczeniu oryginalnego zadania i sprowadzeniu go do operacji rzutowania otrzymujemy ciekawy punkt wyj\u015bcia do opisu optymalnego zwi\u0105zku danych z neuronami. Kto\u015b m\u00f3g\u0142by oczywi\u015bcie zapyta\u0107, czym w og\u00f3le jest rzutowanie? Ot\u00f3\u017c wyobra\u017amy sobie, \u017ce dane treningowe to obiekt, kt\u00f3ry mo\u017cna o\u015bwietli\u0107 latark\u0105. Cie\u0144 obiektu na \u015bcianie to rzut. Wagi modelu powinny by\u0107 troch\u0119 jak latarka rzucaj\u0105ca cie\u0144, cie\u0144 z kolei b\u0119dzie najwierniejsz\u0105 rekonstrukcj\u0105 danych, jak\u0105 mo\u017cna uzyska\u0107. To uproszczenie pozwala o wiele wi\u0119cej zrozumie\u0107 zrozumie\u0107 z tego, co si\u0119 dzieje w procesie uczenia, i \u015bwiadomie zrobi\u0107 kolejny krok w kierunku rozwi\u0105zania oryginalnego zadania.<\/p><p class=\"wp-block-paragraph\">I nawet je\u015bli nie uda\u0142oby si\u0119 odpowiedzie\u0107 jednym r\u00f3wnaniem na pytanie o to, co si\u0119 dzieje, to wci\u0105\u017c zrozumiemy o wiele wi\u0119cej ni\u017c dotychczas. <em>How cool is that?!<\/em>  Tak mniej wi\u0119cej wygl\u0105daj\u0105 problemy, kt\u00f3re napotykamy podczas prac nad interpretowalno\u015bci\u0105 modeli AI. Wielkie wyzwania wymagaj\u0105 interdyscyplinarnego podej\u015bcia, dobrej intuicji, inspiracji oraz gotowo\u015bci do zaakceptowania nieoczekiwanych rozwi\u0105za\u0144.<\/p><p class=\"wp-block-paragraph\">Przecie\u017c przypadkowe odkrycia zazwyczaj przytrafiaj\u0105 si\u0119 tym najbardziej przygotowanym.<\/p><h4 class=\"wp-block-heading\">No i gdzie mi tu tak my\u015bli<\/h4><figure class=\"wp-block-table\"><table class=\"has-background has-fixed-layout\" style=\"background-color:#e5d9f6;border-style:none;border-width:0px\"><tbody><tr><td><code><mark style=\"background-color:rgba(0, 0, 0, 0);color:#106ef0\" class=\"has-inline-color\">Nie m\u00f3g\u0142 si\u0119 u\u015bmiechn\u0105\u0107 nie dlatego, \u017ce nie chcia\u0142. Potrafi\u0142 zmusi\u0107 do u\u015bmiechu jedynie lew\u0105 po\u0142ow\u0119 swojej twarzy. Prawa nie reagowa\u0142a, niewa\u017cne jak bardzo si\u0119 stara\u0142. Wylew uszkodzi\u0142 t\u0119 cz\u0119\u015b\u0107 jego kory m\u00f3zgowej, kt\u00f3ra odpowiada\u0142a za sterowanie mi\u0119\u015bniami lewej cz\u0119\u015bci twarzy.Dobra wiadomo\u015b\u0107? W wieku 57 lat mia\u0142 udar m\u00f3zgu i uszed\u0142 z \u017cyciem. Z\u0142a? Najwyra\u017aniej po\u0142owa jego twarzy straci\u0142a poczucie humoru. <br>Skrzypn\u0119\u0142y drzwi.<br>\u2013 Ma pan go\u015bci \u2013 us\u0142ysza\u0142, gdy do pokoju wesz\u0142a tr\u00f3jka jego uczni\u00f3w.<br>Na ich widok na jego twarzy pojawi\u0142 si\u0119 szeroki u\u015bmiech.<br>\u2013 No prosz\u0119 \u2013 powiedzia\u0142 zaskoczony lekarz \u2013 a jednak u\u015bmiech od ucha do ucha! Ciekawe.<\/mark><\/code><\/td><\/tr><\/tbody><\/table><\/figure><p class=\"wp-block-paragraph\"><\/p><p class=\"wp-block-paragraph\">Nie wszystko mo\u017cna wyja\u015bni\u0107 przy pomocy r\u00f3wnania, niewa\u017cne, jak bardzo by\u015bmy chcieli i si\u0119 starali. Na szcz\u0119\u015bcie mamy algorytmy uczenia maszynowego. Rozwi\u0105zanie problemu matematycznego, kt\u00f3re nie daje si\u0119 opisa\u0107 r\u00f3wnaniem na kartce papieru, ale daje si\u0119 obliczy\u0107 przy pomocy w\u0142a\u015bciwych algorytm\u00f3w, nazywamy rozwi\u0105zaniem numerycznym. Takie w\u0142a\u015bnie rozwi\u0105zania uzyskano dla opisanej wcze\u015bniej ma\u0142ej dwuwarstwowej sieci ReLU. Oto co zaobserwowano.<\/p><p class=\"wp-block-paragraph\">Im wi\u0119cej jest element\u00f3w zerowych w sygnale odtwarzanym przez sie\u0107, tym bardziej wieloznaczne lub wielofunkcyjne (<em>polysemantic<\/em>) staj\u0105 si\u0119 neurony. M\u00f3wi\u0105c inaczej, neurony zaczynaj\u0105 sobie wzajemnie pomaga\u0107 (lub interferowa\u0107). Zjawisko to opisuje hipoteza o superpozycji neuron\u00f3w.<\/p><p class=\"wp-block-paragraph\">Zgodnie z t\u0105 hipotez\u0105 pojedynczy neuron mo\u017ce reagowa\u0107 na wiele sygna\u0142\u00f3w, kt\u00f3re nie musz\u0105 mie\u0107 ze sob\u0105 zwi\u0105zku (znaczeniowego lub logicznego). Taki sam zbi\u00f3r neuron\u00f3w mo\u017ce wi\u0119c aktywowa\u0107 si\u0119 na widok pyszczk\u00f3w kot\u00f3w i zderzak\u00f3w samochod\u00f3w. Dzieje si\u0119 tak szczeg\u00f3lnie wtedy, gdy neuron\u00f3w jest mniej ni\u017c element\u00f3w sygna\u0142u wzbudzaj\u0105cego sie\u0107. Ale najlepsze jest to, \u017ce bardzo przypomina to zjawiska zaobserwowane w du\u017cych modelach j\u0119zykowych, tzw. LLM. No i wszystko wskazuje na to, \u017ce uda\u0142o si\u0119 wpa\u015b\u0107 na trop rozwi\u0105zania zagadki powstawania poj\u0119\u0107 w modelach AI.<\/p><p class=\"wp-block-paragraph\"><em><mark style=\"background-color:#F3F3F3\" class=\"has-inline-color\">(&#8230;) ten opis bardzo dobrze odpowiada temu, co odkryto we wcze\u015bniejszych badaniach nad modelami j\u0119zykowymi. Wiele neuron\u00f3w wydaje si\u0119 interpretowalnych, gdy badamy ich najsilniejsze aktywacje. Jednak przy dok\u0142adniejszej analizie okazuje si\u0119, \u017ce aktywuj\u0105 si\u0119 one r\u00f3wnie\u017c dla innych wzbudze\u0144 lub znacze\u0144, cz\u0119sto z mniejsz\u0105 intensywno\u015bci\u0105. Cho\u0107 s\u0105 to tylko poszlaki, zdolno\u015b\u0107 prostego modelu do odtwarzania jako\u015bciowych cech wi\u0119kszych modeli dowodzi czego\u015b bardzo istotnego na temat interpretowalno\u015bci (&#8230;) <\/mark><a href=\"https:\/\/arxiv.org\/abs\/2209.10652\" target=\"_blank\" rel=\"noopener\"><mark style=\"background-color:#82D65E\" class=\"has-inline-color\">[\u017ar\u00f3d\u0142o]<\/mark><\/a><\/em><\/p><figure class=\"wp-block-table is-style-regular\"><table class=\"has-background has-fixed-layout\" style=\"background-color:#e5d9f6;border-style:none;border-width:0px\"><tbody><tr><td><code><mark style=\"background-color:rgba(0, 0, 0, 0);color:#106ef0\" class=\"has-inline-color\">\u2013 Spr\u00f3buj\u0119 wyt\u0142umaczy\u0107, co tu zasz\u0142o \u2013 us\u0142ysza\u0142 kilkana\u015bcie dni p\u00f3\u017aniej od lekarza. Dni wype\u0142nionych dziesi\u0105tkami bada\u0144. Odpowiada\u0142 na przer\u00f3\u017cne pytania, stawiano go w r\u00f3\u017cnych sytuacjach i prowokowano do reakcji.<br>\u2013 Pami\u0119ta pan swoj\u0105 reakcj\u0119 na wizyt\u0119 uczni\u00f3w? \u2013 zapyta\u0142 lekarz. \u2013 Ten u\u015bmiech to by\u0142a automatyczna emocjonalna reakcja m\u00f3zgu na widok os\u00f3b, kt\u00f3re pan lubi.<br>\u2013 Moi uczniowie twierdz\u0105, \u017ce j\u0119zyk wykszta\u0142ci\u0142 si\u0119 jako rozwini\u0119cie sposobu okazywania emocji.<br>\u2013 Prosz\u0119 zauwa\u017cy\u0107, \u017ce wi\u0119kszo\u015b\u0107 emocji wygl\u0105da tak samo lub bardzo podobnie w\u0142a\u015bciwie u wszystkich. I nie musimy si\u0119 tego uczy\u0107. Po prostu rozpoznajemy mimik\u0119 i mow\u0119 cia\u0142a os\u00f3b, kt\u00f3rych nie znamy. Wiele wskazuje na to, \u017ce emocje s\u0105 zakodowane genetycznie w pierwotnym obszarze m\u00f3zgu, zreszt\u0105 nie tylko u ludzi. Zwierz\u0119ta te\u017c maj\u0105 cia\u0142o migda\u0142owate po\u0142\u0105czone z mi\u0119\u015bniami twarzy. I to po\u0142\u0105czenie dzia\u0142a u pana znakomicie. Potrafi pan mimowolnie, odruchowo komunikowa\u0107 swoje emocje. Ale w tym momencie nie dzia\u0142a u pana po\u0142\u0105czenie cz\u0119\u015bci mi\u0119\u015bni twarzy z fragmentem kory m\u00f3zgowej, kt\u00f3ra pozwala na \u015bwiadome sterowanie.<br>\u2013 Co teraz? \u2013 zapyta\u0142 po chwili.<br>\u2013 B\u0119dzie pan musia\u0142 nauczy\u0107 si\u0119 z tym \u017cy\u0107 \u2013 odpowiedzia\u0142 lekarz. \u2013 Jest pan nauczycielem, podobno bardzo dobrym. Prosz\u0119 spr\u00f3bowa\u0107 nauczy\u0107 inne cz\u0119\u015bci w\u0142asnego m\u00f3zgu tego brakuj\u0105cego poczucia humoru.<br>\u2013 Jak?<br>\u2013 Krok po kroku. Neurony w m\u00f3zgu bardzo lubi\u0105 si\u0119 uczy\u0107 i ch\u0119tnie sobie pomagaj\u0105. Prosz\u0119 spr\u00f3bowa\u0107! Niech pan zacznie od czego\u015b prostego. I w ko\u0144cu si\u0119 pan u\u015bmiechnie!<\/mark><\/code><\/td><\/tr><\/tbody><\/table><\/figure><p class=\"wp-block-paragraph\">Badania nad interpretowalno\u015bci\u0105 pozwoli\u0142y zaobserwowa\u0107 zachwycaj\u0105ce zjawisko. W procesie uczenia model AI tworzy s\u0142ownik w\u0142asnych poj\u0119\u0107. To z nich komponuje swoje reakcje. Poj\u0119cia s\u0105 zakodowane przez grupy neuron\u00f3w, kt\u00f3re aktywuje kontekst. Cz\u0119\u015b\u0107 z poj\u0119\u0107 mo\u017ce by\u0107 zakodowana na sta\u0142e przy pomocy pojedynczych neuron\u00f3w, ale pozosta\u0142a cz\u0119\u015b\u0107 musi by\u0107 komponowana z innych. \u015awiat jest niezwyk\u0142y i bogaty w tre\u015b\u0107. Dlatego tak wiele neuron\u00f3w musi by\u0107 wieloznacznych (polysemantic) i wielofunkcyjnych. Inaczej sie\u0107 nie by\u0142aby w stanie wygenerowa\u0107 czego\u015b, czego wcze\u015bniej nie widzia\u0142a. <\/p><p class=\"wp-block-paragraph\">Wynika st\u0105d tak\u017ce kolejny zdumiewaj\u0105cy wniosek. Je\u017celi sygna\u0142y wzbudzaj\u0105ce model (tekst, obraz, d\u017awi\u0119k itp.), kt\u00f3re stara si\u0119 on odtworzy\u0107, aktywuj\u0105 specyficzn\u0105 kombinacj\u0119 neuron\u00f3w w uk\u0142adzie enkoder\u2013dekoder:<\/p><p class=\"wp-block-paragraph\"> <img loading=\"lazy\" decoding=\"async\" width=\"400\" height=\"44\" class=\"wp-image-7110\" style=\"width: 400px;\" src=\"https:\/\/haimagazine.com\/wp-content\/uploads\/2024\/12\/124_7.png\" alt=\"\" srcset=\"https:\/\/haimagazine.com\/wp-content\/uploads\/2024\/12\/124_7.png 585w, https:\/\/haimagazine.com\/wp-content\/uploads\/2024\/12\/124_7-300x33.png 300w\" sizes=\"auto, (max-width: 400px) 100vw, 400px\" \/><\/p><p class=\"wp-block-paragraph\">to powinni\u015bmy te zbiory neuron\u00f3w interpretowa\u0107 jak poj\u0119cia kszta\u0142tuj\u0105ce odpowied\u017a. To jednak oznacza, \u017ce poprzez wzmacnianie lub os\u0142abianie aktywacji neuron\u00f3w koduj\u0105cych poj\u0119cia mo\u017cemy wp\u0142yn\u0105\u0107 na zachowanie modelu! <\/p><p class=\"wp-block-paragraph\">Tak, oczywi\u015bcie, \u017ce przeprowadzono taki eksperyment! I to z wielkim modelem j\u0119zykowym Claude. Niewielki model enkoder\u2013dekoder wykorzystano jako sond\u0119 obserwuj\u0105c\u0105 aktywno\u015b\u0107 sieci. Wszczepiono j\u0105 pomi\u0119dzy wybrane warstwy modelu Claude, a nast\u0119pnie wytrenowano tak, aby rekonstruowa\u0142a sygna\u0142y przep\u0142ywaj\u0105ce przez ni\u0105 w kierunku dalszych warstw. Dzi\u0119ki temu mo\u017cna by\u0142o obserwowa\u0107, kt\u00f3re neurony sondy aktywuj\u0105 si\u0119 pod wp\u0142ywem przygotowanych prompt\u00f3w, i wi\u0105za\u0107 t\u0119 aktywno\u015b\u0107 z zawartymi w promptach poj\u0119ciami. A potem zmieniano wagi tych w\u0142a\u015bnie neuron\u00f3w i obserwowano reakcje wielkiego Claude\u2019a.<\/p><p class=\"wp-block-paragraph\"><mark style=\"background-color:#F3F3F3\" class=\"has-inline-color\">(\u2026) widzimy, \u017ce zmiana warto\u015bci aktywacji cechy \u201eMost Golden Gate\u201d wywo\u0142uje tematyczne powi\u0105zanie zachowania modelu w\u0142a\u015bnie z t\u0105 cech\u0105. W tym przypadku model zaczyna identyfikowa\u0107 si\u0119 jako Most Golden Gate!<\/mark> <a href=\"https:\/\/transformer-circuits.pub\/2024\/scaling-monosemanticity\/\" target=\"_blank\" rel=\"noopener\"><mark style=\"background-color:#82D65E\" class=\"has-inline-color\">[\u017ar\u00f3d\u0142o]<\/mark><\/a><\/p><p class=\"has-text-align-center wp-block-paragraph\"><img loading=\"lazy\" decoding=\"async\" width=\"1000\" height=\"254\" class=\"wp-image-6816\" style=\"width: 1000px;\" src=\"https:\/\/haimagazine.com\/wp-content\/uploads\/2024\/12\/128_1.png\" alt=\"\" srcset=\"https:\/\/haimagazine.com\/wp-content\/uploads\/2024\/12\/128_1.png 1206w, https:\/\/haimagazine.com\/wp-content\/uploads\/2024\/12\/128_1-300x76.png 300w, https:\/\/haimagazine.com\/wp-content\/uploads\/2024\/12\/128_1-1024x260.png 1024w, https:\/\/haimagazine.com\/wp-content\/uploads\/2024\/12\/128_1-768x195.png 768w, https:\/\/haimagazine.com\/wp-content\/uploads\/2024\/12\/128_1-600x152.png 600w\" sizes=\"auto, (max-width: 1000px) 100vw, 1000px\" \/><\/p><h4 class=\"wp-block-heading\">Epilog<\/h4><p class=\"wp-block-paragraph\">By\u0107 mo\u017ce zdolno\u015b\u0107 wyra\u017cania my\u015bli, czyli nasz j\u0119zyk, r\u00f3wnie\u017c wy\u0142ania si\u0119 z interakcji wielu poj\u0119\u0107 zakodowanych w wielu obszarach m\u00f3zgu. To t\u0142umaczy\u0142oby dlaczego, w odr\u00f3\u017cnieniu od uniwersalnych emocji, j\u0119zyk\u00f3w jest wiele. J\u0119zyka uczymy si\u0119 indywidualnie, krok po kroku, w okre\u015blonym otoczeniu kulturowym, a zaczynamy od prostych poj\u0119\u0107. Dopiero potem z nich budujemy sw\u00f3j obraz \u015bwiata. Podobnie jest z matematyk\u0105. Trzeba zacz\u0105\u0107 od prostych koncepcji, zrozumie\u0107 je i zinterpretowa\u0107, a dopiero potem p\u00f3j\u015b\u0107 dalej. A jak sprawdzi\u0107, czy mo\u017cna ju\u017c i\u015b\u0107 dalej? Je\u015bli uda si\u0119 nam wyt\u0142umaczy\u0107 komu\u015b w przekonuj\u0105cy spos\u00f3b to, czego si\u0119 uczyli\u015bmy, to prawie na pewno to co\u015b rozumiemy. Nie ma drogi na skr\u00f3ty. I dobrze, bo trudno o lepsz\u0105 zabaw\u0119! Potrzebne s\u0105 koncentracja, wsp\u00f3\u0142dzielenie uwagi i zadawanie trudnych pyta\u0144. <\/p><p class=\"wp-block-paragraph\">Na przyk\u0142ad takich: Czy wzmacnianie lub t\u0142umienie poj\u0119\u0107 zapisanych w modelu wystarczy, by kszta\u0142towa\u0107 zachowanie modelu, czy trzeba czego\u015b wi\u0119cej? Czy wszystkie poj\u0119cia, kt\u00f3re wykszta\u0142ci\u0142y si\u0119 w procesie uczenia, s\u0105 dla nas interpretowalne? I co, je\u015bli w s\u0142owniku poj\u0119\u0107 pojawi si\u0119 \u201eja\u201d, a potem zdolno\u015b\u0107 do zadawania trudnych pyta\u0144 o to \u201eja\u201d oraz zdolno\u015b\u0107 symulowania odpowiedzi \u201eja\u201d? <\/p><figure class=\"wp-block-table\"><table class=\"has-background has-fixed-layout\" style=\"background-color:#e5d9f6;border-style:none;border-width:0px\"><tbody><tr><td><mark style=\"background-color:rgba(0, 0, 0, 0);color:#106ef0\" class=\"has-inline-color\"><code>Do sali szpitalnej \u017cwawym krokiem wesz\u0142a tr\u00f3jka uczni\u00f3w. Zaszura\u0142y przysuwane do \u0142\u00f3\u017cka krzes\u0142a. <\/code><br><code>\u2013 No, psorze, serio, dosta\u0107 udaru, \u017ceby obali\u0107 nasze hipotezy i udowodni\u0107 swoj\u0105 racj\u0119, szacun. <\/code><br><code>\u2013 Wida\u0107 do takich \u015brodk\u00f3w trzeba si\u0119 dzi\u015b ucieka\u0107, dydaktyka udarowa. \u2013 Patrzy\u0142 na nich z wdzi\u0119czno\u015bci\u0105 i wielk\u0105 sympati\u0105. \u2013 Dzisiejsza m\u0142odzie\u017c, wiecie. <\/code><br><code>\u2013 Co pan odkry\u0142 albo co u pana odkryli? Nie wierz\u0119, \u017ce zmarnowa\u0142by pan okazj\u0119, \u017ceby si\u0119 czego\u015b dowiedzie\u0107. <\/code><br><code>\u2013 Prawda, m\u00f3j udar w\u0142a\u015bnie obali\u0142 wasz\u0105 kolejn\u0105 hipotez\u0119. J\u0119zyk nie jest bardziej rozwini\u0119tym sposobem wyra\u017cania emocji. Wygl\u0105da na to, \u017ce emocje s\u0105 niezale\u017cne od j\u0119zyka. Podstawowe emocje s\u0105 uniwersalne i zakodowane. A j\u0119zyk indywidualny i musimy si\u0119 go uczy\u0107 ca\u0142y czas. I to uczenie jest bardzo wa\u017cne. Obszary Broki i Wernickego pomagaj\u0105, ale\u2026 to nie wszystko. J\u0119zyk to co\u015b zdecydowanie wi\u0119cej. <\/code><br><code>\u2013 Co takiego?! <\/code><br><code>\u2013 O tym porozmawiamy nast\u0119pnym razem. <\/code><\/mark><\/td><\/tr><\/tbody><\/table><\/figure><p class=\"wp-block-paragraph\"><em><mark style=\"background-color:#F3F3F3\" class=\"has-inline-color\">57-letni nauczyciel zosta\u0142 przyj\u0119ty trzy dni po wyst\u0105pieniu post\u0119puj\u0105cych objaw\u00f3w i symptom\u00f3w neurologicznych, kt\u00f3re obejmowa\u0142y kolejno: dysfagi\u0119 (zaburzenia po\u0142ykania), os\u0142abienie prawej r\u0119ki, nogi i twarzy. (&#8230;) Badanie neurologiczne wykaza\u0142o pora\u017cenie nerwu twarzowego pochodzenia o\u015brodkowego w zakresie unerwienia dowolnego (umo\u017cliwiaj\u0105cego kontrolowanie \u015bwiadome). Pacjent nie by\u0142 w stanie ani gwizda\u0107, ani u\u015bmiecha\u0107 si\u0119 na \u017c\u0105danie. Natomiast podczas spontanicznego u\u015bmiechu lub \u015bmiechu mimika twarzy pozostawa\u0142a prawid\u0142owa.<\/mark><\/em> <a href=\"https:\/\/pubmed.ncbi.nlm.nih.gov\/8937357\/\" data-type=\"link\" data-id=\"https:\/\/pubmed.ncbi.nlm.nih.gov\/8937357\/\" target=\"_blank\" rel=\"noopener\"><mark style=\"background-color:#82D65E\" class=\"has-inline-color\">[\u017ar\u00f3d\u0142o]<\/mark><\/a><\/p><p class=\"has-text-align-center wp-block-paragraph\"> <img loading=\"lazy\" decoding=\"async\" width=\"500\" height=\"329\" class=\"wp-image-6818\" style=\"width: 500px;\" src=\"https:\/\/haimagazine.com\/wp-content\/uploads\/2024\/12\/128_2.png\" alt=\"\" srcset=\"https:\/\/haimagazine.com\/wp-content\/uploads\/2024\/12\/128_2.png 519w, https:\/\/haimagazine.com\/wp-content\/uploads\/2024\/12\/128_2-300x198.png 300w\" sizes=\"auto, (max-width: 500px) 100vw, 500px\" \/><\/p>","protected":false},"excerpt":{"rendered":"<p>Wiele wskazuje na to, \u017ce kluczem do rozwi\u0105zania zagadek j\u0119zyka i logicznego my\u015blenia jest interpretowalno\u015b\u0107 modeli AI. Tak, interpretowalno\u015b\u0107 modeli sztucznej inteligencji, a nie ludzkiego m\u00f3zgu. <\/p>\n","protected":false},"author":101,"featured_media":7112,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"_acf_changed":false,"rank_math_lock_modified_date":false,"footnotes":""},"categories":[402,763,754,405],"tags":[470,482,481],"popular":[],"difficulty-level":[37],"ppma_author":[378],"class_list":["post-6787","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-hai-magazine","category-ai_praktyka","category-hai_premium","category-hai-magazine-3","tag-jezyk","tag-logika","tag-macierz","difficulty-level-hard"],"acf":[],"authors":[{"term_id":378,"user_id":101,"is_guest":0,"slug":"michal-karpowicz","display_name":"dr hab. in\u017c. Micha\u0142 Karpowicz","avatar_url":"https:\/\/secure.gravatar.com\/avatar\/3b1a5fb61df9ea1ed4d5cef82d31cf03393f80500b21b528e21012a2d3cf2916?s=96&d=mm&r=g","first_name":"Micha\u0142","last_name":"Karpowicz","user_url":"","job_title":"","description":"Dyrektor Samsung AI Center w Warszawie, naukowiec w obszarze AI i system\u00f3w z\u0142o\u017conych, pasjonat algebry liniowej, tw\u00f3rca metafaktoryzacji, dwukrotnie profesor wizytuj\u0105cy na Wydziale Matematyki Massachusetts Institute of Technology (MIT)."}],"_links":{"self":[{"href":"https:\/\/haimagazine.com\/pl\/wp-json\/wp\/v2\/posts\/6787","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/haimagazine.com\/pl\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/haimagazine.com\/pl\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/haimagazine.com\/pl\/wp-json\/wp\/v2\/users\/101"}],"replies":[{"embeddable":true,"href":"https:\/\/haimagazine.com\/pl\/wp-json\/wp\/v2\/comments?post=6787"}],"version-history":[{"count":13,"href":"https:\/\/haimagazine.com\/pl\/wp-json\/wp\/v2\/posts\/6787\/revisions"}],"predecessor-version":[{"id":7115,"href":"https:\/\/haimagazine.com\/pl\/wp-json\/wp\/v2\/posts\/6787\/revisions\/7115"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/haimagazine.com\/pl\/wp-json\/wp\/v2\/media\/7112"}],"wp:attachment":[{"href":"https:\/\/haimagazine.com\/pl\/wp-json\/wp\/v2\/media?parent=6787"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/haimagazine.com\/pl\/wp-json\/wp\/v2\/categories?post=6787"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/haimagazine.com\/pl\/wp-json\/wp\/v2\/tags?post=6787"},{"taxonomy":"popular","embeddable":true,"href":"https:\/\/haimagazine.com\/pl\/wp-json\/wp\/v2\/popular?post=6787"},{"taxonomy":"difficulty-level","embeddable":true,"href":"https:\/\/haimagazine.com\/pl\/wp-json\/wp\/v2\/difficulty-level?post=6787"},{"taxonomy":"author","embeddable":true,"href":"https:\/\/haimagazine.com\/pl\/wp-json\/wp\/v2\/ppma_author?post=6787"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}