Autor: Piotr Szczuko

  • Piotr Szczuko

    Niebezpieczne słabości LLM, czyli koty, dr House, poezja i autorytety

    W teorii są odporne na manipulacje, w praktyce wystarczy sprytnie podane polecenie, aby zaczęły działać wbrew własnym zabezpieczeniom. Modele językowe radzą sobie z ogromnymi kontekstami, ale wciąż ulegają nieoczywistym bodźcom – od…

    Niebezpieczne słabości LLM, czyli koty, dr House, poezja i autorytety