Sicherheit von Large-Language-Modellen mit Dr. Lea Schönherr

Eine neue Episode unseres CISPA-TL;DR Podcasts ist online! Folge 22 ist wieder Teil unserer Reihe #WomenInCybersecurity. Darin sprechen wir mit CISPA-Faculty Dr. Lea Schönherr über die Sicherheit von sogenannten Large-Language-Modellen wie ChatGPT und die Frage, wie sie Schwachstellen in den Modellen aufspürt. Zudem verrät uns Lea, wie es sich als Elektro- und Informationstechnologin so unter Informatiker:innen forscht. Das Gespräch wurde auf Deutsch geführt und ist ab jetzt hier verfügbar und überall, wo es Podcasts gibt.

Kaum ein digitales Themenfeld hatte in diesem Jahr so große Konjunktur wie ChatGPT. Technisch gesehen handelt es sich dabei um sogenannte Large-Language-Modelle (LLM). Das sind große generative Sprachmodelle, die mittels künstlicher Intelligenz in der Lage sind, Eingaben in natürlicher Sprache zu verstehen und zu verarbeiten. Sie kommen häufig auch mit komplexen Fragen und Anweisungen zurecht und produzieren Texte in bisher nie dagewesener Qualität. Die den Modellen zugrundeliegenden neuronale Netzwerke und Deep-Learning-Algorithmen können aber noch für sehr viel mehr eingesetzt werden als nur zum Chatten. So gibt es codegenerative Modelle, die – wie die Bezeichnung schon verrät – Code und damit ganze Computerprogramme generieren können.

Doch egal ob natürlichsprachliches oder codegeneratives Modell – sie alle haben Schwachstellen. Diese aufzuspüren und damit die Anwendungen zu verbessern, das hat sich CISPA-Faculty Lea Schönherr zum Ziel gesetzt. „Wenn es neue Systeme wie jetzt Large Language Modelle gibt, dann schaut man zuerst, wo es dort Schwachstellen geben könnte“ so Schönherr. „Wenn man das aus Sicht der Angreifer:innen macht, kann man sich auch direkt ein Worst-Case-Szenario anschauen“. Diese Herangehensweise läuft auch unter dem Stichwort „Adversarial Machine Learning“. Vor allem für den Bereich Large-Language-Modelle ist dies noch ein recht junger Forschungszweig, wie Schönherr erzählt. „Das ist wirklich Teil der Forschung herauszufinden, was da die besten Vorgehensweisen sind“, so die CISPA-Faculty.

Um diese und andere Forschungslücken zu schließen, ist Lea Schönherr 2022 als Tenure-Track Faculty nach Saarbrücken gekommen. Sie kam von der Ruhr-Universität in Bochum, wo sie zuerst Doktorandin, später Post-Doc war. Am CISPA und in Saarbrücken hat sie sich „sehr schnell gut aufgenommen gefühlt“. Wichtig bei der Arbeit ist Schönherr ein diverses Team, wie sie im Gespräch erzählt: „Das macht einfach vielmehr Spaß, auch wenn man nicht die einzige Frau ist“. Um mehr Frauen in IT-Berufen zu fördern, braucht es ihrer Meinung nach mehr Engagement: „Dass man möglichst früh Interesse weckt, das wäre eine sehr gute Möglichkeit.“ Anwendungen wie ChatGPT nutzt sie auch privat, etwa wenn es um die Suche nach einer Definition oder ein kurzes Geburtstagsgedicht geht. Im Vordergrund steht jedoch, die eigene Neugier an solchen Systemen zu befriedigen. Da decken sich dann ihre persönliche mit ihren beruflichen Interessen.

TL;DR, Abkürzung für “Too long didn‘t read”, ist der CISPA Podcast, mit #WomenInCybersecurity als Special Edition. Wir sind damit seit 2022 On Air und auf allen gängigen Podcastplattformen. Jeden Monat sprechen wir mit CISPA-Forscher:innen über ihre Arbeiten zu Cybersicherheitsthemen und Künstlicher Intelligenz und versuchen ihnen genau die Fragen zu stellen, die sich die Hörer:innen auch stellen. Unser Ziel ist, komplexe Themen in einfacher Sprache zu erklären. Da am CISPA Menschen aus 43 Nationen arbeiten, werden die Gespräche mal auf Deutsch, mal auf Englisch geführt.

Zum Podcast