Episode 32: Privatsphäreschutz bei Large-Language-Modellen mit Dr. Franziska Boenisch
Zum ersten Mal in Berührung gekommen ist CISPA-Faculty Dr. Franziska Boenisch mit dem Maschinellen Lernen während ihres Informatik-Studiums. „Ich war sofort hooked“ erzählt sie im Podcast. Sie wollte dabei vor allem verstehen, was innerhalb der Modelle passiert. „Wenn wir nicht wissen, wie diese Modelle funktionieren, können wir auch nicht verstehen, wie die Daten aus diesen Modellen aus Versehen oder im falschen Moment wieder herauskommen,“ erklärt sie. Als Beispiel für eine Anwendung aus der Praxis erwähnt Boenisch den Auftrag an ein Sprachmodell, aus den eingegebenen persönlichen Daten einen Lebenslauf zu erstellen. Sie möchte Modelle so bauen, dass die Daten nur für den Auftrag genutzt, aber nicht weitergegeben werden können. Die technische Herausforderung dabei ist, nicht nur die Privatsphäre zu schützen, sondern die Modelle gleichzeitig gute Vorhersagen machen zu lassen, erklärt Boenisch im Gespräch.
Open-Source-Modelle und die Rolle der Politik
Erschwert wird Boenischs Forschung dadurch, dass die Modelle in den Händen weniger Unternehmen konzentriert sind. „Wir müssen Open AI dafür bezahlen, Forschung machen zu dürfen“, so Boenisch im Podcast. Open Source Modelle wären für sie eine Alternative. Entscheidend ist für sie dabei, dass die Forschung immer mit dem Stand der Technik mitgeht, was jedoch große finanzielle Ressourcen notwendig macht. Und dafür braucht es auch Unterstützung aus der Politik, weshalb Wissenstransfer für sie ein wichtiges Thema ist: „Wir brauchen mehr Expert:innen, die den Outcome aus der Wissenschaft zurück in die Politik bringen können.“ Leider fehlt für den Wissenstransfer im Alltag jedoch oft die Zeit. „Wichtig wäre die Wissenschaftler:innen finanziell besser auszustatten, damit sie sich nicht nur um die Publikation und die Akquise von neuen Geldern kümmern müssen, sondern Zeitblöcke finanziert haben, wo sie sich dem Wissenstransfer widmen können“, so Boenisch im Gespräch.
Frühe Förderung des weiblichen Nachwuchses wichtig
Während ihres Studiums hätte Boenisch sich gewünscht, eine Mentorin zu haben. „Ich hatte kein Role-Model, an dem ich mich orientieren konnte“, erzählt sie im Podcast. „Mentoring Programm sind wichtig, damit wir die wenigen Frauen in unserem Bereich nicht verlieren“, zeigt sie sich überzeugt. In dem von ihr am CISPA gegründeten SPRINT ML Lab musste sie erfahren, dass einfach eine Stelle ausschreiben und hoffen, dass sich Frauen bewerben, nicht ausreicht. Sie selbst hat gut Erfahrungen damit gemacht, Studentinnen schon während des Bachelors anzusprechen und etwa über die Arbeit als studentische Hilfskraft an die Forschung heranzuführen. Aber sie ist überzeugt: „Auf Seite der Betreuenden muss ein großer Mindshift passieren.“ Denn während Männer oft herausstellen, dass sie alles können, weisen Frauen eher darauf hin, dass sie sich noch Dinge erarbeiten müssen, erzählt sie im Podcast. Dies erfordert ein Umdenken in Bewerbungsprozessen. Boenisch hat dabei ein klares Ziel vor Augen: „Ich möchte mehr Doktorandinnen für meine Gruppe gewinnen“.
TL;DR, Abkürzung für „Too Long Didn‘t Read”, ist der CISPA Podcast, mit „Women in Cybersecurity“ als Special Edition. Wir sind damit seit 2022 On Air und auf allen gängigen Podcastplattformen. Jeden Monat sprechen wir mit CISPA-Forscher:innen über ihre Arbeiten zu Cybersicherheitsthemen und Künstlicher Intelligenz und versuchen ihnen genau die Fragen zu stellen, die sich die Hörer:innen auch stellen. Unser Ziel ist, komplexe Themen in einfacher Sprache zu erklären. Da am CISPA Menschen aus 49 Nationen arbeiten, werden die Gespräche mal auf Deutsch, mal auf Englisch geführt.