Schutz vor Datenlecks in großen KI-Modellen: ERC Starting Grant für CISPA-Forscherin
Der ERC Starting Grant zählt zu den renommiertesten Auszeichnungen für Nachwuchsforschende in Europa. Er unterstützt Grundlagenforschung mit hohem Innovationspotenzial. „Diesen Grant zu erhalten ist für mich persönlich eine Bestätigung dafür, dass sich Grundlagenforschung für Gesellschaft und Technologie lohnt, und dass Vertrauen in künstliche Intelligenz nur mit echtem Datenschutz möglich ist“, sagt Franziska Boenisch. Doch gerade dieser Datenschutz ist schwer zu gewährleisten – vor allem bei großen KI-Modellen wie GPT oder LLaMA. Diese sogenannten Foundation Models werden im Pretraining mit riesigen, unkuratierten Datensätzen gefüttert, darunter auch höchst sensible Daten, wie unsere Emails oder private Konversationen mit Modellen wie ChatGPT. Im Fine-Tuning folgt die Anpassung an spezifische Aufgaben, zum Beispiel Kundenservice oder medizinische Diagnostik, wobei ebenfalls sensitive Daten in die Modelle fließen können. So entstehen leistungsstarke Systeme für Bild-, Audio- und Textgenerierung. Die Kehrseite: Sie können ungewollt private Informationen preisgeben. Genau hier setzt Boenisch an: „Mein Projekt entwickelt neue Methoden, damit Foundation Models nicht ungewollt private Daten aus ihrem Training ausgeben. Ich sorge dafür, dass die Daten geschützt bleiben und dass wir erkennen können, wenn es doch ein Problem gibt,“ erklärt sie.
Was Boenisch besonders an dem Thema reizt, ist die zunehmende Bedeutung von KI im Alltag: „Foundation Models sind für viele Menschen inzwischen das neue Google. Sie werden für alle möglichen, auch sehr persönlichen Fragen genutzt.“ Der Schutz privater Informationen sei dabei nicht nur ein technisches, sondern auch ein gesellschaftliches Anliegen: „Am schlimmsten ist es, wenn wir nicht einmal merken, dass ein Modell Daten preisgibt – denn alles, was einmal öffentlich wurde, bleibt es für immer. Und das ist im Moment genau das Risiko. Aktuelle Methoden sind nicht zuverlässig darin, Datenlecks zu erkennen und zu verhindern. Mein Projekt entwickelt neue Methoden, um genau diese Lücke zu schließen und macht sichtbar, wo Risiken bestehen.“ Der ERC Grant eröffnet der Forscherin neue Möglichkeiten: „Für mich ist der ERC eine riesige Chance. Ich kann dank der Förderung ein starkes Forschungsteam aufbauen, das sich mit voller Kraft einem Thema widmet, das uns alle betrifft: dem Schutz unserer Daten in einer Welt der KI.“
Bisherige Methoden zum Schutz vor Datenlecks greifen laut Boenisch oft nur in einzelnen Phasen des Trainingsprozesses oder führen zu erheblichen Qualitätseinbußen in den Modellen. Ihr Projekt geht deshalb mehrere Schritte weiter: „Mein Ansatz bietet erstmals eine theoretische Privatsphäre-Garantie über den gesamten Lebenszyklus von Foundation Models, nicht nur für einzelne Etappen wie das Fine-Tuning, wie es bisher der Fall war. Ich mache Pretraining-Datenschutz endlich praktisch, ohne die riesigen Qualitätseinbußen in den Modellvorhersagen, die frühere Methoden hatten.“ Die Effizienz der Modelle zu erhalten, ist nur eine der großen Herausforderungen, der sich Boenisch stellt. Auch Die Frage nach gesellschaftlicher und rechtlicher Kontrolle der KI-Modelle ist Teil ihres Forschungsprojekts: „Ich erweitere die Methodenentwicklung mit der Entwicklung von neuen Auditing Tools, und mein Auditing verbindet erstmals technische Risiken, wie die Erfolgsquote bestimmter Attacken, direkt mit Datenschutzrisiken aus der DSGVO und verbinde damit unsere technischen Möglichkeiten mit den rechtlichen und gesellschaftlichen Notwendigkeiten.“
Der Europäische Forschungsrat (ERC), der 2007 von der Europäischen Union gegründet wurde, ist die führende europäische Förderorganisation für exzellente Pionierforschung. Er unterstützt kreative Forscherinnen und Forscher aller Nationalitäten und Altersgruppen bei der Durchführung von Projekten in ganz Europa. Der ERC bietet vier zentrale Förderlinien an: Starting Grants, Consolidator Grants, Advanced Grants und Synergy Grants. Mit seinem zusätzlichen Proof of Concept Grant unterstützt er Geförderte dabei, das Innovationspotenzial ihrer Ideen oder Forschungsergebnisse zu erschließen. Der ERC wird von einem unabhängigen Leitungsgremium, dem Scientific Council, geführt. Seit dem 1. November 2021 ist Maria Leptin Präsidentin des ERC.