Andrew Lowy stellt sich vor: „Ich habe mich in die Mathematik verliebt, als mir klar wurde, wie viele Herausforderungen sie bereithält“
Diese Frage ist alles andere als abstrakt. Ob beim abendlichen Serien-Streaming, beim Online-Kauf oder im Krankenhaus: Machine-Learning-Modelle werden längst überall eingesetzt. Sie verarbeiten dabei hoch sensible Daten: Unsere Social-Media-Posts werden gescannt, unsere Gesundheitsdaten analysiert und unsere Interaktionen mit Chatbots fließen wieder zurück ins Training der Modelle. All diese Daten erlauben tiefe Einblicke in unser Verhalten und unsere Lebensumstände. Umso dringender stellt sich die Frage, wie sich die effektive Nutzung von ML-Modellen mit dem Schutz unserer Privatsphäre vereinbaren lässt. Genau an dieser Schnittstelle arbeitet unser neuer CISPA-Faculty Dr. Andrew Lowy: „Ich frage mich vor allem: Was ist die bestmögliche Leistung, auf die wir bei einem Modell hoffen können, wenn wir auch Aspekte wie Datenschutz oder Robustheit berücksichtigen?“
Lowy untersucht in seiner Arbeit, wie gut Lernalgorithmen unter Datenschutz- und Fairnessanforderungen grundsätzlich sein können und entwickelt Verfahren, die diese theoretischen Leistungsgrenzen möglichst effizient in der Praxis erreichen. „Wenn man die grundlegenden Grenzen nicht kennt, kann es passieren, dass eine ganze Forschungsgemeinschaft Jahre damit verschwendet, etwas zu verbessern, das bereits optimal ist.“ Seine Arbeit setzt genau hier an: Er entwickelt Verfahren und analysiert gleichzeitig deren theoretische Leistungsfähigkeit. „Ich beweise sowohl Obergrenzen als auch Untergrenzen, ich zeige also, was erreichbar und was unmöglich ist.“ Dieser Fokus auf sogenannte „fundamental limits“ ist stark von klassischen Methoden aus Statistik und Informationstheorie geprägt, die Lowy auf moderne Fragestellungen im maschinellen Lernen überträgt.
Zwischen der Genauigkeit von Modellen, dem Schutz der Privatsphäre und ihrer Effizienz entsteht ein grundlegendes Spannungsfeld. „Wenn wir Techniken zum Schutz persönlicher Daten beim Training von Modellen einsetzen, verringern diese häufig die Menge oder Qualität der Daten, die einem Modell zur Verfügung stehen“, erklärt Lowy.
Ein zentraler Ansatz in diesem Kontext ist die sogenannte Differential Privacy. Dahinter steht eine streng mathematische Definition von Datenschutz: Sie garantiert, dass einzelne Datenpunkte den Ausgang einer Auswertung nur sehr begrenzt beeinflussen. In der Praxis wird dies erreicht, indem Ergebnisse gezielt leicht „unscharf“ gemacht werden, durch kleine zufällige Abweichungen, die einzelne Beiträge verschleiern, ohne das Gesamtbild stark zu verfälschen.
Große Unternehmen wie Apple oder Google setzen Differential Privacy bereits in einzelnen Anwendungen ein. Gleichzeitig bleibt ihre Umsetzung anspruchsvoll. „Differential Privacy ist weiterhin der Goldstandard, wenn es um den Schutz von Privatsphäre geht“, sagt Lowy. „Aber man kann einen Algorithmus nicht einfach ‚privat machen‘ und erwarten, dass er dann auch gut funktioniert.“ Wie viel Unsicherheit man einbauen kann, ohne die Aussagekraft der Ergebnisse zu verlieren, erfordert präzise Abstimmung.
Neben klassischen Szenarien beschäftigt sich Lowy auch mit föderiertem Lernen. Das sind Ansätze, bei denen Daten dezentral bleiben und Modelle gemeinsam trainiert werden. Solche Verfahren kommen etwa bei sensiblen medizinischen Daten zum Einsatz: Kliniken müssen ihre Daten nicht teilen und zentral verfügbar machen und dennoch profitieren alle von den Erkenntnissen, die aus Patientendaten gewonnen werden können.
Hier verschieben sich auch die Anforderungen an den Datenschutz: „Beim föderierten Lernen reicht die klassische Differential Privacy oft nicht aus.“ Stattdessen brauche es stärkere Garantien, die auch den Austausch zwischen verschiedenen Parteien absichern. Lowys Arbeiten zeigen, wie sich solche Modelle formal fassen und algorithmisch umsetzen lassen. Das ist ein wichtiger Schritt für Anwendungen, bei denen Daten nicht zentral gesammelt werden können oder sollen.
Trotz großer Fortschritte sieht Lowy sein Forschungsfeld noch lange nicht am Ziel. Besonders im Bereich moderner neuronaler Netze, also nicht-konvexer Optimierungsprobleme, seien viele grundlegende Fragen ungelöst „Die derzeitigen Algorithmen für Deep Learning sind noch lange nicht optimal.“ Gerade hier sieht er großes Potenzial für zukünftige Forschung und die Chance, Theorie und Praxis noch enger zusammenzuführen.
Lowys eigener Weg in die Forschung verlief dabei nicht geradlinig: Ursprünglich studierte der US-Amerikaner Public Policy mit Fokus auf Ökonomie an der Princeton University, bevor er über die Mathematik zum maschinellen Lernen fand. „Ich habe mich in die Mathematik verliebt, als mir klar wurde, wie viele Herausforderungen sie bereithält“, sagt er. Diese Begeisterung für grundlegende Fragen prägt seine Arbeit bis heute: das Interesse daran, nicht nur Lösungen zu entwickeln, sondern zu verstehen, was grundsätzlich möglich ist und was nicht.