E-mail senden E-Mail Adresse kopieren

Mining nach  SICHERHEIT

MUSTER UND KAUSALITÄT

MOTIVATION

Da die Welt mehr und mehr datengetrieben ist, ist die Frage "Was geht in meinen Daten vor?" zu einer der wichtigsten Fragen sowohl in der Industrie als auch in der Wissenschaft geworden --- und, nicht überraschend, auch in der Cybersicherheit. Denn bevor wir feststellen können, ob etwas außergewöhnlich ist, müssen wir erst einmal feststellen, was normal ist. Bevor wir einem Algorithmus oder seinem Ergebnis vertrauen können, muss er interpretierbar, erklärbar, fair und transparent sein. Bevor wir Daten freigeben können, brauchen wir Garantien, dass die Daten nützlich sind, aber auch, dass es keine versteckten Assoziationen oder Abhängigkeiten gibt, die die Privatsphäre oder Geschäftsgeheimnisse verletzen könnten.  Daher arbeiten wir an jedem dieser Probleme und legen die Grundlagen für eine vertrauenswürdige Verarbeitung empirischer Daten.

 

AKTUELLE FORSCHUNGSRICHTUNGEN

Muster und Anomalien. Wir entwickeln Methoden, die Daten und die dahinter stehenden Prozesse in leicht verständlichen Worten erklären können. Insbesondere untersuchen wir, wie sich die wichtigsten und statistisch bedeutsamsten Muster effizient aus Daten extrahieren lassen und wie diese Muster genutzt werden können, um sowohl das Normale als auch das Fremde in den Daten zu identifizieren, zu bewerten und zu erklären.

Gerüchte zurückverfolgen. Wir untersuchen Algorithmen, die bei nur stark verrauschten Teilinformationen in der Lage sind, zuverlässig zurückzuverfolgen, was in der Vergangenheit passiert ist; zum Beispiel um festzustellen, wer ein gefälschtes Nachrichtengerücht in Umlauf gebracht hat, die wahrscheinlichsten Ausgangspunkte eines Ausbruchs eines tatsächlichen Virus oder die wichtigsten Knoten in einem Botnetz.

Kausale Schlussfolgerung. Wir untersuchen eine der grundlegendsten Fragen der Wissenschaft: Wie kann man Ursache und Wirkung anhand von nur empirischen Daten bestimmen? Das heißt, wir entwickeln Theorien und Methoden für das große Ziel, die wahren Ursachen eines Phänomens und die Bedingungen, die es hervorrufen, zu bestimmen, wobei wir nur einen begrenzten Datensatz haben, der möglicherweise nicht alle relevanten Merkmale enthält. Obwohl dieses Problem teilweise unmöglich zu lösen ist, hat uns dies bisher nicht davon abgehalten, große Schritte in diese Richtung zu unternehmen.

LEAD FACULTY