E-mail senden E-Mail Adresse kopieren

2022-12-02
Kristina Kliebenstein

„Wir müssen KI-Werkzeuge entwickeln, die uns schützen, nicht schaden.“

Die 28-jährige Tẹjúmádé Àfọ̀njá stellt sich am CISPA den Herausforderungen der Forschung im Bereich künstliche Intelligenz (KI), doch hier endet ihr Engagement noch nicht. In ihrer Freizeit gründete sie darüber hinaus spannende Projekte in ihrer Heimat Nigeria und fördert durch ihren Einsatz die Verbreitung von KI-Wissen. Mit Samstags-Lerngruppen ermöglicht sie auch insbesondere Nigerianer:innen und anderen Afrikaner:innen den freien Zugang zu Fortbildungen und mithilfe eines Teams aus Forscher:innen widmet sie sich der Sprachforschung in Afrika. Im Interview hat Tẹjúmádé einen Rat für all diejenigen, die sich tiefer in die Wissenschaft der künstlichen Intelligenz einarbeiten möchten.

Bitte erzähl uns ein wenig über deine Ausbildung und deinen bisherigen Werdegang.

Ich habe mein Bachelorstudium an der Ladoke Akintola Universität in Nigeria in Maschinenbau 2015 abgeschlossen. Von 2016 bis 2019 habe ich als Softwareentwicklerin gearbeitet und Chatbots, Websites, analytische Dashboards und eine Konferenz-App zum Schutz der Privatsphäre entwickelt. Im Jahr 2018 habe ich eine Lern-Community mitgegründet. Diese trifft sich 16 Wochen lang jeden Samstag und lernt gemeinsam zum Thema künstliche Intelligenz. Dort habe ich beim tieferen Einstieg in die Konzepte und Mathematik von maschinellem Lernen bemerkt, wie wenig ich wusste. Um mein Wissen auszubauen, habe ich 2019 beschlossen nach Deutschland zu ziehen und meinen Master-Abschluss in Informatik zu machen. Vor Kurzem habe ich mein Studium an der Universität des Saarlandes erfolgreich abgeschlossen.

Wie bist du ans CISPA gekommen?

Während meines ersten Semesters an der Universität des Saarlandes habe ich einen Kurs in maschinellem Lernen und Cybersicherheit belegt, der von CISPA-Faculty Prof. Dr. Mario Fritz angeboten wurde. Ich erinnere mich, dass ich mir beim Betreten des CISPA-Gebäudes sagte, dass ich eines Tages auch hier arbeiten würde. Am Ende der Vorlesung habe ich Mario angesprochen und ihn gebeten, meine Masterarbeit zu betreuen. Während meines zweiten Semesters habe ich aus dem Homeoffice ein Sommerpraktikum an der Universität von Toronto und dem Vector Institut absolviert. Unter Aufsicht von Prof. Dr. Nicolas Papernot befasste ich mich mit einem Modellextraktionsansatz für Sprecheridentifikationsmodelle. Meine Untersuchung bezog sich auf die Anfälligkeit für Angriffe auf Sprecheridentifikationsmodelle. Hackt sich ein Angreifer in diese Modelle, kann er die Antwortlabel durch einen eigenen fehlerhaften Datensatz ersetzen. Der Angreifer kann die Funktionalität des Opfermodells erfolgreich nachbilden und die Arbeit, die in das Modell geflossen ist, zunichte machen. In der Sprecheridentifikation bedeutet dies konkret, dass das Modell nach einem Angriff vielleicht nicht mehr in der Lage wäre, einen Sprecher richtig einzuordnen.

Nach meinem Praktikum habe ich mich der Forschungsgruppe von Mario angeschlossen, in der ich an der Generierung privater synthetischer Kohorten genetischer Daten arbeitete. Später habe ich meine Masterthese für die Forschung aufgegriffen, welche sich auf das Lernen von generativen Modellen für tabellarische Daten basierend auf kleinen Stichproben konzentrierte.

Du bist Gruppenleiterin des „SautiProjektes“ in Nigeria, einer Community aus Forscher:innen. Kannst du uns erzählen, was das “SautiProject” ist und woran dort gearbeitet wird?

SautiProject ist eine Forschungsgruppe unter TRI-AI, einer Non-Profit Organisation, die ich mit meinen Kolleg:innen von AISaturdays Lagos gegründet habe. Das Projekt untersucht Akzente in Nigeria mit dem Ziel, die Akzentforschung in Afrika zu verbessern. Es gibt etwa 250 ethnische Gruppen in Nigeria und jede hat ihre eigene Sprache. Im Grunde existieren 3 Hauptsprachen (von den Stämmen Igbo, Yoruba und Hausa), doch darunter gibt es zahlreiche weitere Sprachen und Akzente. Das Sprachverständnis kann daher sehr unterschiedlich sein.

Das SautiProject besteht derzeit aus vier Teilen: „SautiDB“ ist eine Plattform zum Sammeln von Crowdsourcing-Datensätzen. Webseitenbesucher:innen werden gebeten, Texte vorzulesen, damit wir ihre Art zu sprechen erfassen können. „SautiClean“ ist ein Nachbearbeitungswerkzeug für Sprach-Datensätze. Nachdem wir das Audio erhalten haben, hören mein Team und ich die Dateien an und filtern nach Abnormalitäten oder spezifischen Merkmalen des Akzents. Das maschinelle Lernwerkzeug “SautiClassify” hilft uns Akzente zu klassifizieren. Ich wuchs beispielsweise beim Yoruba-Stamm auf und jemand aus Nigeria wird vermutlich an meinem Akzent feststellen können, dass ich ursprünglich von diesem Stamm komme. Indem ich ein Sprachbeispiel meiner Stimme aufnehme, sollte das Programm in der Lage sein, meinen Akzent zu identifizieren. Der letzte Teil des Projektes ist ein Übersetzungswerkzeug. Es nennt sich „SautiTranslate“. Dieses soll von einem zum anderen Akzent übersetzen.

Du hast zu Beginn das Projekt “AISaturdays Lagos” erwähnt, welches du ebenfalls mitgegründet hast. Um was geht es bei diesem Projekt und wie würde ein „typischer“ Samstag aussehen?

AISatudays Lagos ist eine Lern-Community aus Schüler:innen und Forscher:innen in Nigeria. Mein Team aus Forscher:innen und ich unterrichten über 16 Wochen an Samstagen in den Themenbereichen künstliche Intelligenz und maschinelles Lernen. Ich unterrichte aktuell aus dem Homeoffice. Das Ziel des Projektes ist es, das Wissen im Bereich künstliche Intelligenz in Afrika für alle frei zugänglich zu machen und nützliche wissenschaftliche Werkzeuge zu entwickeln.

Ein „typischer“ Samstag würde wie folgt aussehen: Vor der Pandemie hatten wir einen Klassenraum mit etwa 40 bis 100 Student:innen mit verschiedenen Wissenshintergründen. Seit der Pandemie finden die Unterrichtsstunden online statt. Viele unserer Schüler:innen beenden gerade ihr Bachelorstudium, aber wir haben auch Student:innen aus Masterstudiengängen, solche, die bereits arbeiten oder jene, die sich in einer Übergangsphase von einem Forschungsgebiet zu einem anderen befinden. Während des 16-wöchigen Kurses arbeiten wir unter anderem mit Open-Source-Angeboten von der Universität Stanford, der Carnegie Mellon Universität oder der Universität von Amsterdam. Die Unterrichtsstunden werden von einem Dozenten geleitet und sind ein Mix aus theoretischen und praktischen Inhalten. Wir haben beispielsweise am Morgen theoretische Kurse von 10 bis 12 Uhr und von 13 bis 15 Uhr können die Schüler:innen die erlernten Konzepte in die Praxis umsetzen. Die Schüler:innen erhalten im Rahmen des Kurses auch Aufgaben und es wird erwartet, dass sie an einem Einzel- oder Gruppenprojekt arbeiten. Am Ende der Kurseinheit bieten wir den Absolvent:innen, die alle erforderlichen Voraussetzungen erfüllen, ein Abschlusszertifikat an.

Mit frei zugänglichen Communitys wie AISaturdays Lagos wird ein niedrigschwelliger Zugang zu komplexen Forschungsgebieten ermöglicht. Siehst du nach ein paar Jahren Projektarbeit, dass mittlerweile mehr Frauen an den Kursen teilnehmen? Was könnte ein Grund dafür sein, dass es immer noch weniger Frauen als Männer in der KI-Forschung gibt?

Wir haben definitiv einige Frauen in unserer Community, aber das ist noch nicht genug, weil das Verhältnis noch nicht stimmt. Im SautiProject-Team sind meine Kollegin Lebogang und ich zum Beispiel die einzigen Frauen, was etwa 20 Prozent des Teams ausmacht. Das ist nicht gut und kommt nicht daher, dass es keine kompetenten Frauen gäbe. Es erfordert nur Mut und Glauben an sich selbst, sich in schwierige Themen einzuarbeiten. In unseren Kursen haben wir mit etwa 30 Prozent eine recht gute Quote erreicht. Es gibt außerdem eine Community aus tausenden Frauen in Afrika mit dem Namen “She Code Africa”, die von Ada Nduka Oyom gegründet wurde. Dabei handelt es sich um eine gemeinnützige Organisation, die das Ziel verfolgt, junge Mädchen und Frauen in Afrika darin zu bestärken sich an Technologie und Forschung anzunähern. Dabei bilden sie sich nicht nur in den Bereichen maschinelles Lernen oder künstliche Intelligenz fort, sondern auch in Softwareentwicklung und Cloud Computing. Forschung, die in diesen Communities stattfindet, ist mit Sicherheit ein Weg, unser Ziel zu erreichen, mehr Frauen für die Thematik zu begeistern. Ich bin jedoch grundsätzlich der Meinung, wir sollten eine Balance in der Gesellschaft schaffen, nicht das eine oder andere Geschlecht ausschließen oder generell bevorzugen.

Woher kommt dein Interesse, KI-Forschung in Afrika voranzutreiben? Warum ist es das Forschungsgebiet deiner Wahl?

Während meines zweiten Studienjahres in Maschinenbau, fand ich mich versehentlich in einer Klasse mit Studenten wieder, die über NASA-Roboter im Weltraum sprachen. Die Frage, die sie sich stellten, machte mich neugierig und ließ mich während des gesamten Studiums nicht los: „Können Maschinen wirklich denken?“. So begann ich mich mehr für künstliche Intelligenz zu interessieren. Je mehr ich mich jedoch mit der Thematik beschäftigte, desto spezifischer wurden meine Fragen. Ich denke, es ist nicht nur wichtig, die Vorteile zu verstehen, sondern auch die Grenzen von KI zu kennen und zu wissen, wie man sie überwinden kann. Um beispielsweise festzustellen, ob ein Baby an Asphyxie leidet, eine der häufigsten Todesursachen bei Neugeborenen, setzt das afrikanische Unternehmen Ubenwa KI ein. Hier zeigt KI deutliche Vorteile auf, indem sie bei der Rettung Neugeborener helfen kann. Betrachtet man sich zum Beispiel Sprachmodelle, die bei der Anwendung auf afrikanische Sprache versagen, weil diese Sprachen im Trainingsfeld des Modells nicht vorhanden sind, werden die Nachteile sichtbar. Deshalb sollten Afrikaner:innen bei der Entwicklung von KI-Werkzeugen, die ihrer Gesellschaft zugutekommen, an vorderster Front stehen. Dazu müssen wir unsere Fähigkeiten und unser Wissen über diese Sprachen ausbauen. Wenn wir das nicht tun, sind wir im Nachteil. Ich bin jemand, dem Bildung, technologischer Fortschritt und die Entwicklung meines Ökosystems sehr am Herzen liegen. Nichts anderes erscheint mir wichtiger als die Vorbereitung der Afrikaner:innen auf die Zukunft des maschinellen Lernens und der künstlichen Intelligenz und die Nutzung dieser Werkzeuge zur Lösung vieler unserer lokalen Probleme.

Diese Beschränkungen aktueller KI-Systeme frustrieren, sind jedoch gleichzeitig der Antrieb für meine Motivation, an der Schnittstelle von maschinellem Lernen, Datenschutz und Sicherheit zu arbeiten. Wir müssen KI-Werkzeuge entwickeln, die jeden vor dem Schaden schützen, den andere Werkzeuge verbreiten. Wir müssen sie besser verstehen und eine bessere Erwartungshaltung dafür entwickeln, was KI tun kann und was nicht. Meine Arbeit hier bei CISPA ist von zentraler Bedeutung für die Bewältigung dieser Probleme.

Hast du schon Pläne für die Zeit nach deinem PhD?

Ich hoffe, dass ich nach meinem PhD als Forschungswissenschaftlerin tätig sein kann. Mein Ziel wäre weiterhin an Forschungsprojekten zu arbeiten, die Datenschutz, Sicherheit und maschinelles Lernen beinhalten und sozialbewusste KI-Werkzeuge bauen. Letzten Sommer war ich im Rahmen eines Stipendienprogramms, namens „Data Science for Social Good“, an der Carnegie Mellon Universität, wo ich daran arbeitete, das Anrufweiterleitungssystem für Notrufe zu verbessern. So können Menschen, die sich in einer psychischen Krise befinden, rechtzeitig Hilfe bekommen. Ich hoffe, dass ich weiterhin an sozialen Projekten arbeiten und Tools entwickeln kann, die der Gesellschaft zugutekommen. Ich bin sehr daran interessiert, unsere Gesellschaft durch Wissenschaft zu verbessern und voranzutreiben. Damit uns künstliche Intelligenz nützt und nicht schadet.

Welchen Rat würdest du Interessenten für KI-Forschung geben, aber vielleicht noch zögert den nächsten Schritt zu gehen?

Ich stecke selbst noch im Lernprozess, aber einen generellen Rat, kann ich geben: Teste Dinge aus. Wiederhole nicht die Meinung anderer, bilde deine eigene Meinung über existierende Probleme und Fragestellungen. Herausforderungen gibt es in jedem Bereich, aber während du wächst, lernst du. Sei geduldig mit dir selbst und vertraue deiner Brillanz. Viele Dinge brauchen Zeit und um meine Kollegin Sahar zu zitieren: Fortschritt ist nicht linear. Es ist okay, wenn du es jetzt noch nicht verstehst, bleib dran. Mit der Zeit wirst du es verstehen. Du wirst hinfallen, du wirst stolpern; aber versuch auszustehen und verfolge weiterhin deinen Weg. Versuch es weiter – ich drücke dir die Daumen.

Mehr Details zu den Projekten sind auf diesen Websites zu finden:

SautiProject: sautiproject.com

AISaturdays Lagos: https://github.com/AISaturdaysLagos/cohort7_structure

SheCodeAfrica: https://shecodeafrica.org/about