Was ist ein Sportwagen ohne Benzin? Ziemlich nutzlos – genau wie Machine Learning Modelle ohne Daten, sagt CISPA-Forscher Antoni Kowalczuk. Deshalb durchkämmen KI-Modelle das Internet nach möglichst viel Trainingsdaten, Bilder und Fotos im Falle von Bildgenerierungs-Modellen. Und nehmen’s dabei (angeblich) nicht immer so genau mit dem Urheberrecht. Aber wie findet man eigentlich heraus, ob urheberrechtlich geschütztes oder sogar sensibles Material in so einem Modell gelandet ist? Genau daran forscht Antoni – und zeigt, dass es dabei nicht nur ums Urheberrecht geht, sondern auch um ernsthafte Datenschutzprobleme.