Faculty

Yang Zhang

Forschungsgruppe

AI Security and Privacy Internet Safety Machine Learning Vertrauenswürdige Informationsverarbeitung Privacy Social Network Analysis

E-Mail

Adresse

Im Oberen Werk 1
66386 St. Ingbert (Germany)

Awards (Auswahl)

2022: Busy Beaver Award für "Privacy of Machine Learning"

2019: Best paper award at NDSS

Weitere Informationen

Kurzbiografie

Dr. Yang Zhang ist Faculty am CISPA. Seine Forschung konzentriert sich auf Trustworthy Machine Learning (Privacy, Safety und Security). Außerdem arbeitet er an der Messung und dem Verständnis von Fehlinformationen und unsicheren Inhalten wie hasserfüllten Memes im Internet. Im Laufe der Jahre hat er zahlreiche Paper auf Spitzenkonferenzen in Informatik, einschließlich CCS, NDSS, Oakland und USENIX Security veröffentlicht. Seine Arbeit hat 2019 den NDSS Distinguished Paper Award und 2022 den CCS Best Paper Award Runner-up erhalten.

CV: Letzte Stationen

Seit 2020: Faculty am CISPA Helmholtz-Zentrum für Informationssicherheit
2019 - 2020: Forschungsgruppenleiter am CISPA Helmholtz-Zentrum für Informationssicherheit
2017 - 2018: Postdoctoral Researcher - Host: Michael Backes - CISPA, Universität des Saarlandes
2012 - 2016: Ph.D. in Computer Science an der Universität in Luxembourg, highest honor

Download Lebenslauf

Veröffentlichungen von Yang Zhang

Jahr 2026

2026-03-24

Defeating Cerberus: Privacy-Leakage Mitigation in Vision Language Models

Konferenz / Medium

European Association for Computational Linguistics (EACL)

Tags

Vertrauenswürdige Informationsverarbeitung

Autor:innen

Boyang Zhang
Istemi Ekin Akkus
Ruichuan Chen
Alice Dethise
Klaus Satzke
Ivica Rimac
Yang Zhang

Zum Paper Detail-Seite besuchen

2026-01-28

Backdoor Complications: A Comprehensive Analysis and Mitigation of the Unforeseen Consequences of Backdoor Attacks

Artikel

IEEE Transactions on Dependable and Secure Computing

Tags

Vertrauenswürdige Informationsverarbeitung

Autor:innen

Ruiyi Zhang
Yun Shen
Hongwei Li
Wenbo Jiang
Hanxiao Chen
Yuan Zhang
Guowen Xu
Yang Zhang

Zum Paper Detail-Seite besuchen

2026-01-21

SL-CBM: Enhancing Concept Bottleneck Models with Semantic Locality for Better Interpretability

Konferenz / Medium

National Conference of the American Association for Artificial Intelligence (AAAI)

Tags

Vertrauenswürdige Informationsverarbeitung

Autor:innen

Hanwei Zhang
Luo Chen
Rui Wen
Yang Zhang
Lijun Zhang
Holger Hermanns

Zum Paper Detail-Seite besuchen

Jahr 2025

2025-12-05

Adjacent Words, Divergent Intents: Jailbreaking Large Language Models via Task Concurrency

Konferenz / Medium

Conference on Neural Information Processing Systems (NeurIPS)

Tags

Vertrauenswürdige Informationsverarbeitung

Autor:innen

Zum Paper Detail-Seite besuchen

2025-12-03

Finding and Reactivating Post-Trained LLMs’ Hidden Safety Mechanisms

Konferenz / Medium

Conference on Neural Information Processing Systems (NeurIPS)

Tags

Vertrauenswürdige Informationsverarbeitung

Autor:innen

Zum Paper Detail-Seite besuchen

2025-11-04

Breaking Agents: Compromising Autonomous LLM Agents Through Malfunction Amplification

Konferenz / Medium

Conference on Empirical Methods in Natural Language Processing (EMNLP)

Tags

Vertrauenswürdige Informationsverarbeitung

Autor:innen

Boyang Zhang
Yicong Tan
Yun Shen
Ahmed Salem
Michael Backes
Savvas Zannettou
Yang Zhang

Zum Paper Detail-Seite besuchen

2025-10-21

Hate in Plain Sight: On the Risks of Moderating AI-Generated Hateful Illusions

Konferenz / Medium

IEEE International Conference on Computer Vision (ICCV)

Tags

Vertrauenswürdige Informationsverarbeitung

Autor:innen

Zum Paper Detail-Seite besuchen

2025-10-15

UnsafeBench: Benchmarking Image Safety Classifiers onReal-World and AI-Generated Images

Konferenz / Medium

ACM Conference on Computer and Communications Security (CCS)

Tags

Vertrauenswürdige Informationsverarbeitung

Autor:innen

Zum Paper Detail-Seite besuchen

2025-10-06

Revealing the Risk of Hyper-parameter Leakage in Deep Reinforcement Learning Models

Artikel

IEEE Transactions on Dependable and Secure Computing

Tags

Vertrauenswürdige Informationsverarbeitung

Autor:innen

Linkang Du
Zhikun Zhang
Min Chen
Mingyang Sun
Shouling Ji
Peng Cheng
Jiming Chen
Michael Backes
Yang Zhang

Zum Paper Detail-Seite besuchen

2025-08-14

Synthetic Artifact Auditing: Tracing LLM-Generated Synthetic Data Usage in Downstream Applications

Konferenz / Medium

Usenix Security Symposium (USENIX-Security)

Tags

Autor:innen

Zum Paper Detail-Seite besuchen