E-mail senden E-Mail Adresse kopieren

E-Mail

Adresse

Im Oberen Werk 1
66386 St. Ingbert (Germany)

Awards (Auswahl)

2022: Busy Beaver Award für "Privacy of Machine Learning"

2019: Best paper award at NDSS 

Kurzbiografie

Dr. Yang Zhang ist Faculty am CISPA. Seine Forschung konzentriert sich auf Trustworthy Machine Learning (Privacy, Safety und Security). Außerdem arbeitet er an der Messung und dem Verständnis von Fehlinformationen und unsicheren Inhalten wie hasserfüllten Memes im Internet. Im Laufe der Jahre hat er zahlreiche Paper auf Spitzenkonferenzen in Informatik, einschließlich CCS, NDSS, Oakland und USENIX Security veröffentlicht. Seine Arbeit hat 2019 den NDSS Distinguished Paper Award und 2022 den CCS Best Paper Award Runner-up erhalten. 

CV: Letzte Stationen

Seit 2020
Faculty am CISPA Helmholtz-Zentrum für Informationssicherheit
2019 - 2020
Forschungsgruppenleiter am CISPA Helmholtz-Zentrum für Informationssicherheit
2017 - 2018
Postdoctoral Researcher - Host: Michael Backes - CISPA, Universität des Saarlandes
2012 - 2016
Ph.D. in Computer Science an der Universität in Luxembourg, highest honor

Veröffentlichungen von Yang Zhang

Jahr 2026

Konferenz / Medium

IEEE Conference on Computer Vision and Pattern Recognition (CVPR)
When Understanding Becomes a Risk: Authenticity and Safety Risks in the Emerging Image Generation Paradigm

Konferenz / Medium

European Association for Computational Linguistics (EACL)
Defeating Cerberus: Privacy-Leakage Mitigation in Vision Language Models

Artikel

IEEE Transactions on Dependable and Secure Computing Backdoor Complications: A Comprehensive Analysis and Mitigation of the Unforeseen Consequences of Backdoor Attacks

Konferenz / Medium

National Conference of the American Association for Artificial Intelligence (AAAI)
SL-CBM: Enhancing Concept Bottleneck Models with Semantic Locality for Better Interpretability

Jahr 2025

Konferenz / Medium

Conference on Neural Information Processing Systems (NeurIPS)
Adjacent Words, Divergent Intents: Jailbreaking Large Language Models via Task Concurrency

Konferenz / Medium

Conference on Neural Information Processing Systems (NeurIPS)
Finding and Reactivating Post-Trained LLMs’ Hidden Safety Mechanisms

Konferenz / Medium

Conference on Empirical Methods in Natural Language Processing (EMNLP)
Breaking Agents: Compromising Autonomous LLM Agents Through Malfunction Amplification

Konferenz / Medium

IEEE International Conference on Computer Vision (ICCV)
Hate in Plain Sight: On the Risks of Moderating AI-Generated Hateful Illusions

Konferenz / Medium

ACM Conference on Computer and Communications Security (CCS)
UnsafeBench: Benchmarking Image Safety Classifiers onReal-World and AI-Generated Images

Artikel

IEEE Transactions on Dependable and Secure Computing Revealing the Risk of Hyper-parameter Leakage in Deep Reinforcement Learning Models