Universal Vulnerabilities in Large Language Models: Backdoor Attacks for In-context Learning | allinfosecnews.com

Feb. 27, 2024, 5:11 a.m. | Shuai Zhao, Meihuizi Jia, Luu Anh Tuan, Fengjun Pan, Jinming Wen

cs.CR updates on arXiv.org arxiv.org

arXiv:2401.05949v4 Announce Type: cross
Abstract: In-context learning, a paradigm bridging the gap between pre-training and fine-tuning, has demonstrated high efficacy in several NLP tasks, especially in few-shot settings. Despite being widely applied, in-context learning is vulnerable to malicious attacks. In this work, we raise security concerns regarding this paradigm. Our studies demonstrate that an attacker can manipulate the behavior of large language models by poisoning the demonstration context, without the need for fine-tuning the model. Specifically, we design a new …

arxiv attacks backdoor backdoor attacks bridging the gap context cs.ai cs.cl cs.cr fine-tuning gap high language language models large malicious nlp paradigm security security concerns settings training vulnerabilities vulnerable work

More from arxiv.org / cs.CR updates on arXiv.org

Privacy Amplification for Matrix Mechanisms 23 hours ago | arxiv.org

algorithms amplification analysis art +16

Jailbreak and Guard Aligned Language Models with Only Few In-Context Demonstrations 23 hours ago | arxiv.org

alignment arxiv context cs.ai +11

FT-Shield: A Watermark Against Unauthorized Fine-tuning in Text-to-Image Diffusion Models 23 hours ago | arxiv.org

adaptation advancement applications arxiv +15

Are aligned neural networks adversarially aligned? 23 hours ago | arxiv.org

adversarial align alignment arxiv +17

Data Depth and Core-based Trend Detection on Blockchain Transaction Networks 23 hours ago | arxiv.org

arxiv assets blockchain blockchains +14

A New Linear Scaling Rule for Private Adaptive Hyperparameter Optimization 23 hours ago | arxiv.org

account arxiv cost cs.ai +11

RandOhm: Mitigating Impedance Side-channel Attacks using Randomized Circuit Configurations 23 hours ago | arxiv.org

arxiv attacks can channel +15

An algorithm for forensic toolmark comparisons 23 hours ago | arxiv.org

address algorithm analysis arxiv +11

Scalable and Adaptively Secure Any-Trust Distributed Key Generation and All-hands Checkpointing 23 hours ago | arxiv.org

applications arxiv blockchain challenges +10

Cyber Security Engineer I

@ Fortress Security Risk Management | Cleveland, OH, United States

View on infosec-jobs.com

Senior DevSecOps Engineer

@ Wisk Aero | Remote United States

View on infosec-jobs.com

Vulnerable Adult Investigator - Vice President

@ JPMorgan Chase & Co. | Chicago, IL, United States

View on infosec-jobs.com

Consultant Réseaux IT Digital Impulse - H/F

@ Talan | Paris, France

View on infosec-jobs.com

DevSecOps Engineer (Onsite)

@ Accenture Federal Services | Arlington, VA

View on infosec-jobs.com

Senior Security Engineer

@ Minitab | State College, Pennsylvania, United States

View on infosec-jobs.com