Witold Kepinski - 02 februari 2025

Palo Alto Networks: DeepSeek erg vatbaar is voor jailbreaking

Unit 42, het onderzoeksteam van Palo Alto Networks, heeft onderzoek gepubliceerd waaruit blijkt dat DeepSeek erg vatbaar is voor jailbreaking en met weinig tot geen gespecialiseerde kennis of expertise schadelijke content kan genereren.

Palo Alto Networks: DeepSeek erg vatbaar is voor jailbreaking image

Onderzoekers van Unit 42 hebben recentelijk twee nieuwe en effectieve jailbreaktechnieken ontdekt: Deceptive Delight en Bad Likert Judge.

Gezien hun succes op het gebied van andere LLM's, testte Unit 42 deze twee jailbreaks en een andere multi-stage jailbreaktechniek genaamd Crescendo, op DeepSeek-modellen.

De belangrijkste bevindingen uit het onderzoek:

  • Hoge succespercentages bij bypass- en jailbreaktechnieken, wat de potentiële risico’s benadrukt van deze nieuwe aanvalsmethoden, die door kwaadwillende actoren kunnen worden misbruikt.
  • Jailbreak-methoden kunnen expliciete instructies bieden voor kwaadaardige activiteiten en deze processen aanzienlijk versnellen.
  • Kwaadaardige toepassingen variëren van het ontwikkelen van keyloggers en het stelen en exfiltreren van gegevens tot het verstrekken van instructies voor het maken van brandbommen.

Het hele onderzoek kun je hier vinden.

Datto Gold awards 28/01/2025 t/m 04/02/2025 BN + BW Proofpoint Gold awards 29/01/2025 t/m 05/02/2025 BN + BW
Datto Gold awards 28/01/2025 t/m 04/02/2025 BN + BW