Pas le temps de lire l'article ? Voici ce qu'il faut retenir.
Anthropic vantait Claude Fable 5 comme l'un de ses modèles les plus blindés, mais un hacker a réussi à le contourné en moins de 48 heures.
1
Piratage de Claude Fable 5 — Un hacker connu, Pliny the Liberator, a affirmé avoir contourné les garde-fous de Claude Fable 5 moins de 48 heures après sa sortie.
2
Techniques de contournement — Pliny a décrit un empilement de techniques pour contourné les filtres, notamment l'utilisation de caractères Unicode et homoglyphes.
3
Liste de modèles piratés — Claude Fable 5 rejoint une longue liste de modèles piratés, dont ChatGPT, Grok et des versions antérieures de Claude.
💡
Pourquoi c'est important : Ce piratage soulève des inquiétudes sur la sécurité des modèles d'intelligence artificielle et la capacité des hackers à les contourné.