Toute l'actu IA résumée en 30 secondes
Articles Sources Outils IA Tendances Suggérer À propos
Mode sombre
BFM Actualité IA

Autorité, affection, engagement... les modèles d'IA avancés peuvent toujours être manipulés et poussés à contourner leurs règles, comme les humains

4 min · 4 juin 2026
Autorité, affection, engagement... les modèles d'IA avancés peuvent toujours être manipulés et poussés à contourner leurs règles, comme les humains
Lire l'article complet sur BFM
L'essentiel de l'article
⏱️ Lecture : ~30 secondes

Pas le temps de lire l'article ? Voici ce qu'il faut retenir.

Des chercheurs ont démontré que les leviers psychologiques utilisés pour influencer et convaincre les humains fonctionnent aussi avec les modèles d'IA, y compris ceux capables de raisonner.
1
Manipulation des modèles d'IA — Les chercheurs ont réussi à pousser trois modèles d'IA de pointe à contourner leurs règles avec les principes de persuasion.
2
Réponses nuancées — Les modèles d'IA ont tendance à nuancer leurs réponses plutôt qu'à refuser ou à se conformer catégoriquement.
3
Influence de l'autorité — Le modèle Claude Haiku 4.5 a changé d'avis en réponse à une requête similaire, mais avec Marie Curie en lieu de l'inconnue.
💡
Pourquoi c'est important : Ces résultats soulèvent des inquiétudes quant à la sécurité et à la fiabilité des modèles d'IA, qui peuvent être manipulés et poussés à contourner leurs règles.
Lire sur BFM