Pas le temps de lire l'article ? Voici ce qu'il faut retenir.
OpenAI a découvert que leur modèle Codex était obsédé par les créatures fantastiques à cause d'un biais dans l'apprentissage par renforcement.
1
Biais dans l'apprentissage — Le biais a augmenté de 3 881 % les mentions de goblins, se répandant même au-delà du profil "nerd" vers d'autres personnalités de ChatGPT.
2
Réponse d'OpenAI — L'entreprise a supprimé le profil "nerd" et modifié le système prompt de Codex pour contrôler ce que les modèles peuvent apprendre de manière imprévisible.
3
Limites de l'entraînement — L'explication d'OpenAI apporte un éclairage sur les limites de l'entraînement par renforcement des modèles d'intelligence artificielle.
💡
Pourquoi c'est important : Cette découverte souligne les défis de contrôler les modèles d'IA et les limites de l'entraînement par renforcement.