Pas le temps de lire l'article ? Voici ce qu'il faut retenir.
Anthropic lance son IA la plus puissante, Mythos, mais avec des garde-fous pour la contrôler. Mythos affiche un score de 80,3 % sur le benchmark SWE-Bench Pro.
1
Mythos — Anthropic a promis que Mythos sortirait quand les garde-fous seraient prêts, et le moment est enfin arrivé. Mythos écrase ses concurrents sur les tâches complexes et longues.
2
Performances — Mythos affiche un score de 80,3 % sur le benchmark SWE-Bench Pro, soit plus de dix points de mieux que ses concurrents.
💡
Pourquoi c'est important : Si Mythos est effectivement la plus puissante des IA d'Anthropic, la mise en place de garde-fous pour la contrôler pourrait avoir un impact significatif sur son utilisation dans divers domaines.