Généré par IA·En savoir plus
© Deutsche Welle
IA & Tech·-3 h

Anthropic lance Claude Fable 5, son modèle le plus performant, avec un système de sécurité automatique qui détourne les requêtes à haut risque

Claude Fable 5, l'IA la plus performante jamais proposée au grand public par Anthropic, a été lancée mardi avec un système de redirection automatique qui bascule vers un modèle plus sûr lorsque les utilisateurs explorent des sujets liés à la cybersécurité ou à la biologie.

Publication publique d'un modèle puissant sous restrictions

Anthropic a rendu Claude Fable 5 accessible au grand public mardi 9 juin, marquant la première fois qu'un modèle de sa classe avancée Mythos est mis à la disposition du public. La gamme Mythos avait été dévoilée en avril mais maintenue confidentielle en raison de sa capacité à repérer des vulnérabilités cybernétiques dans des infrastructures critiques (plateformes bancaires et réseaux électriques) qui échappent à la détection humaine. La même semaine, Anthropic avait publié un document appelant les grands laboratoires à envisager un ralentissement coordonné de l'IA, qualifiant la possibilité de « ralentir ou suspendre temporairement » le progrès mondial de « probablement une bonne chose ».

Lancer un modèle aussi puissant comporte des risques. Sans protections, les capacités de Fable 5 dans des domaines comme la cybersécurité pourraient être détournées pour causer des dommages graves.

Anthropic

Fonctionnement du filtre de sécurité

Fable 5 intègre ce que l'entreprise décrit comme un système à « double voie » ou de « contrôle aérien ». Lorsque la requête d'un utilisateur entre dans une zone à haut risque prédéfinie (la cybersécurité et la biologie sont les deux domaines les plus protégés), le modèle ne répond pas directement. La demande est alors transférée à Claude Opus 4.8, un modèle moins performant mais plus sûr. Anthropic affirme que cette approche, une extension de son cadre d'IA constitutionnelle, permet au modèle de fonctionner à pleine puissance pour la plupart des tâches tout en limitant les réponses sur les sujets sensibles. Le risque est double : exploitation automatisée des vulnérabilités logicielles et mauvais usage dans les sciences du vivant.

Benchmark SWE-Bench Pro : Claude Fable 5 vs modèle précédent · %
Claude Fable 5
80.3 %
Claude Opus 4.8
69.2 %

Saut de performance par rapport aux modèles précédents

Les benchmarks montrent un bond générationnel. Sur SWE-Bench Pro, qui mesure la programmation autonome, Fable 5 a obtenu 80,3 % contre 69,2 % pour le meilleur modèle public précédent, Claude Opus 4.8, l'écart se creusant sur les tâches plus longues et complexes. La société d'analyse Hex a rapporté que Fable 5 est devenu le premier modèle à dépasser les 90 % sur un benchmark de tâches analytiques longues et complexes, soit une amélioration de dix points par rapport à la génération Opus. Anthropic affirme que le modèle « dépasse les capacités de tous les modèles que nous avons jamais mis à disposition », soulignant sa force dans l'écriture et le débogage de code, la réponse à des questions de recherche complexes et l'analyse d'images.

Fable 5 dépasse les capacités de tous les modèles que nous avons jamais mis à disposition.

Anthropic

Voies séparées : Fable pour tous, Mythos pour les partenaires

Parallèlement à la publication publique, Anthropic propose une version sans restriction appelée Claude Mythos 5 aux organisations ayant déjà accès à la classe Mythos. Il s'agit principalement de partenaires en cybersécurité inscrits au Projet Glasswing, une initiative lancée en avril 2026 visant à utiliser l'IA avancée pour protéger les logiciels et les infrastructures critiques. Début juin, le nombre de membres est passé à environ 200 organisations dans plus de 15 pays. Le gouvernement américain, qui était en conflit juridique avec l'entreprise, a également testé le modèle en raison de préoccupations de sécurité et a depuis conclu un accord avec la Maison-Blanche sur les tests de modèles d'IA puissants.

Contradictions et inquiétudes

Le calendrier a suscité des critiques. Quelques jours avant la sortie, le document public d'Anthropic appelait à un ralentissement à l'échelle de l'industrie, avertissant que les modèles de pointe pourraient bientôt commencer à s'améliorer sans supervision humaine. La publication d'un modèle de la classe même Mythos qui avait suscité ces craintes a conduit certains observateurs à remettre en question la cohérence de l'entreprise. Plus tôt, lors de l'annonce du Projet Glasswing, des critiques avaient accusé Anthropic d'exagérer la menace cybernétique comme tactique marketing. L'entreprise maintient que les garde-fous de Fable 5 le rendent sûr pour une utilisation de masse, tandis que le Mythos 5 sans restriction reste strictement contrôlé.

San Francisco

4 sources

Recevoir Pollar Weekly

La semaine en actu, chaque vendredi. Gratuit.

Gratuit. Sans traceurs, sans pub. Désinscription à tout moment.

Plus de Société & Science
Johannesburg
Paris · Budapest · Reims · Toulouse · Grenoble