regulationPublié le 14 juin 20264 min de lecture

Anthropic : ses avertissements de sécurité lui ont coûté cher

Le gouvernement américain a ordonné à Anthropic de désactiver Claude Mythos 5 et Claude Fable 5, ses deux modèles les plus puissants, invoquant des risques de sécurité nationale.

Anthropic حذرات من الأمان ديالها، والحكومة الأمريكية غلقات نماذجها الأقوى

Le gouvernement coupe l'accès aux modèles phares d'Anthropic

Le gouvernement américain a ordonné vendredi à Anthropic de désactiver immédiatement l'accès à deux de ses modèles d'IA les plus puissants : Claude Fable 5 et Claude Mythos 5. L'entreprise a annoncé sur X qu'elle s'était conformée à cette directive, mais elle conteste vivement la décision.

L'ordre, reçu vendredi à 17h21 ET, force Anthropic à désactiver les deux modèles pour tous les utilisateurs mondiaux — pas seulement les ressortissants étrangers que visait nominalement le décret d'export control. Les autres modèles d'Anthropic restent accessibles.

Mythos : le modèle qui a attiré l'attention du gouvernement

Mythos est le modèle d'IA le plus performant d'Anthropic. L'entreprise l'a présenté en début avril et l'a maintenu sous strict contrôle depuis, en raison de sa capacité exceptionnelle à identifier les failles de sécurité dans les logiciels. Selon Anthropic, Mythos a détecté des vulnérabilités dans tous les systèmes d'exploitation et navigateurs web testés.

Plutôt que de le diffuser largement, Anthropic a lancé un programme contrôlé appelé Project Glasswing, le partageant avec environ 50 organisations vérifiées — dont Amazon, Apple, Google, Microsoft et CrowdStrike — pour des travaux de cybersécurité défensive.

Fable 5 : la version « grand public » de Mythos

Fable 5, lancé il y a trois jours seulement, était la réponse commerciale d'Anthropic à la pression du marché. Il s'agit d'une version de Mythos équipée de garde-fous qui bloquent les réponses dans les domaines à haut risque — cybersécurité, biologie — la rendant suffisamment sûre pour une diffusion générale, selon l'entreprise.

Selon les tests de benchmark de Vals AI, Fable 5 était immédiatement le modèle d'IA le plus performant disponible au public.

Le vrai problème : une faille de sécurité présumée

Le décret gouvernemental est présenté comme une mesure d'export control, restreignant l'accès des ressortissants étrangers. Mais dans un long article de blog, Anthropic explique que la préoccupation réelle serait une faille de sécurité présumée de Fable 5.

Jusqu'à présent, le gouvernement n'a fourni que des preuves verbales d'une « faille potentielle étroite et non universelle » — qui, selon Anthropic, revient à inciter le modèle à lire une base de code spécifique et identifier des flaws. Anthropic ajoute que ce « niveau de capacité » est déjà largement disponible dans d'autres modèles accessibles au public, notamment GPT-5.5 d'OpenAI, et qu'il est utilisé régulièrement par les professionnels de la cybersécurité à des fins défensives.

Les protections d'Anthropic restent intactes

Anthropic soutient que ses protections les plus fortes fonctionnent par des systèmes de classification indépendants, séparés du modèle lui-même. Même si quelqu'un convainc Fable de continuer à répondre après un refus, les protections sous-jacentes contre les résultats les plus dangereux restent en place.

L'entreprise note également qu'un examen de l'utilisation récente n'a trouvé aucune preuve que ces protections aient été contournées avec succès pour produire du contenu réellement nuisible.

Anthropic conteste la décision

Rien de tout cela n'a suffi à arrêter le gouvernement, et Anthropic ne cache pas sa frustration. « Nous ne sommes pas d'accord pour qu'une faille potentielle étroite justifie le rappel d'un modèle commercial déployé auprès de centaines de millions de personnes », a écrit l'entreprise. « Si cette norme était appliquée à l'ensemble de l'industrie, nous croyons qu'elle arrêterait essentiellement tous les nouveaux déploiements de modèles pour tous les fournisseurs de modèles de frontier.

L'ironie d'une stratégie de sécurité retournée contre Anthropic

Anthropic prépare largement son IPO cette année et a fondé son identité publique sur la prudence en matière de sécurité. L'ironie n'échappe à personne : la même prudence qu'Anthropic a affichée en restreignant Mythos — qu'elle a présenté comme un modèle trop dangereux pour être diffusé publiquement — a apparemment attiré exactement le type de scrutin gouvernemental qui pourrait perturber son activité le plus.

Sam Altman d'OpenAI doit apprécier cette situation. En avril, il a déclaré au podcasteur Ashlee Vance que la gestion de Mythos par Anthropic relevait du « marketing basé sur la peur ». « C'est clairement un excellent marketing de dire : 'Nous avons construit une bombe. Nous étions sur le point de la lâcher sur votre tête. Nous vous vendrons un abri anti-bombe pour 100 millions de dollars' », a dit Altman.

Altman, dont l'entreprise prépare également une IPO imminente, n'avait pas prédit un arrêt gouvernemental. Mais il a identifié quelque chose qui revient maintenant mordre Anthropic : quand on passe des mois à dire au monde que votre IA est uniquement dangereuse, le monde — y compris le gouvernement américain — tend à vous écouter.