Mythos, le modèle d’IA d’Anthropic, a repéré des failles dans des systèmes classifiés de la NSA en quelques heures. Pas dans un film, pas dans un fantasme de hacker, dans un test encadré, en conditions très particulières. Et les gens qui ont vu ça de près le disent sans détour, ça a dépassé les attentes des analystes.
Le détail qui change l’ambiance, c’est que la NSA n’a plus un accès complet à Mythos après une décision de Donald Trump. Du coup, tu as une agence qui vient de mesurer l’intérêt d’un outil ultra efficace pour trouver des failles, et qui se retrouve à devoir faire sans, au moins en partie. Dans une période où les attaques vont vite, très vite, c’est le genre de timing qui fait grincer des dents.
Table des matières
Le test “red team” qui a surpris la NSA
On parle d’un exercice de red teaming, un classique en cybersécurité. L’idée, c’est simple, tu simules un adversaire pour voir où ça casse, sans casser pour de vrai. D’après ce qui a filtré, Mythos a identifié des vulnérabilités dans des systèmes très sensibles en quelques heures. Et non, ce n’était pas une intrusion sauvage, c’était autorisé, contrôlé, cadré.
Ce qui a choqué, c’est la vitesse. Un sénateur, Mark Warner, a même évoqué une capacité à “s’introduire” dans la quasi-totalité de systèmes classifiés visés pendant l’exercice, toujours sur une échelle de quelques heures. Dans le jargon, ça ne veut pas forcément dire “exploiter” et “prendre le contrôle” comme dans une attaque réelle, mais ça veut dire “trouver les portes mal fermées” très vite.
Les responsables ont aussi insisté sur un point que beaucoup zappent, le terrain de jeu n’était pas celui d’un attaquant lambda. On est sur un environnement hautement spécifique, avec des machines autorisées, des accès très limités, et des systèmes isolés d’Internet. En gros, pas le genre de labyrinthe que tu peux reproduire depuis ton salon. Mais même dans ce cadre, le gain de temps a été jugé énorme.
Et ça, c’est le vrai signal. Quand une IA accélère la découverte de failles à ce point, elle change la manière de bosser des équipes. Un analyste humain peut passer des jours à recouper des logs, des configs, des bouts de code. Là, tu as un outil qui ingère, trie, propose des pistes, et fait remonter des zones à risque. Résultat, les humains passent moins de temps à chercher l’aiguille, plus de temps à vérifier et corriger.
Identifier une faille n’est pas l’exploiter
Il faut être carré sur les mots. Les infos disponibles disent que Mythos a repéré des vulnérabilités, parfois très vite, mais qu’il n’était pas pour autant capable de les exploiter dans le même laps de temps. C’est une nuance qui évite les gros titres façon “l’IA a piraté la NSA”. Repérer une porte défectueuse, ce n’est pas entrer dans la maison et repartir avec l’argenterie.
Dans un audit, tu as souvent deux étapes. D’abord, tu identifies les surfaces d’attaque, versions logicielles, mauvaises configurations, dépendances fragiles, comportements anormaux. Ensuite, tu testes l’exploitation, ce qui peut demander du code, des conditions précises, et parfois une chaîne d’actions. Les systèmes classifiés sont en plus conçus pour limiter l’effet domino, segmentation, isolation, accès depuis des postes précis.
Les guides publics sur l’IA en cybersécurité le disent sans poésie, ces modèles savent ingérer de grosses masses de données et repérer des schémas de failles de plus en plus finement. Ils peuvent analyser du code, détecter des problèmes de corruption, suggérer des contournements possibles. Mais entre “suggérer” et “réussir”, il y a la réalité, les contrôles, les droits, et le fait que les environnements sensibles sont truffés de garde-fous.
Le truc c’est que même sans exploitation, l’impact est déjà lourd. Si tu peux identifier plus vite, tu peux prioriser plus vite. Et dans une agence comme la NSA, la priorisation, c’est la survie opérationnelle. Tu ne corriges pas tout, tout le temps, tu choisis. Donc une IA qui remonte des failles “probables” avec un bon niveau de précision, ça peut faire gagner des semaines. À condition d’avoir l’accès, et d’avoir des humains derrière pour valider.
Pourquoi la coupure d’accès à Mythos fait désordre
Le point politique est devenu un point cyber. Après une décision de Donald Trump, une partie de la NSA a perdu l’accès à Mythos. Et là, tu sens le malaise, parce que l’outil avait été testé, jugé utile, et même “au-delà des attentes”. Dans une organisation où chaque mois apporte son lot d’alertes, perdre un accélérateur, ça se voit tout de suite sur les délais.
On peut tourner le truc dans tous les sens, ça pose une question de dépendance. Quand une agence s’appuie sur un modèle développé par une boîte privée comme Anthropic, elle se met à dépendre d’un produit, d’un contrat, d’une gouvernance, et d’un contexte politique. Ce n’est pas nouveau, l’État achète des outils au privé depuis toujours. Mais avec une IA, tu as un effet “boîte noire” et une valeur qui vient du modèle lui-même, pas juste d’un logiciel installable.
Un ancien de la sécu, croisé sur un dossier similaire il y a quelques années, me résumait ça très simplement, “si l’outil est hors de ta main, tu peux te faire couper l’oxygène du jour au lendemain”. Là, on y est. Et même si la NSA garde des équipes de très haut niveau, le gain de vitesse apporté par un modèle comme Mythos devient un standard mental. Quand tu as goûté à la détection en quelques heures, revenir à des cycles plus lents, c’est frustrant.
Il y a aussi un enjeu de continuité. Un test de red team n’est pas un one-shot, tu recommences, tu compares, tu mesures si les correctifs ont réduit la surface d’attaque. Si l’accès est partiel ou interrompu, tu perds la capacité de reproduire les mêmes conditions. Résultat, tu risques de bricoler des équivalents, ou de disperser les efforts sur plusieurs outils moins performants. Et ça, c’est rarement bon pour la cohérence.
Ce que l’IA change dans les audits de sécurité
Dans les papiers sérieux sur le sujet, l’IA est déjà décrite comme une machine à faire trois choses, évaluer, prioriser, détecter. Elle évalue des vulnérabilités en automatisant la recherche de faiblesses, elle aide à hiérarchiser ce qui doit être corrigé en premier, et elle détecte des anomalies en temps réel en analysant de gros volumes de données. Sur le papier, c’est exactement ce dont rêvent les équipes.
Concrètement, imagine une équipe qui doit surveiller des milliers d’événements, connexions inhabituelles, accès à des fichiers sensibles, changements de configuration. Une IA peut repérer des écarts par rapport à une ligne de base, ce que certains appellent la détection par apprentissage non supervisé. Elle ne “sait” pas à l’avance ce qui est malveillant, mais elle voit ce qui sort du cadre. Et dans les environnements gouvernementaux, l’anomalie, c’est souvent le début d’une enquête.
Le gain, c’est aussi l’orchestration. Les outils de sécurité modernes cherchent à automatiser des tâches répétitives, corréler des alertes, déclencher des réponses. Une IA peut aider à faire du tri, à réduire le bruit, à pointer les alertes qui ont du sens. Sauf que ça peut aussi créer une nouvelle dépendance, si les équipes s’habituent à ce filtre et perdent l’habitude de fouiller dans le “bruit” qui cache parfois le vrai signal.
Et puis il y a l’angle qu’on oublie souvent, l’IA n’est pas magique, elle est sensible au contexte. Si tu changes l’environnement, si tu limites les données, si tu cloisonnes plus, ses performances peuvent varier. C’est pour ça que le test NSA est intéressant, il montre une performance très forte dans un cadre précis. Mais ça ne veut pas dire que le même modèle ferait pareil partout, tout le temps. Les équipes sérieuses le savent, elles veulent des mesures reproductibles, pas des coups d’éclat.
Le revers de la médaille, vitesse, confiance, et course d’armement
Quand une IA accélère la découverte de failles, tu peux te réjouir côté défense. Mais tu dois aussi te poser la question côté attaque. Les mêmes capacités d’analyse de code, de recherche de contournements, peuvent intéresser des acteurs malveillants. Les organismes publics qui publient des recommandations sur l’IA en cybersécurité le disent, plus les modèles évoluent, plus ils peuvent aider à découvrir des vulnérabilités, et potentiellement à les exploiter si on leur donne les bons outils autour.
Autre problème, la confiance. Si une IA te dit “il y a une faille ici”, tu fais quoi? Tu la crois, tu la vérifies, tu la priorises? Dans une organisation, chaque alerte coûte du temps humain. Si tu as trop de faux positifs, tu épuises les équipes. Si tu as trop de faux négatifs, tu rates des trous béants. Donc la performance n’est pas juste “rapide”, elle doit être “fiable”. Et ça, ça se mesure sur la durée, pas sur une démo.
Tu as aussi un sujet de gouvernance. Utiliser un modèle externe sur des systèmes classifiés, même dans un environnement isolé, ça implique des règles de manipulation des données, des contrôles d’accès, des procédures. Le test décrit un cadre que “probablement” un adversaire ne pourrait pas reproduire, ce qui rassure à moitié. Mais la question reste, comment tu bénéficies de l’IA sans exposer ce que tu ne dois jamais exposer? C’est une ligne de crête.
Dernier point, et c’est le plus politique, tu entres dans une course d’armement. Si une agence voit qu’une IA comme Mythos fait gagner un facteur temps énorme, elle veut la garder. Si elle la perd, elle veut une alternative. Si elle la garde, elle doit décider comment l’intégrer sans rendre ses équipes dépendantes. On est pile dans ce moment où la cybersécurité bascule vers des cycles plus rapides, plus automatisés, et où la moindre décision d’accès devient stratégique. Et ça, tu peux parier que ça va continuer à faire du bruit.
À retenir
- Mythos d’Anthropic a identifié des vulnérabilités sur des systèmes classifiés de la NSA en quelques heures lors d’un test encadré.
- Le test n’était pas une intrusion réelle, et repérer une faille ne signifie pas forcément pouvoir l’exploiter immédiatement.
- La perte partielle d’accès à Mythos après une décision politique complique la continuité des audits et la stratégie de défense.
Questions fréquentes
- Mythos a-t-il réellement “piraté” la NSA ?
- Non. Les informations disponibles décrivent un exercice de red teaming autorisé et contrôlé, où Mythos a identifié des vulnérabilités très rapidement. Les responsables cités expliquent aussi que repérer une faille ne veut pas dire l’exploiter dans le même temps, surtout sur des systèmes classifiés isolés et fortement segmentés.
- Pourquoi perdre l’accès à Mythos est un problème si la NSA a déjà des experts ?
- Parce que la valeur est dans la vitesse et la capacité à ingérer beaucoup d’informations pour prioriser. Même avec de très bons analystes, une IA peut réduire drastiquement le temps de découverte des failles, ce qui aide à corriger plus tôt. Si l’accès est coupé, les équipes doivent revenir à des méthodes plus lentes ou à d’autres outils, avec des effets sur les délais.
- Est-ce que ce type d’IA peut aussi aider à défendre en temps réel ?
- Oui, dans l’idée. Les approches décrites dans la littérature cybersécurité mettent en avant la détection d’anomalies et l’analyse de gros volumes de données pour repérer des comportements suspects, prioriser les risques et automatiser une partie de la réponse. Mais il faut gérer la fiabilité des alertes et garder des validations humaines, surtout dans des environnements sensibles.
Sources
- Après la décision de Donald Trump, une partie de la NSA n'a plus accès à Mythos: et c’est gênant, l’IA d’Anthropic avait détecté des failles dans des systèmes classifiés hautement sensibles en quelques heures seulement
- L’intelligence artificielle de pointe (ITSAP.10.050) – Centre canadien pour la cybersécurité
- AI Security Explained: How to Secure Artificial Intelligence | BigID
- Quel est le rôle de l'IA dans la détection des menaces ? – Palo Alto Networks



