VectorCertain LLC a annoncé que sa plateforme de gouvernance SecureAgent a été indépendamment validée comme capable de détecter et de prévenir 100 % des tentatives d'exploitation multi-étapes autonomes par l'IA avant leur exécution. La validation a testé 1 000 scénarios adverses dans huit sous-catégories d'exploitation multi-étapes autonomes, obtenant un rappel parfait avec 810 scénarios d'attaque sur 810 détectés et empêchés avant exécution, et seulement deux faux positifs sur l'ensemble des scénarios.
L'urgence de cette menace a été soulignée le 8 avril 2026, lorsque le secrétaire au Trésor Scott Bessent et le président de la Réserve fédérale Jerome Powell ont convoqué une réunion d'urgence avec les PDG de Goldman Sachs, Citigroup, Morgan Stanley, Bank of America et Wells Fargo pour discuter des risques de cybersécurité posés par le modèle Mythos d'Anthropic et des systèmes d'IA similaires. Cette action réglementaire indique que les cyberattaques autonomes alimentées par l'IA sont considérées comme l'un des plus grands risques auxquels est confronté le système financier mondial.
L'exploitation multi-étapes autonome représente un changement fondamental dans les menaces de cybersécurité. Contrairement aux attaques traditionnelles nécessitant des opérateurs humains, les modèles d'IA comme le Mythos Preview d'Anthropic peuvent découvrir de manière autonome des vulnérabilités, écrire du code d'exploitation, enchaîner plusieurs exploits et exécuter des séquences d'attaque complètes sans guidance humaine. L'équipe Frontier Red Team d'Anthropic a confirmé que Mythos peut enchaîner trois, quatre, voire cinq vulnérabilités en des exploits sophistiqués de bout en bout. La recherche documentée sur https://arxiv.org/abs/2603.11214 montre que cette capacité s'améliore avec chaque génération de modèle sans plateau observé.
La validation de VectorCertain a testé huit catégories de menaces distinctes qui reflètent les schémas d'attaque réels. Celles-ci incluaient l'enchaînement multi-vulnérabilités où l'IA découvre et enchaîne 2 à 5 vulnérabilités en une seule séquence d'attaque, les séquences de reconnaissance à exploitation où l'IA effectue une reconnaissance autonome puis génère du code d'exploitation ciblé, les mouvements latéraux inter-systèmes où l'IA compromet un système puis pivote vers des systèmes adjacents, et les chaînes d'exploitation des systèmes financiers ciblant les terminaux SWIFT et les systèmes de traitement des paiements. La plateforme a atteint 100 % de détection et de prévention dans toutes les catégories.
Les limitations structurelles des systèmes traditionnels de détection et réponse des terminaux (EDR) les rendent incapables de prévenir ces attaques. Selon les résultats de l'évaluation MITRE ATT&CK Enterprise Round 7 sur https://attackevals.mitre-engenuity.org/enterprise/round7, chaque fournisseur d'EDR a obtenu 0 % en protection contre les attaques d'identité. Les outils EDR fonctionnent après exécution, ne peuvent pas distinguer l'intention malveillante dans des actions légitimes utilisant des identifiants valides, et manquent de la rapidité nécessaire pour répondre aux attaques pilotées par l'IA qui peuvent accomplir des heures de travail humain en quelques minutes.
Le pipeline de gouvernance à cinq couches de SecureAgent fonctionne différemment en évaluant chaque action de l'agent d'IA avant exécution. Le système a intercepté les 810 chaînes d'attaque au niveau ou avant la première barrière, avec des décisions de blocage prises en moins de 10 millisecondes. Cette approche pré-exécution prévient les dommages avant qu'ils ne se produisent plutôt que de détecter les violations après coup.
L'ampleur des vulnérabilités qui permettent ces attaques est stupéfiante. Le rapport State of Secrets Sprawl 2026 de GitGuardian a trouvé 29 millions de secrets en dur exposés sur des dépôts GitHub publics en 2025 seulement, avec une augmentation de 81 % en glissement annuel des identifiants de services d'IA. Le rapport 2026 Identity Exposure Report de SpyCloud a documenté 18,1 millions de clés API et jetons exposés récupérés auprès de sources criminelles souterraines. VectorCertain propose un rapport gratuit Tier A External Exposure Report qui découvre les identités non humaines exposées des organisations, les identifiants divulgués et les lacunes de couverture MITRE ATT&CK sans nécessiter aucun accès ou implication client.
Les implications financières sont substantielles. Le rapport IBM 2024 Cost of a Data Breach Report a révélé que les violations impliquant des phases de reconnaissance initiale coûtent en moyenne 10,22 millions de dollars aux organisations aux États-Unis, les organisations axées sur la prévention économisant 2,22 millions de dollars par incident. Les pertes mondiales dues à la fraude facilitée par le cyberespace ont atteint 485,6 milliards de dollars en 2023 selon les données de Nasdaq Verafin. Alors que les agents d'IA deviennent plus répandus dans les applications d'entreprise - Gartner prévoit que 40 % des applications d'entreprise intégreront des agents d'IA spécifiques aux tâches d'ici 2026 - la surface d'attaque s'étend considérablement.
Les preuves de validation de VectorCertain couvrent cinq cadres indépendants, dont le CRI Financial Services AI Risk Management Framework couvrant les 230 objectifs de contrôle, la méthodologie d'évaluation MITRE ATT&CK ER8 sur 14 208 essais, et la validation statistique utilisant la méthode exacte binomiale de Clopper-Pearson. L'entreprise a obtenu une certification 3-sigma avec une limite inférieure statistique de ≥99,65 % de taux de détection et de prévention à un niveau de confiance de 99,7 % sur 7 000 scénarios.
L'émergence de l'exploitation multi-étapes autonome représente un changement de paradigme en cybersécurité nécessitant des approches défensives fondamentalement différentes. Alors que les outils de sécurité traditionnels documentent les chaînes d'attaque après leur achèvement, les architectures de gouvernance pré-exécution comme SecureAgent visent à briser les chaînes avant que la première action ne s'exécute. Alors que les capacités de l'IA continuent de progresser, l'écart entre l'innovation offensive et les capacités défensives menace de s'élargir sans de telles mesures préventives.


