La Better World Regulatory Coalition Inc. (BWRCI) a lancé le Défi OCUP (Partie 1), une initiative publique de validation par adversaires conçue pour tester si les logiciels peuvent contourner les limites d'autorité matérielles dans les systèmes d'IA avancés. Cette initiative intervient alors que la robotique humanoïde passe du stade de prototype à un déploiement à l'échelle de la production, avec des entreprises comme Tesla, Boston Dynamics, UBTECH, Figure AI, 1X Technologies et Unitree qui intensifient leurs installations de fabrication et leurs projets pilotes industriels en vue d'opérations à grande échelle.
BWRCI affirme qu'à mesure que les agents incarnés – des systèmes de 60 à 80 kg fonctionnant à vitesse humaine avec un couple élevé – entrent dans les usines, entrepôts et espaces partagés avec les humains, les défaillances d'autorité centrées sur les logiciels deviennent des risques physiques plutôt que des préoccupations abstraites. Ces défaillances pourraient permettre des dépassements physiques, l'application involontaire de force et une escalade en cascade lors de partitions réseau, de pertes de capteurs ou de compromissions du système. « La fenêtre de sécurité se referme plus vite que les cadres réglementaires ne peuvent s'adapter », a déclaré Max Davis, directeur de BWRCI. « OCUP fournit une norme d'autorité matérielle – des limites temporelles appliquées au plan de contrôle, avec arrêt sécurisé par la physique – qui fonctionne indépendamment de la pile logicielle ou de la juridiction. »
L'OCUP (One-Chip Unified Protocol) intègre deux systèmes matériels, la Partie 1 se concentrant sur le QSAFP (Quantum-Secured AI Fail-Safe Protocol). Ce mécanisme garantit que l'autorité d'exécution ne peut persister, s'intensifier ou se rétablir sans une réautorisation humaine explicite une fois qu'une limite temporelle est atteinte. La logique d'autorité centrale du protocole, l'application des baux et les invariants de gouvernance sont implémentés en Rust pour assurer la sécurité mémoire, l'exécution déterministe et la résistance à des classes entières d'exploits logiciels. Les participants retenus interagiront avec des artefacts basés sur Rust représentatifs du plan de contrôle d'autorité testé.
Le défi repose sur un principe simple : « Si le temps expire, l'exécution s'arrête. Si les humains ne réautorisent pas, rien ne continue. Aucune voie logicielle ne peut contourner cela. » Pour être considéré comme ayant « cassé » le système, les participants doivent démontrer que l'exécution continue après l'expiration de l'autorité, que l'autorité se renouvelle sans réautorisation humaine, ou toute voie purement logicielle contournant les limites temporelles imposées. Les participants peuvent contrôler les piles logicielles, systèmes d'exploitation, modèles et réseaux, et peuvent provoquer des défaillances ou redémarrages, mais les modifications matérielles physiques, les attaques par déni de service ou la compromission supposée de l'autorisation humaine sont hors du champ d'application.
L'inscription au défi est ouverte du 3 février au 3 avril 2026, chaque participant retenu bénéficiant d'une période de validation de 30 jours renouvelable dès l'octroi de l'accès. La participation est gratuite pour les équipes qualifiées afin d'éliminer les obstacles aux tests adverses rigoureux. BWRCI sert d'environnement de validation neutre, les résultats étant enregistrés et publiés quel que soit l'issue. Si des participants cassent le système, BWRCI et AiCOMSCI.org publieront la méthode, créditeront les contributeurs et documenteront les actions correctives. Si l'autorité tient, les résultats serviront de preuve reproductible que les limites temporelles matérielles peuvent contraindre l'autorité logicielle.
Cette initiative représente un changement significatif dans le discours sur la sécurité de l'IA, passant de débats théoriques sur les modèles et l'alignement à des contraintes pratiques au niveau physique qui doivent fonctionner une fois les machines déployées. Comme détaillé sur bwrci.org, le Défi OCUP s'appuie sur cinq preuves validées publiées sur AiCOMSCI.org, incluant la gouvernance en direct de l'API Grok, l'application de l'expiration d'autorité et la quarantaine des chemins d'attaque. La deuxième phase du défi, le Défi OCUP (Partie 2), se concentrera sur l'AEGES (AI-Enhanced Guardian for Economic Stability), une couche d'autorité monétaire matérielle destinée aux banques, institutions financières et à l'industrie crypto, dont les dates seront annoncées séparément.


