Anthropic a mis sur la table une nouvelle réglementation de l’IA d’Anthropic qui vise à limiter l’utilisation des intelligences artificielles à haut risque et, en même temps, à préparer les gouvernements et l’économie à l’impact des modèles de frontière. Le message est clair : si les capacités de l’IA avancée croissent aussi vite, il faut des instruments normatifs capables de bloquer ou de décourager les mises en œuvre dangereuses avant qu’elles ne produisent des dommages sérieux.
Summary
La réglementation de l’IA d’Anthropic entre sécurité et impact économique
Anthropic a présenté deux plans intégrés dans le projet Policy on the AI Exponential. Le premier définit un cadre pour les IA avancées, le second se penche sur les conséquences économiques pour les travailleurs et sur le partage des bénéfices financiers générés par l’IA. Au centre se trouve une demande précise : donner aux gouvernements des pouvoirs pour intervenir de manière préventive sur les modèles considérés comme à haut risque.
Le périmètre de la proposition est clair. La réglementation de l’IA d’Anthropic concernerait les systèmes entraînés avec un volume de calcul supérieur à 10²⁵ opérations en virgule flottante. Entreraient également dans le champ d’application les entreprises dont les revenus annuels provenant de l’IA dépassent 500 millions de dollars. Anthropic inclut aussi les entreprises qui dépensent plus de 1 milliard de dollars par an en recherche et développement sur l’IA.
Normes pour les IA à haut risque : transparence, tests et sanctions
Parmi les mesures clés figurent des vérifications indépendantes des modèles, une documentation détaillée sur la sécurité et des rapports périodiques sur les risques de la part des développeurs. Anthropic souhaite que des évaluateurs indépendants, dotés de ressources adéquates et d’un accès aux modèles, accompagnent les producteurs pour contrôler tests et rapports. L’objectif est de renforcer la transparence sans tout laisser à l’autoévaluation des entreprises.
La proposition prévoit également des sanctions civiles liées au chiffre d’affaires mondial annuel des entreprises, avec des amendes plus lourdes en cas de violations répétées. De cette manière, Anthropic vise à construire un moyen de dissuasion économique proportionné à l’échelle mondiale du secteur. La société demande en outre des programmes de sécurité robustes, décrits publiquement, et une plus grande transparence envers les autorités gouvernementales compétentes.
Méthodes de sécurité pour les modèles d’IA avancés et accès des évaluateurs
Un autre point central de la politique d’Anthropic pour l’IA est la protection de l’ensemble de l’environnement de développement. Les développeurs devront maintenir des normes élevées pour se défendre contre les attaques externes et les menaces internes. En outre, la proposition exige que les évaluateurs indépendants puissent accéder aux modèles pour effectuer des contrôles réels et pas seulement formels.
Les quatre risques indiqués par Anthropic pour l’IA de frontière
Anthropic identifie quatre domaines de risque critiques : biologique, cyber, perte de contrôle des systèmes et recherche automatisée menée par l’intelligence artificielle. Les conséquences potentielles vont de l’utilisation malveillante pour créer des virus dangereux jusqu’aux vulnérabilités pour des services essentiels comme les hôpitaux et les infrastructures énergétiques.
Pour le risque biologique, la proposition insiste sur des outils de filtrage pour la synthèse génétique et des systèmes de biosurveillance pour détecter les signaux précoces. Sur le front cyber, elle demande une meilleure protection des infrastructures critiques, le remplacement des systèmes hérités vulnérables et des fonctions gouvernementales dédiées à la surveillance des capacités offensives numériques émergentes.
Anthropic signale également la nécessité de mieux développer les contrôles contre la perte de contrôle et contre la recherche automatisée. Dans ces cas, la société demande des normes capables d’éteindre ou de confiner des systèmes d’IA dangereux avant qu’ils ne causent des dommages.
Résilience publique et contrôle gouvernemental sur les IA dangereuses
La proposition ne se limite pas à la sécurité technique. Anthropic inclut aussi des mesures pour renforcer la résilience de la société face aux impacts des IA avancées, avec des plans de prévention pour les urgences biologiques et technologiques et avec des stratégies pour mettre à jour et protéger les infrastructures critiques contre les cyberattaques.
La société invite les responsables politiques à accélérer le rythme normatif, afin que la gouvernance de l’intelligence artificielle ne reste pas en retard par rapport à la vitesse d’évolution des capacités technologiques. Le texte fait apparaître un point fixe : la sécurité ne peut pas dépendre uniquement de la transparence et de l’autorégulation, mais exige un engagement conjoint des gouvernements, des développeurs et de la société civile.
FAQ sur la réglementation de l’IA d’Anthropic
Qu’est-ce qui déclenche le pouvoir des gouvernements de bloquer une IA ?
Selon la proposition, les gouvernements devraient avoir des pouvoirs pour intervenir de manière préventive sur les modèles considérés comme à haut risque. Le texte ne précise toutefois pas de seuils opérationnels ni de procédures détaillées pour activer ce pouvoir.
Comment les évaluateurs indépendants sont-ils choisis et financés ?
L’article indique que les évaluateurs indépendants devraient disposer de ressources adéquates et d’un accès aux modèles, mais n’entre pas dans le détail de la sélection, du financement ou de la gouvernance du système de contrôle.
Quels sont les principaux risques biologiques identifiés ?
Anthropic mentionne le risque d’utilisation malveillante de l’IA dans la création de virus dangereux. Pour cela, elle propose des filtrages pour la synthèse génétique et des systèmes de biosurveillance.
Comment la proposition aborde-t-elle les risques de cybersécurité ?
La proposition vise à renforcer la protection des infrastructures critiques, à remplacer les systèmes hérités vulnérables et à créer des fonctions gouvernementales dédiées à la surveillance des capacités offensives numériques émergentes.
Quelles sanctions sont prévues pour les violations répétées ?
Anthropic propose des sanctions civiles calculées sur le chiffre d’affaires mondial annuel, avec des amendes plus élevées en cas d’infractions répétées.

