Quand les caméras deviennent des armes

Il y a quelque chose de presque comique, si l’affaire n’était pas si grave, dans l’image d’un État qui débranche ses propres yeux. La caméra, pendant trente ans, a été l’accessoire tranquille de la puissance publique : elle rassurait les commerçants, disciplinait les foules, aidait la police à remonter un itinéraire après coup. Puis elle est devenue intelligente. Elle a appris à reconnaître un visage, à suivre une silhouette, à relier une plaque d’immatriculation à un horaire, à transformer des milliers d’heures de vidéo en requête formulée en langage naturel. Et soudain, l’objet qui promettait au souverain de tout voir se retourne contre lui. Selon le Financial Times, la Russie a temporairement isolé une partie d’un système de vidéosurveillance protégeant Vladimir Poutine après avoir craint qu’un acteur étranger puisse l’exploiter comme un instrument de localisation. La panique est moins anecdotique qu’elle n’en a l’air. Elle signale une mutation de la grammaire du renseignement.

La scène appartient à notre époque : les régimes les plus obsédés par la visibilité découvrent que l’hypervisibilité est réversible. Les caméras d’une capitale, les bornes d’un métro, les vidéos d’un péage, les images d’un hall d’hôtel ou d’un carrefour ne forment plus seulement une archive locale. Branchées, mal segmentées, enrichies par des modèles de vision et croisées avec des bases administratives, elles deviennent un graphe dynamique de la vie urbaine. Le renseignement n’a plus nécessairement besoin d’un agent à l’angle d’une rue ; il peut interroger la ville elle-même.

L’événement décrit par la presse financière britannique — l’inquiétude russe après l’usage présumé de l’IA dans une opération de renseignement contre l’appareil iranien — ne doit pas être lu comme un épisode isolé de techno-thriller. Il révèle une loi plus froide : toute infrastructure de surveillance centralisée est aussi une infrastructure de fuite, de sabotage et de capture. Plus elle est puissante pour l’État qui l’opère, plus elle devient intéressante pour l’adversaire qui parvient à y entrer.

I — Le vieux rêve du panoptique a changé de propriétaire

Le panoptique classique avait une architecture simple : un centre regarde une périphérie qui ne sait jamais exactement quand elle est observée. L’IA de vision introduit une rupture. Elle ne se contente pas de regarder ; elle filtre, indexe, résume, infère. L’opérateur n’a plus besoin de parcourir la bande vidéo : il demande. « Retrouve un homme portant une casquette noire qui a changé de veste entre deux stations. » « Repère les véhicules qui tournent trois fois autour du même bâtiment. » « Identifie les personnes vues près de telle entrée et réapparues trente minutes plus tard à tel autre endroit. » La caméra devient une base de données temporelle.

Cette bascule a deux conséquences. D’abord, l’échelle change. Une armée d’analystes ne pouvait suivre qu’un nombre limité d’objectifs ; un système de vision assisté par IA peut, du moins en théorie, cribler une ville entière. Ensuite, la valeur ne se situe plus seulement dans l’image, mais dans la capacité à requêter l’image. Le renseignement n’est plus uniquement une affaire d’accès aux caméras : il devient une affaire de modèles capables d’extraire les trajectoires utiles du bruit urbain.

Figure 1 — La caméra n’est plus un capteur isolé : elle devient un nœud dans une chaîne qui relie images, identités, déplacements et inférences.

La reconnaissance faciale n’est que la partie la plus visible de cette transformation. La vision moderne travaille aussi sur la démarche, les vêtements, les objets, les habitudes, les covisibilités. Elle peut échouer, confondre, halluciner ; mais son intérêt stratégique ne dépend pas d’une perfection absolue. Dans le renseignement, un indice qui réduit le champ de recherche de dix mille personnes à cent peut déjà valoir opération.

II — L’État-surveillant découvre le risque de contre-emploi

La Russie n’a pas attendu 2026 pour comprendre la valeur politique des caméras. Moscou s’est dotée d’un des systèmes urbains les plus denses au monde, souvent décrit sous le nom de « Safe City », combinant vidéosurveillance, reconnaissance faciale et bases policières. Des enquêtes de Reuters et de Wired ont documenté l’usage de ces dispositifs pour identifier des manifestants, contrôler le métro, suivre des opposants ou rendre plus coûteuse la simple présence dans l’espace public. Le système est efficace parce qu’il dissout la frontière entre sécurité ordinaire et police politique.

Mais cette efficacité est précisément sa vulnérabilité. Plus un système agrège de données sensibles, plus le butin est précieux. Plus il est centralisé, plus l’intrusion produit d’effets. Plus il est interconnecté, plus une faille périphérique peut ouvrir le cœur. L’ancien compromis des États autoritaires — perdre de la liberté publique pour gagner du contrôle — se double d’un compromis moins avoué : perdre de la sécurité stratégique pour gagner de la visibilité interne.

Le paradoxe du régime de surveillance est qu’il construit, pour mieux contrôler ses sujets, l’outil rêvé de celui qui voudra contrôler ses dirigeants.

La vulnérabilité ne tient pas seulement au piratage spectaculaire. Elle peut venir d’un prestataire étranger, d’un composant non maîtrisé, d’un administrateur corrompu, d’un marché noir de données, d’une API trop ouverte, d’un accès de maintenance oublié. Elle peut aussi venir de la banalité : des caméras connectées déployées vite, achetées moins cher, jamais mises à jour. Une étude de sécurité sur des caméras IP grand public a montré combien la chaîne d’approvisionnement de ces objets peut laisser subsister des failles structurelles, parfois impossibles à corriger une fois les appareils disséminés.

Point de bascule

La question stratégique n’est plus seulement : « Qui a le droit de regarder ? » Elle devient : « Qui peut détourner l’appareil qui regarde ? » Dans cette seconde question, la souveraineté rejoint la cybersécurité, et la vidéosurveillance cesse d’être un sujet municipal pour devenir un sujet de défense.

III — Le renseignement visuel entre dans l’âge de la requête

L’innovation décisive n’est pas que les caméras voient mieux ; c’est que les humains peuvent demander moins. La vieille surveillance imposait un coût d’attention colossal. Il fallait choisir une cible, mobiliser des opérateurs, revoir des heures de bande, tolérer l’ennui et l’incertitude. Les modèles multimodaux abaissent ce coût. Ils transforment le travail de l’analyste en conversation avec une archive visuelle.

Ce changement rend les opérations plus opportunistes. Là où il fallait autrefois préparer longuement l’accès à une source humaine ou technique, un service disposant d’un accès temporaire à des flux peut reconstruire en quelques heures des schémas de déplacement, repérer une escorte, deviner un protocole, identifier des exceptions. Le renseignement a toujours aimé les routines ; l’IA rend les routines lisibles à grande échelle.

Figure 2 — L’IA augmente surtout le rendement de l’attention : elle rend exploitable une masse vidéo auparavant trop coûteuse à parcourir.

Cette économie de l’attention explique la nervosité des services de sécurité. La caméra n’est pas dangereuse parce qu’elle filme ; elle l’est parce que l’image devient calculable. Le saut est comparable à celui qui a transformé les métadonnées téléphoniques en outil de cartographie sociale : la conversation importe, mais le graphe des appels peut suffire à révéler une organisation. De même, une vidéo sans son, sans visage parfaitement reconnu, peut révéler une escorte, un lieu sûr, une habitude de déplacement.

Le cas iranien, tel que rapporté par le Financial Times, est particulièrement instructif parce qu’il inverse l’imaginaire habituel de la surveillance. L’Iran a développé depuis des années un appareil de contrôle intérieur : filtrage, drones, bases de données, caméras, reconnaissance faciale, notamment pour surveiller les mobilisations et l’application des normes vestimentaires. Mais un système construit pour surveiller les citoyens peut devenir, dans certaines conditions, une source d’exposition de l’élite elle-même. La verticalité du pouvoir ne protège pas contre la horizontalité des réseaux.

IV — La souveraineté ne se mesure plus au nombre de caméras

Un État peut posséder des milliers de caméras et n’avoir qu’une souveraineté faible sur ce qu’elles produisent. La souveraineté réelle se joue ailleurs : dans le micrologiciel des appareils, dans les chaînes de mise à jour, dans la localisation des données, dans l’identité des prestataires, dans la segmentation des réseaux, dans les journaux d’accès, dans la capacité à fonctionner en mode dégradé. L’obsession quantitative — cinq millions de caméras, cent mille points de contrôle, une couverture totale — masque souvent la fragilité qualitative.

La comparaison avec les réseaux électriques est utile. Un réseau plus interconnecté est plus efficace, mais il exige des protections supérieures, des redondances, des procédures d’îlotage. La vidéosurveillance intelligente suit la même logique. Plus elle connecte de capteurs à des systèmes centraux, plus elle doit être capable d’isoler, d’auditer, de couper sans s’aveugler totalement. Le réflexe russe rapporté — débrancher ou isoler — ressemble à une manœuvre d’îlotage numérique : sauver le cœur en sacrifiant temporairement une partie de la vision.

Ancien modèle	Nouveau modèle	Risque dominant
Caméra locale	Capteur connecté	Intrusion par réseau ou maintenance
Archivage vidéo	Indexation sémantique	Recherche massive dans le passé
Reconnaissance faciale	Ré-identification multimodale	Suivi sans visage exploitable
Police urbaine	Renseignement stratégique	Contre-emploi par adversaire

C’est ici que les démocraties ne peuvent pas se contenter de se croire protégées par leur vertu juridique. Le problème ne concerne pas seulement les régimes autoritaires. Les villes occidentales accumulent elles aussi des caméras, des systèmes d’analyse, des prestataires privés, des solutions de sûreté événementielle, des dispositifs expérimentaux pour les transports, les stades, les frontières. Le règlement européen sur l’IA encadre certaines pratiques de biométrie à distance, notamment l’identification en temps réel dans les espaces publics, mais laisse subsister des exceptions de sécurité et des zones grises autour de l’analyse rétrospective, de la sous-traitance et des usages de police.

Figure 3 — Le danger augmente lorsque centralisation et puissance d’analyse progressent ensemble : l’infrastructure cesse d’être seulement policière.

V — Le marché vend de la sécurité, il livre parfois de la dépendance

La surveillance algorithmique n’est pas seulement un projet d’État ; c’est un marché. Entreprises de caméras, fournisseurs de logiciels de reconnaissance, intégrateurs, plateformes cloud, fabricants de puces, cabinets de cybersécurité : la chaîne est fragmentée, internationale, souvent opaque. Cette fragmentation crée une ambiguïté politique. Les gouvernements achètent de la souveraineté sous forme de produits, mais les produits incorporent des dépendances.

L’enquête du Monde et de ses partenaires sur l’acquisition par l’Iran de technologies de reconnaissance faciale via des circuits liés à une entreprise russe illustre cette circulation trouble : les outils de contrôle franchissent les frontières, changent de mains, se recomposent derrière des intermédiaires. Les sanctions ralentissent, contournent, renchérissent ; elles ne suffisent pas toujours à empêcher la diffusion d’un savoir-faire. La surveillance est devenue une industrie duale : civile dans sa brochure, policière dans ses usages, militaire dans ses conséquences.

Cette industrie a un intérêt naturel à présenter la caméra intelligente comme un progrès incrémental. Elle ne serait qu’une caméra plus utile. Or le saut qualitatif est ailleurs : dans la possibilité de transformer une ville en base interrogeable. Une caméra isolée voit une scène ; un système d’IA recompose un destin. Cela ne signifie pas que tout fonctionne, ni que les modèles soient omniscients. Les erreurs de reconnaissance, les biais, les angles morts, les contre-mesures physiques existent. Mais le seuil opérationnel a baissé. Et quand le seuil baisse, les usages prolifèrent.

Figure 4 — La souveraineté d’un système vidéo dépend de toute la chaîne : matériel, modèles, cloud, maintenance, droits d’accès.

VI — L’art de redevenir invisible

Face à cette montée en puissance, la contre-surveillance se développe. Elle est technique — brouillage, adversarial patches, masques, vêtements perturbant les détecteurs, caméras conçues pour réduire les informations biométriques — mais elle est aussi comportementale : changer d’itinéraire, casser les routines, éviter les lieux à forte densité de capteurs, fragmenter les communications. Les services clandestins connaissaient déjà ces gestes ; l’IA les rend plus nécessaires et parfois plus difficiles.

Le paradoxe est que la sophistication redonne de la valeur à des tactiques très simples. Un modèle peut reconnaître des milliers de visages, mais il dépend d’une ligne de vue, d’une qualité d’image, d’un angle, d’une continuité. Un système peut suivre des trajectoires, mais il aime les habitudes. La clandestinité moderne ne consiste pas seulement à cacher une identité ; elle consiste à produire du bruit, à rompre la continuité, à rendre la requête incertaine.

La littérature technique sur les attaques adversariales rappelle que les modèles de vision ne voient pas comme nous. Ils peuvent être trompés par des motifs, des perturbations, des configurations inattendues. Ces faiblesses ne doivent pas être caricaturées : beaucoup de démonstrations restent expérimentales, fragiles, dépendantes du contexte. Mais elles indiquent une chose essentielle : l’œil algorithmique est puissant parce qu’il est statistique ; il est vulnérable pour la même raison.

VII — Le nouvel équilibre de la peur

La peur de Poutine devant ses propres caméras, si l’on accepte l’image, n’est pas seulement la peur d’un homme protégé. C’est la peur d’un système qui comprend qu’il a trop bien réussi. Le contrôle total fabrique une carte totale ; la carte totale attire les voleurs de cartes. Les États autoritaires pensaient que la surveillance de masse était une asymétrie en leur faveur. Elle le reste souvent contre les citoyens. Mais entre États, elle devient une cible, une faille, parfois un piège.

Ce renversement ne sauvera pas les libertés publiques par miracle. Il peut même aggraver la fermeture des régimes : segmentation accrue, réseaux souverains, chasse aux prestataires étrangers, durcissement des contrôles, militarisation de la cybersécurité. Mais il introduit une contradiction interne dans l’idéologie de la visibilité. Un pouvoir qui veut tout voir doit accepter d’être vu par ses propres instruments si ceux-ci tombent aux mains d’autrui. Le rêve panoptique devient une dépendance panoptique.

Pour les démocraties, l’alerte devrait être double. D’un côté, refuser la naïveté : les systèmes de vision sont déjà des infrastructures critiques, et leur sécurité ne peut être abandonnée à des appels d’offres municipaux. De l’autre, refuser l’imitation : la réponse au risque stratégique ne doit pas être la construction d’un appareil plus opaque encore. Gouverner la caméra intelligente exige à la fois des audits techniques, des limites juridiques, une minimisation des données, une séparation stricte des usages, une traçabilité des accès et une capacité de désactivation sans effondrement opérationnel.

La caméra a longtemps été l’emblème d’un pouvoir tranquille, presque administratif. Elle entre désormais dans la catégorie des objets géopolitiques. Ce n’est plus un œil fixé au mur ; c’est un capteur dans une guerre de graphes. Et dans cette guerre, la question décisive n’est pas de savoir qui possède le plus d’yeux, mais qui contrôle ce qu’ils savent.

Bibliographie

Financial Times, « New AI espionage powers trigger Putin camera scare », 8 juin 2026.
Financial Times, « FirstFT: AI-powered espionage triggers Putin camera scare », 7 juin 2026.
Masha Borak, « Inside Safe City, Moscow’s AI Surveillance Dystopia », Wired, 6 février 2023.
Lena Masri, « Face control: Russian police go digital against protesters », Reuters, 11 février 2021.
Le Monde / Forbidden Stories, « How Iran secretly acquired facial recognition technology through a Russian company », 4 mars 2026.
Règlement (UE) 2024/1689 établissant des règles harmonisées concernant l’intelligence artificielle, Journal officiel de l’Union européenne, 2024.
Simen Thys, Wiebe Van Ranst, Toon Goedemé, « Fooling automated surveillance cameras: adversarial patches to attack person detection », arXiv, 2019 ; Wenjun Zhu et al., « CamPro: Camera-based Anti-Facial Recognition », arXiv, 2023.

❦

In Extenso · juin 2026