Dans l'oeil de la ville - Toulouse



  • Article paru dans "Brique et Tempête", journal toulousain à parution irrégulière.



  • Hugo est blasé de sa journée. Il traverse la place du Cap’ tête baissée, capuche et regard aiguisé. Le pas pressé. Après s’être levé à 5 heures pour trimer sur un chantier, payé au black quelques clopinettes, lui et ses collègues se sont fait engueuler par le chef. Paraît qu’ils vont pas assez vite. Que ce seraient des fainéants. S’ils continuent à ce rythme, ils ne recevront pas les primes de fin de chantier. Étant arrivé en retard, il a laissé sa voiture sur le trottoir. Bim une prune. 35 euros. La moitié de la journée perdue à travailler pour l’État. Blasé quoi. Sur la place, une caméra le repère. Une à reconnaissance faciale, intelligente qu’ils disent. Les informations transmises par celle-ci indiquent : démarche anormale, rythme cardiaque et température du corps élevés, s’est retourné quatre fois pour regarder derrière lui. Ces éléments font de lui une personne au comportement étrange, donc forcément suspecte. Dans le PC sécurité de St-Cyp’, où les images sont analysées, un homme, Larry, chargé de surveillance, étudie les notes que les nouveaux algorithmes de l’intelligence artificielle ont été glané sur les fichiers police et justice. Hugo Portmann donc, 34 ans, 1 mètre 82. A grandi à Paris jusqu’à l’âge de 19 ans. Quelque lignes au casier pour vol à l’étalage. Une note des services de renseignements disant qu’il serait proche d’un groupe de dealers. A 24 ans, un séjour de 3 mois à Seysses pour vol de voiture. Dernière habitation connue : avenue de Lyon en 2015. Tout ses loyers étaient réglés dans les temps. Dernier travail connu : magasinier dans un entrepôt de livraison. Viré en 2016. Depuis, plus de nouvelles. « Mhhh, intéressant », pense Larry. Pas de nouvelles = suspect. Depuis son siège confortable, il continue de suivre Hugo sur les écrans. Place Wilson, allées Jean Jaurès. Gare Matabiau. Son rythme cardiaque élevé fait toujours monter dans le rouge le degré de l’analyseur comportemental. Et voilà 15 minutes qu’il n’a pas bougé en plus. Le temps nécessaire pour le poste de contrôle de vérifier les récents déplacements d’Hugo. Au cours des 4 derniers jours, il a rencontré 3 fois la même personne, dans 3 lieux différents mais toujours à la même heure. Larry décide d’envoyer une petite équipe. En prévention. C’est le nouveau leitmotiv, faire de la police préventive. « Yeah, je fais du bon boulot », se dit Larry.
    Un peu plus tard, Zak retrouve Hugo devant le Quick, à la gare. Casquette, lunettes de soleil. La caméra IBM du parvis n’arrive pas à le reconnaître. « Merde » se dit Larry et avertit la patrouille. Celle-ci répond : « Bien reçu PCS. N 23 arrive sur les lieux dans 2 minutes». Cent secondes plus tard, les gyrophares donnent une teinte colorée aux murs ternes de Matabiau. Hugo, assis dans le Quick, raconte sa journée de merde à son pote et observe la voiture de police municipale qui déboule. Les condés sortent. A trois, ils font un petit tour du hall d’entrée de la gare, ils ont l’air à l’affût, cherche quelqu’un ou quelque chose. « Sûrement un truc pour taper dessus », plaisante Zak au moment où les flics rentrent dans le restaurant. Regards complices et sourires aux lèvres, Hugo pique une frite sur le plateau de son pote. Les trois agents sortent et remontent dans la voiture, l’air détendu. A l’intérieur les deux complices se marrent, interrogés par le comportement suspect de la flicaille. « N 23 à PCS. RAS, les deux individus mangent un hamburger. ».

    Le récit fictif ci-dessus témoigne de l’ambition que se donnent décideurs et technocrates en matière de reconnaissance faciale. Certes, on n’y est pas. Il y a encore une série de paliers législatifs et d’acceptation sociale à franchir. Sans compter les coûts pour les collectivités que cela engendreraient en termes d’installation et de maintenance. Mais voilà, la prétention existe et on le fait savoir. Ce qu’ils cherchent à obtenir : les logiciels de traitement de l’image pouvant analyser en direct ce qui est transmis et mener une identification des personnes. Autre objectif : acquérir d’énormes ordinateurs pouvant recouper tout les fichiers police et justice ainsi que l’ensemble des capteurs de la smart-City.
    En la matière, la France lorgne sur la Chine où on utilise le « réseau Céleste ». 20 millions de caméras. Selon la presse pro-gouvernement, le système peut identifier en temps réel, avec exactitude, le type de voiture, l’habillement, le sexe et même l’âge d’un passant. Les informations s’affichent automatiquement. « Quand il s’agit d’un criminel recherché, l’alarme du système se déclenche en montrant les données le concernant sur l’écran», annonce le journal de Hong Kong Apple Daily avec réjouissance.

    Un élan général
    Par chez nous, le problème est de taille. Et à la hauteur de leur délire techno-sécuritaire. Après avoir disséminé en nombre des caméras sur l’ensemble des territoires métropolitains, les chefs de file du contrôle se retrouvent dans l’expectative. Il y a trop de données à observer… Les agents chargés d’épier les bandes d’images des caméras qui défilent à l’écran n’arrivent pas à mettre leurs yeux partout. Alors ils tapent du pied et jouent du coude auprès des industriels pour qu’ils se dépêchent un peu. Si seulement les algorithmes se peaufinaient afin de pouvoir analyser en temps réel les images et balancer tout ce qui est possible de savoir sur les personnes qui passent sous les yeux de la métropole. Les labos de recherches fourmillent. Il y a de la maille à se faire. Plusieurs sociétés se font concurrence pour élaborer le panoptique1 tant désiré : IBM, Engie Ineo, Thalès…
    Alors pour commencer on fait des «phases expérimentales». Histoire d’y aller en douceur. Tel logiciel sur 16 mois dans cette ville, telle caméra sur une année dans une autre. Évidemment, car tout le monde ne serait pas ravi de se savoir épié, analysé et algorithmisé en permanence. En Chine encore ça passe, mais chez nous quand même, on est en démocratie…
    Alors voilà ce qu’on nous dit : « Ne vous inquiétez pas, on teste, et on vous dira ce qu’on en pense. En plus, avec le projet, on organise des débats citoyens sur la liberté. La smartsafe-City sera démocratique et transparente».
    Cet été, dans son rapport annuel sur le maintien de l’ordre, Gérard Collomb, avant de démissionner, nous contait la fable : “Les services de l’État vont analyser les données avec de l’intelligence artificielle pour être encore plus efficaces, avec une expérimentation déjà lancée dans onze départements ». Lui qui adore les caméras et qui en a disséminé partout à Lyon durant son dernier mandat de chef de la ville veut les voir devenir smart. Comme tout le reste, bon sang. Une sécurité plus efficace. Voilà qu’on le reconnaît bien le bonhomme. Elles serviront comme aide à la décision pour les forces de police et permettront de mener un travail prédictif. Même discours du côté des industriels. On insiste sur les nouvelles avancées en matière de traitement de l’image et des capacités d’analyse du comportement en temps réel. Marc Darmon, directeur général adjoint de Thalès, en charge des activités systèmes d’information et de communication sécurisés, explique : « Ce qui importe ce n’est pas le nombre de caméras, mais l’intelligence qu’il y a derrière. En effet, l’intelligence artificielle permet, entre autres, à la caméra, après quelques jours d’apprentissage, d’analyser un comportement anormal par rapport à la situation habituelle». A Toulouse, c’est la société International Business Machines- IBM – qui a été choisie par la clique des technocrates pour installer ses mouchards.

    Une ville rose omnisciente?

    Jean-Luc Moudenc en avait fait une promesse de campagne. Un homme de parole, car en 2018 c’est fait! Alors qu’à son arrivée 20 caméras sillonnaient la ville, on en compte aujourd’hui 354 exactement. Ce chiffre ne prend pas en compte les caméras Tisséo, celles des bâtiments publics et la myriade de caméras privées. Afin d’être opérationnel, il est nécessaire de construire un poste de sécurité où visionner toutes les images. Celui-ci est installé depuis février 2016 rue Jacques Darré dans le quartier Saint-Cyprien. Dans le jargon, on appelle ça un centre opérationnel et les gus qui regardent les télés, des opérateurs. Coût de l’opération, 8 millions d’euros. « Pas si cher que ça » nous annonce Olivier Arsac, adjoint en charge de la sécurité. Nous de notre côté, on vomit dans la Garonne. Mais attention, car ce faisant, on passe sous les yeux de caméras aux fonctionnalités douteuses. Celles-ci, installées sur les berges peuvent détecter si un.e individu.e. se dirige un peu trop franchement vers la Garonne. Si c’est le cas. Bip Bip. Objectif : éviter les noyades et pouvoir prévenir en temps réel les patrouilles dès le moment de la chute. Voici en quels termes un responsable des opérateurs de St-Cyp’ résume le joujou : *« Une barrière virtuelle est ainsi définie, afin d’alerter le PC en cas de franchissement. Sa délimitation précise varie selon l’heure : de jour, celle-ci suit strictement les berges du cours d’eau afin de prévenir les noyades. Mais de nuit, de 23h à 6h, nous la reculons de quelques mètres afin de nous assurer que rien n’arrive aux personnes s’approchant trop près du bord."*2. S’il est possible de tracer virtuellement une ligne infranchissable sur les bords de la Garonne qui alerte la flicaille en cas de dépassement ; il en est sûrement de même devant les banques, commissariats et tous les lieux qui auraient des choses à se reprocher, et donc cherchent à se protéger.

    Toujours au bord de la Garonne, on retrouve Hugo, qui schlague avec Zak.
    Place de la Daurade, ça traîne, beaucoup de monde. Pour digérer leur repas et profiter d’une soirée clémente, les deux potes boivent une bière. En partant, ils laissent traîner les bouteilles en verre là où ils étaient assis. « Monsieur à la capuche noir et aux chaussures Timberland beiges, veuillez ramasser votre bière et la déposer aux endroits prévus à cet effet. Selon l’article du code pénal R. 632-1, vous portez atteinte à la propreté des espaces publics. Vous risquez une contravention pouvant aller jusqu’à 150 euros ». « C’est quoi ce bordel ? » dit Zak. Hugo baisse la tête et va chercher les bières pour les jeter dans une poubelle. Sur la route il en ramasse même une autre sans trop savoir pourquoi… N’oubliant pas au passage d’insulter la caméra lui faisant face.
    La Daurade, lieu emblématique d’une jeunesse léthargique qui vient noyer son saoul. C’est ici que la mairie a testé au printemps 2018 un autre de ses jouets. Une caméra qui parle. Enfin, pour le moment, elle ne parle pas toute seule et c’est encore à un opérateur derrière l’écran que revient l’honneur de mettre à l’amende les personnes qui ne respectent pas les critères moraux de la citoyenneté. Le haut-parleur intervient dès qu’un gus du PC repère quelque chose sur l’écran qui ne lui convient pas. Évidemment, les politicards ont trouvé ce dispositif formidable et veulent décorer d’autres endroits de la ville.

    L’année passée, on apprenait que Toulouse avait conclu un marché avec la compagnie IBM pour acheter un logiciel d’analyse comportementale. Une centaine de caméras en est équipée et celles-ci peuvent d’ores et déjà détecter un comportement suspect3. Rien n’est dit sur les critères choisis pour définir un comportement suspect. Rien n’est dit non plus sur le fait qu’un comportement bizarre ne débouche pas nécessairement sur un acte répréhensible, comme dans la petite histoire de l’intro. Par contre, ce qu’on nous dit, c’est que c’est génial ; «une aide précieuse» pour les forces de police. Voilà tout est là. Éclairante obscurité. En allant puiser dans la documentation d’IBM sur son logiciel au joli nom d’Intelligent Video Analytics, on apprend que celui-ci peut se conjuguer de différentes façons en rajoutant certaines fonctions. Une fois installé, il ne manque plus qu’à cocher les cases des extensions désirées. Les nouveaux algorithmes d’IBM seraient en mesure de mettre en réseau une énorme quantité de données (reconnaissance faciale, analyse des expressions faciales, capteurs de présence, capteurs d’analyse des flux), pouvant provenir de différentes sources comme la caméra, un capteur ou internet. Ces données sont envoyées ensuite au centre opérationnel où elles sont analysées avec un logiciel centralisé. En temps réel, les algorithmes peuvent transmettre des informations apportant une « aide » à la prise de décision des forces de l’ordre. Les infos obtenues via le traitement de l’image pourront être couplées avec certains fichiers de police, comme les données anthropométriques du Fichier Automatisé des Empreintes Digitales, le FAED.
    Pour le moment, à Toulouse, on a le modèle de base, disons. Sans options. Juste quelques alertes en cas de situations anormales comme un sac abandonné, une personne qui court, un regroupement spontané de personnes, une personne qui veut voir de plus près la couleur de la Garonne. Aujourd’hui, industriels et politiques ne peuvent pas encore se servir de toute la technicité que les ingénieurs en intelligence artificielle se targuent d’avoir conçue. Évidemment ces premiers arrivent quand même à faire quelques exceptions en invoquant le côté expérimental des dispositifs, comme à Marseille, Nice, certaines gares et aéroports ainsi que La Défense à Paris. Mais une fois que la boîte de pandore est ouverte et la contestation de ces babioles intelligentes inexistante, la voie est toute tracée vers la généralisation du flicage.
    La situation pourrait être décrite ainsi : toutes les villes qui veulent se prétendre « smart », s’équipent de capteurs et de logiciels de traitement de l’image. Les villes nouent des partenariats avec des grands groupes, Engie Ineo à Marseille, Thalès à Paris, IBM à Toulouse. Ensemble, ils commencent à instaurer dans quelques métropoles le maillage social par vidéo-surveillance. Ils testent un peu, s’amusent et font des grandes tribunes dans les torchons de la presse bourgeoise ou sur le journal de TF1. On peut dire qu’en attendant que le parlement légifère, ils fabriquent du consensus. Et quand la loi sera adoptée et la technologie désirée par la majorité des gens, les technocrates au pouvoir pourront enfin cocher toutes les options du logiciel.

    Tromper l’ennemi
    La surveillance généralisée laisse quand même entrevoir quelques brèches. Malgré les prétentions d’omniscience de la clique ingénieurs/politicards, il n’existe pas de dispositif infaillible. L’idée principale pour tromper l’ennemi serait de fausser les points d’analyse des logiciels de traitement de l’image. Masques, maquillages, aveuglement des caméras… quelques pistes. Les artistouilles engagé.e.s et autres citoyennes contestataires ne sont pas en reste. Adam Harvey travaille sur ces questions depuis quelques années. En 2010, il invente une série de maquillages et coupes de cheveux permettant de tromper les logiciels. Le programme CV Dazzle s’inspire des camouflages utilisés lors de la Seconde Guerre mondiale pour tromper les attaques de sous-marins. Dernièrement, il élabore des vêtements visant à saturer les algorithmes de reconnaissance, en leur donnant à lire des milliers de visages. Le foulard ou le tee-shirt sont juste imprimés de manière à évoquer pour l’algorithme une foule.

    Il semblerait aussi que les LEDs infrarouges aveuglent les caméras et donc les possibilités d’être identifié. Sur internet, plusieurs tutoriels existent pour apprendre à les installer sur une casquette ou sur une capuche par exemple. Les lasers verts semblent aussi être en capacité de brûler les lentilles optiques mettant KO les dispositifs de surveillance. Selon les Anonymous, incliner la tête de 15 degrés suffirait à induire en erreur les logiciels. Enfin plusieurs personnes ont développé des lunettes anti-reconnaissance faciale. Celles-ci peuvent être munies de LEDs, ou imprimées de motifs trompant les algorithmes.

    A priori, il n’y a pas de solutions miracles face à l’intrusion de la reconnaissance faciale dans nos existences. On peut aussi penser aux maquillages, perruques et autres grimes ou au sabotage pur et simple des caméras. Quelques pistes, à suivre donc, mais beaucoup restent encore à imaginer.

    (en encart)
    Petite mise en perspective historique
    Comme une grande majorité des innovations technologiques (internet, les armes sublétales ou le drone), les technologies d’analyse de l’image ont d’abord une origine militaire.
    La première mention du développement d’une technologie de reconnaissance faciale remonte à 1963, dans un document déclassifié de la NSA, s’interrogeant sur la possibilité d’une technologie efficace pour identifier les ennemis.
    En 1969, une équipe de scientifiques japonais dirigée par le chercheur Takeo Kanade, met au point la première technologie de reconnaissance des visages par ordinateur. Elle reste assez rudimentaire, puisqu’elle se base sur les contours de la tête, dessinant des sortes de têtes de brocolis, un peu à la manière des dessins des cavernes pré-historiques.

    Les années 70 et 80 sont assez peu riches en innovation dans le domaine, la technologie peine à s’affiner. Mais dans les années 90, le ministère de la défense américaine impulse le programme FERET (Face Recognition Technology) qui met véritablement en place la logique de la perception militaire par ordinateur. Son objectif ? Étudier la pertinence de la reconnaissance faciale afin de faire appliquer la loi et de permettre l’identification à distance des ennemis sur les champs de bataille.
    En 2001, deux chercheurs américains, Viola et Jones, mettent au point un nouvel algorithme, entraîné sur des milliers de photos, qui permet de reconnaître et d’identifier des visages et des objets dans des images.
    Leur technologie est ensuite améliorée et reprise par de nombreuses sociétés et laboratoires de recherche. Elle rend la reconnaissance faciale facile à propager puisque son coût relativement bas, permet de l’intégrer dans de petits ordinateurs.
    La fin de la décennie 2000 nous amène à la photographie computationnelle, ne nécessitant presque plus d’interactions humaines, puisque les machines analysent et apprennent de manière quasi-autonome.

    Aujourd’hui, il est possible pour les applications des reconnaissance faciale d’identifier des visages de manière très efficace avec une toute petite information visuelle. La distance entre les deux yeux, l’arrête du nez, la forme de l’oreille ou encore le menton.

    Cette technologie est maintenant présente dans quasiment tous les terminaux gérant de l’image fixe ou en mouvement, du smartphone à la caméra de surveillance ; et les différentes sociétés et start-ups cybernétiques se sont lancées dans une course folle à la reconnaissance faciale, élément important de la vaste entreprise de collectes de données sur leurs usager.e.s dans laquelle sont engagés les poids lourds du secteur de l’internet.

    1. D’un point de vue architectural, se dit d’un bâtiment (pénitentiaire, hospitalier, etc.) dont, d’un pont d’observation interne, on peut embrasser du regard tout l’intérieur de la structure. Ce terme a été inventé par Jeremy Bentham, avant d’être popularisé par Michel Foucault. Dans ce texte, on entend panoptique dans son sens social. La dissémination de caméras, de capteurs et l’accroissement du contrôle sur nos existences font que nous sommes

    2. Interrogé par science et avenir.

    www.sciencesetavenir.fr/high-tech/
    
    1. On a beau avoir cherché, nous ne sommes pas en mesure de vous tenir informés de leurs emplacements. A priori visuellement rien ne peut distinguer une caméra avec système embarqué intelligent d’une autre.

    2. L’adjectif computationnel désigne un traitement par ordinateur.

    Texte publié en Novembre 2018.
    A discuté, débattre, complété et amandé



  • Article hyper intéressant, merci pour les infos !


Log in to reply