Vendredi 20 juin se tenait le lancement officiel de la nouvelle équipe-projet de recherche commune Inria-INSA Centre Val de Loire-Université d’Orléans, bi-localisée entre le campus de Bourges de l’INSA CVL et Saclay (91), rattachée au Laboratoire d’Informatique Fondamentale d’Orléans (LIFO) et dédiée à la protection des données personnelles.
Une ambition partagée
Yann Chamaillard, Directeur de l’INSA CVL, Jean-Philippe Lagrange, Directeur du centre Inria Saclay et Camélia Turcu, Vice-présidente de la Commission Recherche de l’Université d’Orléans ont introduit la matinée en rappelant leur ambition pour cette nouvelle équipe et leur fierté devant le travail déjà accompli et prometteur depuis l’installation opérationnelle de l’équipe il y a tout juste 1 an.
Une équipe en pleine expansion
Benjamin Nguyen, responsable de l’équipe-projet a ensuite présenté les 19 membres d’une équipe en pleine croissance (dont 7 doctorants, 4 post-doc et 1 chercheur espagnol), dont l’ambition est de crafter (façonner en anglais) une nouvelle génération de PETs (applications qui existent depuis près de 25 ans pour améliorer la protection des données personnelles tout en maintenant les données originelles) qui impliquent le recueil du consentement éclairé, tout en étant plus sécurisées et simples à mettre en œuvre. Les 3 domaines applicatifs prioritaires seront la jeunesse (ex : transmettre de manière anonyme une situation de harcèlement), la citoyenneté (ex : collecter moins de données personnelles à travers les formulaires administratifs) et le monde de l’entreprise (ex : données sur la qualité de vie au télétravail)
2 zooms sur des travaux de recherche en cours sont venus illustrer ces domaines applicatifs.
Cédric Eichler a fait un focus sur l’utilisation de Large Language Models (LLMs comme par ex Chatgpt) pour détecter des fuites de données personnelles dans les textes écrits sur le Web.
Plusieurs exemples de textes publiés sur internet, qui semblaient pourtant neutres et anodins ont été passés à l’analyse d’agents conversationnels utilisant l’IA et les résultats sont unanimes : nous en disons beaucoup plus que ce que nous pensons sur la toile en ne nous limitant pas au stricte nécessaire !
La finalité de ces recherches sera le développement d’une application IA qui relira les textes avant diffusion sur Internet pour proposer des réécritures minimisant les données personnelles transmises et informant clairement l’utilisateur des données privées décelables par des tiers quand une réécriture totalement anonymisée ne sera pas possible compte tenu des finalités (utilités) pour lesquelles ces données seront traitées.
Haoying Zhang, doctorante INSA CVL et Inria a enchainé en présentant ses recherches sur le développement d’un outil respectueux de la vie privée de détection d’empiètement du temps de travail sur le temps de loisir, en utilisant les trames électriques d’un smartmeter (ex linky). La généralisation du télétravail continue à impacter et parfois repousser la frontière entre vie professionnelle et personnelle et l’idée sera de proposer un outil pour objectiver la délimitation de cette frontière si importante. L’enjeu se situe également au niveau du traitement des informations qui devra se faire totalement 100% en local sur les ordinateurs des intéressés pour que seul le salarié dispose de cet outil d’aide à la décision sur son rythme de travail.
Une feuille de route riche
Benjamin Nguyen a partagé en conclusion les autres pistes de travaux futurs qui sont déjà aussi nombreuses que prometteuses : Services confidentiels de protection de la vie privée pour les citoyens (post doc), Plateforme d’anonymisation (post doc), Protection des données des mineurs dans les jeux vidéos en ligne (post doc), Preuve de protocoles cryptographiques « real life » (thèse), Impact de contraintes et règles sémantiques sur l’anonymisation (thèse), Preuve de primitives d’analyse de données (thèse), Gestion de données sécurisées sur une application (SGX) protégeant et conservant le chiffrement des données pendant que le processeur les traite (thèse), Attaques MIA sur les LLMs (thèse), Watermarking (filigrane indécelable de marque) de LLM (stage), Réécriture adversariale (méthode pour tromper les modèles de machine learning en introduisant des données d’entrée qui entrainent des prédictions ou des décisions incorrectes) de CVs (stage), LLMs et calcul sécurisé (stage), Intégration de la Double précision dans un système de gestion de base de données relationnelle « PostgreSQL » (stage).
La signature officielle de la convention de partenariat par les 3 parties-prenantes a clôturé cette matinée : Université d’Orléans (via le LIFO), Inria et INSA CVL, avant un cocktail de réseautage dont l’une des finalités était de permettre aux responsables et membres des services recherche et administratifs INSA CVL – Inria de faire connaissance en personne.