DRUID

Responsable d'équipe
Zoltan MIKLOS (Enseignant-chercheur, Université Rennes 1)

DRUID : Declarative & Reliable management of Uncertain, user-generated Interlinked Data

Récemment, on constate un intérêt accru pour les méthodes de gestion des données. Les techniques d'apprentissage statistique par machine, rendues possibles par la puissance de calcul distribuée disponible, sont capables d'extraire des informations utiles de certaines données. La presse internationale, spécialisée ou non, s'est fait l'écho de ces résultats remarquables comme un nouveau printemps pour l'intelligence artificielle au sens large.  Les données sont parfois même appelé "l'or du XXIe siècle".  Dans tous les domaines des affaires et des sciences, on essaie de construire d'énormes ensembles de données pour pouvoir profiter des avantages de la révolution de l'intelligence artificielle.

Cependant, lorsque les ensembles de données contiennent des données personnelles, leur collecte et leur utilisation peuvent conduire à des pratiques indésirables.  En particulier, il existe un l'intérêt croissant pour le respect de la vie privée, qui reflète l'intérêt toujours croissant pour l'analyse des données personnelles. L'apprentissage machine et la protection de la vie privée peuvent en effet être considérés comme les deux faces d'une même pièce : l'apprentissage machine tente d'extraire des informations pertinentes des données, tandis que la protection de la vie privée tend à brouiller les informations afin de dissimuler des informations individuelles identifiables ou sensibles. Outre la protection des données personnelles entrées par les algorithmes d'apprentissage machine, garantie par les modèles de protection de la vie privée et les algorithmes de préservation de la vie privée, l'équité des résultats est essentielle pour atténuer les problèmes de discrimination dans les décisions automatiques ou "semi-automatiques" à haut risque concernant les personnes (par exemple, les lois, les droits sociaux, la police).

Malheureusement, ces deux besoins souhaitables - l'apprentissage automatique sans faille et la protection de la vie privée - ne sont pas pour l'instant élégamment pris en charge dans le dogme de la gestion des données.  Par exemple, les opérateurs d'apprentissage automatique sont considérés pour l'instant comme des procédures externes en dehors du langage de requête, à peine prises en compte par l'optimiseur.  De plus, les tâches d'extraction de connaissances sont difficiles à concevoir sans comprendre les données disponibles, il faut donc considérer l'extraction de connaissances comme un processus interactif, où les utilisateurs influencent le processus. Les algorithmes de préservation de la vie privée font souvent un usage intensif de la cryptographie, ce qui entraîne des coûts prohibitifs si l'on considère les volumes typiques dans les cas d'utilisation de la gestion des données. En outre, le choix d'un modèle de protection de la vie privée et de ses paramètres, parmi un grand nombre de modèles possibles, est à peine compréhensible pour les administrateurs de bases de données non experts. Enfin, le respect de la vie privée et l'équité sont généralement considérés séparément sans analyse de leurs impacts mutuels.

Ces observations jettent les bases des objectifs de l'équipe DRUID :

  • Proposer des mécanismes permettant de mieux intégrer les méthodes d'apprentissage automatique à la logique et aux moteurs des bases de données
  • Proposer des méthodes interactives d'analyse des données et d'extraction des connaissances, même avec des données incertaines
  • Faire en sorte que les techniques de préservation de la vie privée répondent aux contraintes de la vie réelle dans les systèmes centrés sur les données, en mettant l'accent sur la performance et l'intelligibilité
  • Concevoir des systèmes centrés sur les données qui soient à la fois privés et équitables
Date de création
26/09/2014
Etablissements de rattachement
Université de Rennes 1
Localisation
Rennes (35) et Lannion (22)
Rapports d'activité
Fichier attaché Taille
druid2018_1.pdf 612.69 Ko
druid2017_0.pdf 884.84 Ko