L'Agence nationale de la recherche Des projets pour la science

Translate this page in english

Sciences et technologies pour la confiance et la sécurité numérique (DS0706) 2015
Projet DataCert

Spécification intensive en Coq d'intégration de données orientée sécurité

L'intégration et l'échange de données de sources multiples est un défi de longue date dans la communauté base de données, crucial dans de nombreux contextes : intégration de données pour les entreprises et organisations, partage de données sur le Net, collaboration entre agences gouvernementales, échange de données scientifiques. Intégrer, échanger des données commence souvent par collecter des données de sources disparates, avant de les abstraire en un entrepôt fournissant un unique point d'accès, tout en enlevant ou protégeant manuellement l'information sensible. Ce processus est très coûteux en temps et ressources humaines et source d'erreur.

L'intégration et l'échange de données sont entravés par l'impossibilité d'assurer efficacement sécurité et confidentialité ainsi que par le volume sans précédent des données produites et consommées. D'une part, sans un cadre adapté de sécurité, les détententeurs des sources sont réticents à échanger leurs données, aussi bien par peur de révéler une information confidentielle qu'à cause du renforcement des règlements. D'autre part, la variété et le volume de données nécessitent des méthodes automatiques pour faciliter le processus de partage. Un effort est donc nécessaire pour l'étude des fondements de la sécurité dans ce contexte.

La sécurité est assurée actuellement en empêchant la dissémination plutôt qu'en implémentant des politiques de sécurité au sein même du processus d'intégration et d'échange de données. Or les objectifs de sécurité devraient être pris en compte dès la conception du processus et non traités approximativement ensuite. De plus, la correction des mécanismes assurant la politique de sécurité devrait être attestée de la façon la plus forte possible. Ceci est particulièrement important pour les données de grande valeur.

Ce projet développera les techniques nécessaires pour intégrer et échanger des données en présence de politiques de sécurité et de confidentialité, tout en apportant des garanties fortes sur les algorithmes utilisés.

Notre objectif est donc de développer un cadre pour les problèmes fondamentaux sous-jacents à l'échange et l'intégration de données en prenant en compte la sécurité, afin de réaliser un changement de paradigme dans la conception et l'implémentation de tels systèmes. Pour combler le fossé entre les deux mondes - échange et intégration de données, sécurité- , nous nous appuierons fortement sur les spécifications extrêmes et le logiciel prouvé correct. Nous développerons des modèles formels qui pourront mener à une technologie fiable d'intégration de données distribuées tout en contrôlant la divulgation d'information privée ou confidentielle. Cette recherche apportera les contributions suivantes:

- spécification extrême des algorithmes de l'état de l'art pour l'intégration et l'échange de données. Nous formaliserons en Coq les algorithmes les plus répandus. L'objectif est d'obtenir du logiciel correct par construction grâce au mécanisme d'extraction de Coq.

- Conception de techniques robustes pour capturer et appliquer les politiques de sécurité dans le processus d'intégration de données. Nous étendrons les techniques existantes de contrôle d'accès au contexte distribué large échelle. Nous explorerons des techniques et établirons des propriétés suffisantes pour garantir la sécurité d'une technique d'intégration de données vis à vis de politiques de sécurité. La correction et complétude des mécanismes seront prouvées formellement.

- Conception de méthodes innovantes d'intégration de données pour des modèles de données faiblement structurés, en particulier notre étude portera sur le "record linkage" et le modèle RDF, centraux pour le Web Sémantique et les données ouvertes et liées. Les méthodes formelles seront de nouveau utilisées pour apporter le maximum de garanties pour le logiciel.

Plus généralement, ce projet aura un impact par son travail pionnier sur un paradigme de processus certifié d'intégration sécurisée de données.

Partenaires

UNIV-LILLE1 Centre de Recherche en Informatique, Signal et Automatique de Lille

UNIV-LYON1 Laboratoire d'InfoRmatique en Image et Systèmes d'information

PSUD/LRI Université Paris Sud/Laboratoire de Recherche en Informatique

Aide de l'ANR 433 632 euros
Début et durée du projet scientifique janvier 2016 - 48 mois

 

Programme ANR : Sciences et technologies pour la confiance et la sécurité numérique (DS0706) 2015

Référence projet : ANR-15-CE39-0009

Coordinateur du projet :
Madame Evelyne Contejean (Université Paris Sud/Laboratoire de Recherche en Informatique)

 

Revenir à la page précédente

 

L'auteur de ce résumé est le coordinateur du projet, qui est responsable du contenu de ce résumé. L'ANR décline par conséquent toute responsabilité quant à son contenu.