Echanger des informations en contexte très sensible grâce à l'IA explicable

Posté le 23/03/2022 par Anabasis

Traductions: en

Catégories: Technologie

Introduction

Dans le cadre d'une collaboration, il est souvent nécessaire de partager des données, parfois même des données confidentielles ou pour le moins sensibles. Ce partage est naturellement restreint à des acteurs bien identifiés et à certaines données uniquement ; collaborer ne signifie pas tout partager. Là où les enjeux sont moindres et les participants peu nombreux et enclins au partage, l'échange de données peut être réglé à la main. Quoique... En revanche, dans le contexte de collaborations inter-organisations, voire étatiques, s'outiller devient une nécessité.

C'est notamment le cas dans le domaine de la défense où l'on entend beaucoup parler de missions menées conjointement par plusieurs entités. On parlera alors de la mise en place de frameworks JADC2 (pour Joint All Domain Command and Control) pour permettre le commandement d'opérations interarmées (terre, mer, air) avec partage de données de renseignement, surveillance, reconnaissance, etc. Le besoin est également très présent au sein de coalitions étatiques œuvrant sur les mêmes missions. Ainsi, l'OTAN développe le programme FMN (pour Federated Mission Networking) ayant pour but de standardiser la mise en relation des pays membres ou alliés dans le cadre de missions jointes. Du côté de la défense américaine, on parlera de MPE (pour Mission Partner Environment) pour poursuivre les mêmes desseins.

image

L'un des enjeux majeurs de ces systèmes de partage d'information est l'automatisation du partage des données tant que faire se peut, mais avec la possibilité de conserver un contrôle pour les éléments les plus sensibles, dans le respect de règles de divulgation établies entre les différents partenaires. Cette problématique peut être adressée par l'utilisation des outils du Web Sémantique.

Partage d'informations et Web sémantique

La mise en relation de partenaires souhaitant collaborer se fait par la mise en place d'un réseau fédéré. Un partenaire peut alors se connecter au réseau et accéder aux informations. Quelques propriétés sont à considérer.

Tout d'abord, le réseau fédéré doit être non-invasif pour les partenaires. En effet, les partenaires viennent avec leurs propres solutions de gestion des données (systèmes d'information). La connexion au réseau fédéré doit être la plus neutre possible vis-à-vis des solutions internes. Générique, elle doit pouvoir s'adapter à tout système.

Le réseau fédéré doit également être de confiance. Seules les informations que l'on souhaite partager peuvent transiter des partenaires vers le réseau. Seules les destinataires concernés sont notifiés et peuvent accéder à ces informations.

Enfin, le réseau fédéré est dynamique. Il n'est en effet pas rare que d'anciens partenaires laissent la place à de nouveaux. La flexibilité est alors de mise. En effet, les règles d'échange entre partenaire sont alors susceptibles d'évoluer et ces changements brutaux de restriction sur les informations peuvent engendrer des incohérences qui doivent être résolues (e.g., données préalablement accessibles devenues protégées). Aussi, à tout moment, une cartographie de la situation destinataire/information doit être accessible faisant état de ces incohérences ou d'autres fuites dans le système devant également pouvoir être remarques afin d'être rapidement contenues.

La représentation des connaissances et les outils du Web Sémantique ont alors toute leur place dans cette problématique. Permettre les communications entre différents partenaires (sites) souhaitant partager du contenu (pages) malgré des représentations très hétérogènes est en effet l'un des enjeux majeurs du Web Sémantique. On s'intéresse alors au sens (ontologie) contenu dans les ressources échangées au delà des représentations.

L'établissement d'un modèle business des échanges de données par une ontologie supportée par les outils du Web Sémantique permet ainsi de spécifier de façon précise les attentes des partenaires et d'élaborer l'outil qui leur convient le mieux. La modélisation obtenue a l'avantage d'être directement exécutable. Cela permet tests et retours à tout moment du cycle de conception dans un jeu d'échange rapide avec les partenaires. De plus, la capacité à pouvoir tracer lors des exécutions toute proposition avancée par le système est un des atouts de cette forme d'intelligence artificielle explicable, au regard d'autres technologies comme le Machine Learning. Cela permet naturellement des discussions pour concevoir une solution, l'améliorer, la faire évoluer, mais aussi de justifier des décisions manuelles qui pourraient être prises en complément des automatisations.

Si vous souhaitez en savoir plus sur la situation du web sémantique aujourd'hui et les méandres de l'ingénierie de la connaissance, nous vous recommandons de consulter nos articles sur ces sujets.

Mais concrètement, comment modéliser la gestion de la divulgation dans un réseau fédéré ?

image

Modélisation d'un système de partage d'informations

Notre démarche consiste à modéliser l'activité d'un système de partage d'informations. Afin d'avoir une vue générale de cette modélisation, concentrons-nous sur les questions QUI ?, QUOI ?, POURQUOI ? et COMMENT ? qui régissent la conception d'une telle plateforme. Prenons également quelques exemples auxquels certains de nos clients ont pu être confrontés - dans le monde militaire ("cas OTAN") ou dans le monde industriel ("cas industriel").

  • QUI : les partenaires sont les acteurs principaux interagissant avec le système de partage d'informations et sont les entités que le système doit mettre en relation. L'objectif du système étant d'être discret, voire silencieux, on suppose très peu d'éléments sur les partenaires. Ils sont simplement vus comme la source et les consommateurs des données échangées. Les partenaires sont prêts à travailler ensemble mais ne s'accordent pas une confiance absolue pour autant. Ils souhaitent et doivent avoir le contrôle sur les données qu'ils laissent filtrer dans le système de partage et ne doivent être destinataires que des seules informations dont la consultation leur est autorisée.

  • Cas OTAN : des partenaires ou nations membres de l'OTAN cherchent à collaborer sur une mission. Les partenaires allouent des ressources à la mission (forces armées, matériels, support logistique, etc.) qui seront à l'origine et destinataires d'informations relatives à la mission.

  • Cas industriel : plusieurs organisations cherchent à collaborer sur un projet commun d'envergure faisant intervenir de grosses sociétés porteuses du projet mais également quelques entreprises prestataires chargées de plus petites tâches comme la réalisation ou le test d'un composant. Ces protagonistes souhaitent pouvoir échanger toutes les informations concernant le projet.

  • QUOI : les informations sont au centre du système de partage. Dans l'absolu, elles sont très hétérogènes et peuvent se présenter sous des formes variées pouvant aller de données brutes textuelles ou binaires (comme des fichiers multi-média : audio, vidéo, etc.) à des données structurées utilisant des formats d'échange préétablis. Malgré cette hétérogénéité, ces données sont en général accompagnées de méta-données permettant d'en savoir plus sur leur provenance (voire leur propriétaire), leur objet et leur niveau de sensibilité.

  • Cas OTAN : le partage d'information est un élément clé de la réussite des opérations militaires. On cherchera par exemple à prévenir des forces alliées sur une mission de la localisation d'un véhicule en mouvement, potentiellement dangereux (blue force tracking) ou à communiquer des ordres aux troupes concernés. Une classification (e.g., NATO SECRET) pourra alors être utilisée pour mesurer la sensibilité de l'information et ne la transmettre qu'aux partenaires concernés.

  • Cas industriel : des documents de spécification, des rapports d'avancement, des fichiers techniques, etc. peuvent être échangés dans le cadre d'un projet industriel. Les tâches confiées aux prestataires seront accompagnées des documents uniquement liés à leur activité dans le cadre de leur intervention sur le projet, évitant toute fuite industrielle.

image

  • POURQUOI : il s'agit de l'élément essentiel qui structure les communications entre les partenaires : ils cherchent à échanger sur un sujet d'intérêt commun et ce sont ces objets communs qui créent les liens entre les partenaires. La raison de la pertinence d'un échange d'information peut-être de nature très différente selon le domaine mais, de façon générique engendre des cadres de communication par lesquels le système est organisé.

  • Cas OTAN : la notion de communauté d'intérêt est déjà présente et représente le regroupement de partenaires autour d'un sujet commun. Ce concept peut très facilement détourné pour jouer le rôle de cadre de communication et engendrer le système de partage. Chaque communauté d'intérêt se voit chargée de regrouper toutes les informations relatives à un certain sujet (une territoire, une mission, un individu d'intérêt, etc.). Les partenaires (ONG, forces militaires, organisations étatiques et administratives, etc.) peuvent alors souscrire à une telle communauté, y partager ses informations concernant le sujet concerné et être notifiée de toute information relative à ce sujet.

  • Cas industriel : les plus gros projets industriels sont en général découpés en sous-projets dépendants les uns des autres mais avec une frontière bien définie. Cette organisation en sous-projets est parfaitement utilisable comme structures de communication. Chaque intervenant est ainsi en mesure de s'inscrire aux sous-projets lui correspondant, d'accéder à travers ceux-ci à tous les documents qui lui sont nécessaires afin de mener à bien ses tâches, et d'y déposer ses livrables pour les communiquer aux partenaires concernés.

  • COMMENT : les règles de divulgation décrivent dans quel cas QUOI est communiqué à QUI et POURQUOI. Autrement dit, quelles sont les conditions qui impliqueraient qu'une information soit communiquée à un partenaire et dans quel cadre. Une fois les partenaires regroupés dans les cadres dont le sujet qui les intéresse, l'idée est de déverser automatiquement toute information en lien avec ce sujet à tous ces partenaires, au regard des degrés de confidentialités associés et permis pour chaque partenaire.

image

La modélisation ainsi obtenue aboutit très naturellement à un système de gestion des règles de divulgation haut niveau gérant l'ensemble des contraintes entre toutes les entités. Le système est alors capable d'exprimer quelles règles sont à appliquer dans quel contexte. Il peut alors être la source permettant la mise à jour de règles pour le développement de divers outils plus bas niveau selon les besoins.

De plus, le système est capable d'analyser les règles de divulgation qu'il contient afin de repérer certains incohérences. On pourra alors parler de système de gestion de règles de divulgation intelligent. Cela montre comment une approche dirigée par les modèles (MBSE) alliée aux technique de représentation de la connaissance permet la conception d'outils efficaces.

Conclusion

Le web sémantique est une réponse aux problématiques de communication dans les réseaux fédérés, notamment pour la gestion des politiques de divulgation des informations.

Nous avons construit et partagé ces idées lors de notre récente participation à une étude du groupe de conseil industriel auprès de l'OTAN (NATO Industrial Advisory Group - NIAG). Cette étude s'est intéressée à produire des réflexions, tant conceptuelles que matériel, sur l'architecture et les technologies nécessaires pour réaliser un système de partage d'information intégrant le déploiement des règles de divulgation.

Antoine,
Expert scientifique pour Anabasis

et Sabrina,
Ingénieure de la connaissance à Anabasis

Retour sur la participation d'Anabasis au salon Vivatech 2022.

Résumé La participation d'une petite structure de la deep tech à l'événement phare européen du sujet méritait un petit retour en termes de vécu et de résultats. Mobilisation interne, n

La détermination de la nature comptable, une question complexe... de données

Introduction La comptabilité est un secteur clé de l'entreprise, des acteurs étatiques et des associations. De nombreux progiciels de gestion intégrés existent, permettant de travaille

Faire parler les données - genèse de l'IA explicable chez Anabasis

L'IA explicable n'est pas sortie toute armée de la tête de Jupiter... Mais l'aventure Anabasis a peut-être un peu servi