TLMFMC - Formation Médicale Continue - Développement Professionnel Continu
  • Les Enjeux de l'open data

  • Numéro TLM 103
  • Spécialité :
  • Informatique, NTIC, Santé connectée
  • Date :
  • 09/05/2016
  • Les Enjeux de l'open data

    L’Open data en questions Depuis quelques temps les termes « big data » et « open data » s’invitent dans nos vies au travers des médias, réseaux sociaux, conversations, etc. Ils semblent cliver les opinions : les pessimistes, certains que Big Brother s’immisce dans nos vies, annihilant nos libertés fondamentales ; et les optimistes, convaincus qu’il s’agit là d’un des plus grands pas réalisés par l’homme et qui va permettre à la science de telles avancées que ces mots ouvrent le champ de tous les possibles.

    Les termes employés parlent d’eux-mêmes —gisements, exploitation, etc.—, chacun s’accordant à dire qu’il s’agit d’une telle mine que le big data peut être qualifié de nouvel or noir, d’aujourd’hui et de demain. IBM, par exemple, revendique le fait d’agréger les données de santé de 300 millions de patients à travers le monde avec ses différents rachats dans ce secteur. En 1998 les recherches sur Google s’élevaient à 10 000 par jour, en 2013 les chiffres quotidiens se situaient autour de 4 milliards.

    C’est dire quels en sont les enjeux, les convoitises, mais également combien cet or noir peut-être facteur de progrès lorsqu’il est manié avec quelques précautions. Plus simplement, qu’est-ce que le big data ? Une compilation de millions de données stockées sur des serveurs informatiques ; une source, des gisements, oui, à condition de savoir les traiter, les analyser, qu’elles puissent apporter la valeur de la preuve. Car cette masse de data n’est intéressante que pour qui sait exploiter la richesse de son potentiel. Grâce à l’avènement de la e-santé et à l’analyse presque en temps réel d’un volume considérable de données, les experts estiment que nous allons passer de l’ère du curatif à celle du prédictif .

    Aussi le big data Santé entraîne-t-il une multitude de questions :  Est-ce compatible avec l’éthique et le secret médical ?  Comment anonymiser ces données ? Comment être certain qu’elles le restent ? Le lieu géographique de l’hébergement des données, voire d’une souveraineté numérique ?  Liberté et ouverture de l’accès aux données ?  Qui en sont les pourvoyeurs ?  Que va-t-on en faire ? Nécessité de transformer ce flux en information et comment ? Les données numériques publiques ou privées sont-elles ou pas un bien commun auquel nous devrions avoir librement accès ?

    C’est tout l’enjeu des questions autour de l’open data auxquelles ce dossier spécial de TLM tente d’apporter quelques réponses. Big data et open data ne font que commencer à appartenir à notre vie quotidienne. Sans doute pour longtemps…

    Dominique Noël, présidente du Festival de la Communication Santé et coordinatrice du dossier TLM

     

    Pour en savoir plus consulter le dossier complet sur notre slideshare

     

     

  • Ce dossier est composé de 4 Articles
  • Nos données santé en accès libre… - Auteur : Diane Cacciarella
  • Une source intarissable pour la recherche - Auteur : Diane Cacciarella
  • La Santé des Français à l’ère du big data - Auteur : Frédérique Guénot
  • L’open data à la recherche de son point d’équilibre - Auteur : Frédérique Guénot
  • Ce dossier est composé de 4 Articles

En dépit de l’anonymisation, l’open data présente un risque de ré-identification des données, avec son cortège de conséquences tant sur l’activité des professionnels de santé que sur la protection de la vie privée du citoyen. Un travail d’équilibriste pour le législateur, avec la CNIL dans le rôle du gendarme…

 

La gestion des données de santé, si elle permet une médecine à la fois prédictive et personnalisée, n’est pas sans poser question. A l’heure où le « big data » migre vers l’ère de l’open data, certains craignent que l’anonymisation des données de la base SNIIRAM1 ne soit qu’un vaste mensonge, la protection des données n’étant pas garantie en dépit des techniques de protection mises en place. De leur côté, les professionnels de santé peuvent s’inquiéter de la reconstitution de leur chiffre d’affaires par recoupement des données. Enfin, les individus sont en droit de s’interroger sur le flux de leurs données personnelles et la possible utilisation de ces dernières par des organismes autres que médicaux. Autant de sujets qui méritent une plus grande transparence, qui serait bénéfique en tout premier lieu aux malades…

Devant le risque de ré-identification des données de santé, la Direction de la recherche, des études, de l’évaluation et des statistiques (Drees) a fait un point en juillet dernier, posant ainsi les bases de l’article 47 de modernisation de notre système de santé. L’organisme a ainsi étudié les conséquences de l’open data en matière de santé et de l’extension de la mise à disposition de ces données en s’appuyant sur les garanties de confidentialité apportées par l’article 47 du projet de loi Santé. Il s’appuie sur l’annexe 9 du rapport de l’open data publié en juillet 2014, relative aux risques de ré-identification, et qui critiquait « la diffusion mal contrôlée des données hospitalières du PMSI exhaustif ». Le rapport pointe la nécessité d’assurer l’anonymat des données en open data et le besoin de protéger les données dont l’anonymat ne peut être garanti même après avoir été désidentifiées. Il s’agit alors de déterminer quels sont les jeux de données issues des bases médico-administratives publiables, en fonction des contenus ou des usages requis par le public, en s’assurant de leur anonymisation complète, sous le contrôle de la CNIL, qui pourra valider un procédé d’anonymisation.

VERS UNE OUVERTURE RAISONNEE

DES DONNEES DE SANTE

Plus récemment, un open data de santé a été organisé dans le cadre de la loi Santé votée le 17 décembre dernier. Une décision fondée sur le débat relatif à l’open data en santé, appuyé par la mission Etalab2, lancé par la ministre de la Santé et des Affaires sociales ainsi que sur le rapport Bras, remis en octobre 2013. A noter que l’ouverture de ces données publiques s’inscrit dans le cadre de la transformation numérique de l’État, laquelle s’accompagne d’une politique stratégique de la donnée. La loi cherche ainsi un équilibre entre la protection de la vie privée et l’ouverture des données pour créer le meilleur impact économique et social possible. En effet, une plus grande transparence dans la gestion et la diffusion de ces données permettrait un contrôle accru des citoyens, notamment sur les dépenses de santé et la pertinence de certaines prescriptions, pour le plus grand intérêt des malades. La loi vise ainsi  à « ouvrir au public les jeux de données complètement anonymes, multiplier les jeux de données anonymisées (et au passage permettre la réutilisation des données produites par l’Assurance maladie sur les professionnels de santé) ; de même, elle autorise le traitement des données comportant un possible risque de ré-identification, mais uniquement pour les projets d’intérêt public et dans des conditions garantissant le respect de la vie privée des personnes »3.

Cela devrait s’effectuer sous une gouvernance unique, le Système national des données de santé (SNDS), qui assurera un appariement entre les bases de données de la CNAM (SNIIRAM, PMSI), le registre national des décès, des données sur le handicap et un extrait représentatif de données sur l’assurance. Néanmoins, ces données ne donneront aucune information directement identifiante et c’est la CNAM qui sera chargée de maintenir le système et notamment d’apparier ces données entre elles. Pour organiser cette gouvernance et l’ouverture de ces données, l’actuel Institut des données de santé (IDS) va se transformer en Institut national des données de santé (INDS) avec, de fait, des missions élargies. Il deviendra ainsi une sorte de guichet unique pour orienter les demandes d’accès aux données de santé, l’autorisation de la CNIL restant de mise pour le traitement des données à risque de ré-identification.

Frédérique Guenot

 

 

1.              Système national d’informations inter-régimes de l’Assurance maladie

2.              Blog de la mission Etalab

3.              Service du Premier ministre chargé de l’ouverture des données publiques et du développement de la plateforme française open data, la mission Etalab coordonne, au sein du secrétariat général pour la Modernisation de l’action publique, l’action des services de l’Etat et de ses établissements publics pour faciliter la réutilisation la plus large possible de leurs informations publiques.

 

  • Auteur :
  • Frédérique Guénot