TLMFMC - Formation Médicale Continue - Développement Professionnel Continu
  • Les Enjeux de l'open data

  • Numéro TLM 103
  • Spécialité :
  • Informatique, NTIC, Santé connectée
  • Date :
  • 09/05/2016
  • Les Enjeux de l'open data

    L’Open data en questions Depuis quelques temps les termes « big data » et « open data » s’invitent dans nos vies au travers des médias, réseaux sociaux, conversations, etc. Ils semblent cliver les opinions : les pessimistes, certains que Big Brother s’immisce dans nos vies, annihilant nos libertés fondamentales ; et les optimistes, convaincus qu’il s’agit là d’un des plus grands pas réalisés par l’homme et qui va permettre à la science de telles avancées que ces mots ouvrent le champ de tous les possibles.

    Les termes employés parlent d’eux-mêmes —gisements, exploitation, etc.—, chacun s’accordant à dire qu’il s’agit d’une telle mine que le big data peut être qualifié de nouvel or noir, d’aujourd’hui et de demain. IBM, par exemple, revendique le fait d’agréger les données de santé de 300 millions de patients à travers le monde avec ses différents rachats dans ce secteur. En 1998 les recherches sur Google s’élevaient à 10 000 par jour, en 2013 les chiffres quotidiens se situaient autour de 4 milliards.

    C’est dire quels en sont les enjeux, les convoitises, mais également combien cet or noir peut-être facteur de progrès lorsqu’il est manié avec quelques précautions. Plus simplement, qu’est-ce que le big data ? Une compilation de millions de données stockées sur des serveurs informatiques ; une source, des gisements, oui, à condition de savoir les traiter, les analyser, qu’elles puissent apporter la valeur de la preuve. Car cette masse de data n’est intéressante que pour qui sait exploiter la richesse de son potentiel. Grâce à l’avènement de la e-santé et à l’analyse presque en temps réel d’un volume considérable de données, les experts estiment que nous allons passer de l’ère du curatif à celle du prédictif .

    Aussi le big data Santé entraîne-t-il une multitude de questions :  Est-ce compatible avec l’éthique et le secret médical ?  Comment anonymiser ces données ? Comment être certain qu’elles le restent ? Le lieu géographique de l’hébergement des données, voire d’une souveraineté numérique ?  Liberté et ouverture de l’accès aux données ?  Qui en sont les pourvoyeurs ?  Que va-t-on en faire ? Nécessité de transformer ce flux en information et comment ? Les données numériques publiques ou privées sont-elles ou pas un bien commun auquel nous devrions avoir librement accès ?

    C’est tout l’enjeu des questions autour de l’open data auxquelles ce dossier spécial de TLM tente d’apporter quelques réponses. Big data et open data ne font que commencer à appartenir à notre vie quotidienne. Sans doute pour longtemps…

    Dominique Noël, présidente du Festival de la Communication Santé et coordinatrice du dossier TLM

     

    Pour en savoir plus consulter le dossier complet sur notre slideshare

     

     

  • Ce dossier est composé de 4 Articles
  • Nos données santé en accès libre… - Auteur : Diane Cacciarella
  • Une source intarissable pour la recherche - Auteur : Diane Cacciarella
  • La Santé des Français à l’ère du big data - Auteur : Frédérique Guénot
  • L’open data à la recherche de son point d’équilibre - Auteur : Frédérique Guénot
  • Ce dossier est composé de 4 Articles

Indispensables à la recherche, les données statistiques de santé constituent une mine d’informations précieuses et incontournables. le Système national d’information inter-régimes de l’assurance maladie (SNIIRAM) abrite la ressource la plus abondante, dans laquelle puisent la majorité des chercheurs.

Le Système national des données de santé (SNDS), créé par la loi Santé, vise à unifier le traitement des renseignements médicaux disponibles en France. Ils sont stockés dans diverses bases de données médico-sociales et socioéconomiques administrées par des organismes publics. La diversité des domaines concernés —hospitalisations, maladies rares, recours aux soins, etc.— pour les 66 millions de Français constitue une réserve d’informations importantes pour la recherche. Pour classer ces milliards d’éléments, les organisations publiques utilisent un numéro d’identification au répertoire, directement ou sous forme anonymisée, qui est un identifiant unique. Les données sont produites par des organismes publics ou par l’administration tenus de respecter le Code de la santé publique pour les collecter.

Les multiples bases de données constituent une source d’informations pour la recherche médicale. Le Système national d’information inter-régimes de l’assurance maladie (SNIIRAM), créé en 2003 et géré par la CNAMTS, en est la plus importante. Il recense les données de remboursement de soins des divers régimes d’assurance maladie (actes et/ou médicaments), les coordonnées des professionnels et établissements de santé ayant encadré le patient, les informations sur les pathologies des patients atteints d’Affections de longue durée (ALD) ainsi que les accidents du travail et maladies professionnelles (AT-MP). Le SNIIRAM compte également les données du Programme de médicalisation du système d’information (PMSI) contenant les éléments relatifs aux séjours hospitaliers, aussi bien administratifs que médicaux, aux diagnostics, actes techniques ou résultats concernant la maladie de Parkinson. La pluralité des éléments enregistrés dans le SNIIRAM permet aux chercheurs d’atteindre une plus grande qualité lors de travaux relatifs à l’estimation. Par exemple, les travaux sur la prévalence ou l’incidence de cancers s’appuient sur de puissants algorithmes croisant les diagnostics avec les actes techniques.

L’étude de phénomènes territoriaux relève aussi de la base de données du SNIIRAM, qui inclut les données de l’ensemble de la population. Ainsi, une étude sur les inégalités territoriales de soins de santé pourra être traitée de manière comparative, par zone. L’avantage du SNIIRAM c’est de permettre aux chercheurs de choisir entre la totalité des patients ou des échantillons, qui peuvent être définis en fonction d’une pathologie, du professionnel de santé consulté, du traitement médicamenteux… Enfin, les études relatives aux filières, parcours de soins et à l’impact d’expositions environnementales sont réalisables de manière transversale ou longitudinale. La qualité des données du SNIIRAM est toutefois limitée. Certains renseignements personnels n’y figurent pas. La situation socioprofessionnelle des personnes, les résultats d’examens cliniques ou paracliniques ou les diagnostics médicaux peu fiables en sont notamment exclus.

Le SNIIRAM est une ressource indispensable pour certaines études. Par exemple en pharmaco-épidémiologie, où les chercheurs disposent d’échantillons d’effectifs importants de sujets ayant un ou plusieurs critères d’intérêt. Le suivi des conséquences d’une autorisation de mise sur le marché de médicaments, les cas de maladies rares et les traitements très spécifiques nécessitent absolument les éléments du SNIIRAM.

Les scientifiques disposent d’autres sources d’informations comme la base de données du Centre d’épidémiologie des causes de décès de l’Inserm (CepiDc) ou l’Agence technique de l’information sur l’hospitalisation (ATIH). Pour les recherches plus spécifiques, concernant les individus présentant des caractéristiques de santé particulière, les chercheurs peuvent se tourner vers des registres de maladies —rares, congénitales ou cancers—, des certificats de santé de l’enfant, les fichiers de donneurs de sang ou produits reçus des patients…

Les données de santé sont donc une mine d’informations indispensables pour la recherche. Preuve en est que plusieurs pays ont déjà largement ouvert la voie avec la création, par exemple aux Etats-Unis, de ces « Population Data Centers » qui réunissent les données de la santé publique à l’intention des chercheurs.

Diane Cacciarella

 

Diane Cacciarella

  • Auteur :
  • Diane Cacciarella