Comptes-rendus d’analyse et d’hospitalisation, courriers, imagerie médicale, photos, voire documents manuscrits… les données médicales brutes sont nombreuses, avec un potentiel d’information considérable. Encore faut-il pouvoir les exploiter. Car ces données ne sont pas structurées, c’est-à-dire non compréhensibles facilement par des machines. Jeune interne en chirurgie pédiatrique, Arthur Lauriot dit Prevost s'intéresse dans sa thèse à ces données. « C’est la partie immergée de l’iceberg, explique-t-il, car ces données (courriers, images, etc.) sont les plus nombreuses et le corps médical perd énormément de temps à y rechercher des informations ». Son projet vise justement à les transformer en données structurées afin de les rendre exploitables.
Il s'appuie pour cela sur l'expertise de trois unités de recherche lilloises. La première, l'équipe Santé publique : épidémiologie et qualité des soins¹, est capable de mettre au point, d'évaluer et d'utiliser des technologies d’analyse de données structurées, comme celles de l’entrepôt de données de santé² lancé début 2018 au centre hospitalier universitaire (CHU) de Lille. La seconde unité, le laboratoire Savoirs, textes, langage³, travaille sur le traitement automatisé du langage. Elle teste notamment des algorithmes visant à rechercher les informations pertinentes dans des documents en langage ordinaire, sur la base de concepts. Et enfin, la troisième, l'équipe Environnement périnatal et santé⁴, composée de cliniciens experts, pour caractériser l’information pédiatrique pertinente, et adapter au mieux ces outils.
Contraints de mener leurs recherches en parallèle de leur activité de médecin, assez peu d’internes en médecine parviennent à achever leur thèse de recherche. L’I-Site ULNE a donc mis en place pour la deuxième année consécutive un dispositif, les bourses Health PhD, dont bénéficie Arthur Lauriot dit Prevost. Elles leur permettent d’être soulagés de leurs activités cliniques pendant un an afin de mener à bien leurs travaux de recherche. Prochain appel prévu début 2020. :::
¹ (Univ. Lille)
² include-project.fr
³ (Univ. Lille/CNRS)
⁴ (Univ. Lille)