Proposition de thèse : Weakly supervised deep learning for medical images classification and retrieval (Apprentissage profond faiblement supervisé pour la classification et la recherche des images médicales)


L’ED SISMI propose le sujet de thèse suivant :

Intitulé du sujet : Weakly supervised deep learning for medical images classification and retrieval (Apprentissage profond faiblement supervisé pour la classification et la recherche des images médicales)

Ce projet serait sous la direction de Chrisitine Fernandez-Maloigne de XLIM à l’Université de Poitiers

Co-directeurs renseignés : Olfa Ben Ahmed /

Les financements sont : non acquis

Le début de la thèse est prévu pour : Octobre 2019

Mots clés du sujet : Apprentissage profond, images médicales, recherche, classification, méta-learning, apprentissage non supervisé

Présentation du sujet : Au cours des dernières années, les approches d’apprentissage profond (deep learning) ont connu un grand succès dans le domaine de la vision par ordinateur [1]. Toutefois, l’apprentissage profond nécessite une quantité monstrueuse de données pour atteindre les performances souhaitées. Dans le domaine de la santé, la non disponibilité de grande quantité de données médicales constitue une barrière devant la réussite de telles approches [2]. En effet, la collecte et l’annotation des données médicales sont coûteuses car elles demandent l’intervention de plusieurs experts qui ne sont pas toujours disponibles pour effectuer l’annotation. En plus, les données médicales sont caractérisées par un déséquilibre dans la distribution des classes des sujets, i.e. un déséquilibre entre la quantité de données des sujets sains et celles des sujets malades surtout dans le cas de maladie rares. Il est donc nécessaire d’avoir des méthodes d’apprentissage profond qui seront capables d’apprendre à partir des données faiblement annotées et qui seront adaptés aux caractéristiques de ces données. La plupart des travaux de recherche en classification des images médicales passent par une étape de collecte et d’annotation des données par des experts à fin de tester leurs approches. L’objectif de cette thèse consiste principalement à proposer de nouvelles approches

Objectifs : En se basant sur l’idée que l’être humain est capable d’apprendre des concepts à partir de très peu d’exemples, l’objectif de cette thèse consiste à proposer de nouvelles approches d’apprentissage profond capables d’apprendre à partir de peu d’exemples. Le paradigme du méta-learning ou le concept de « learning to learn » [3] est à explorer dans cette thèse. Aussi, la détection de nouvelles classes parmi les observations non labellisées, ou parmi l’ensemble de test est un problème difficile dans le domaine médical. Il serait donc intéressant de proposer de nouvelles méthodes de classification afin d’apprendre rapidement de nouvelles classes avec peu d’exemples (Few-shot) voir sans exemples (Zero-shot) d’apprentissage surtout dans le cas des maladies rares. Dans une deuxième partie, les travaux de thèse aborderont le problème d’apprentissage des caractéristiques à partir des larges corpus multimodales très faiblement annotées pour des tâches de classification et de recherche d’information. Finalement, les performances des approches proposées seront comparées par rapport aux approches classiques de l’état de l’art. Des cas d’utilisations/applications pour l’aide au diagnostic de quelques pathologies seront étudiés en se basant sur les benchmarks de l’état de l’art.

Description du sujet : Au cours des dernières années, les approches d’apprentissage profond (deep learning) ont connu un grand succès dans le domaine de la vision par ordinateur [1]. Toutefois, l’apprentissage profond nécessite une quantité monstrueuse de données pour atteindre les performances souhaitées. Dans le domaine de la santé, la non disponibilité de grande quantité de données médicales constitue une barrière devant la réussite de telles approches [2]. En effet, la collecte et l’annotation des données médicales sont coûteuses car elles demandent l’intervention de plusieurs experts qui ne sont pas toujours disponibles pour effectuer l’annotation. En plus, les données médicales sont caractérisées par un déséquilibre dans la distribution des classes des sujets, i.e. un déséquilibre entre la quantité de données des sujets sains et celles des sujets malades surtout dans le cas de maladie rares. Il est donc nécessaire d’avoir des méthodes d’apprentissage profond qui seront capables d’apprendre à partir des données faiblement annotées et qui seront adaptés aux caractéristiques de ces données.
La plupart des travaux de recherche en classification des images médicales passent par une étape de collecte et d’annotation des données par des experts à fin de tester leurs approches. L’objectif de cette thèse consiste principalement à proposer de nouvelles approches d’apprentissage profond qui limitent ces dépendances aux grandes quantités d’images annotées pour des tâche de classification et de recherche d’images médicales pour l’aide à la décision clinique.
En se basant sur l’idée que l’être humain est capable d’apprendre des concepts à partir de très peu d’exemples, l’objectif de cette thèse consiste à proposer de nouvelles approches d’apprentissage profond capables d’apprendre à partir de peu d’exemples. Le paradigme du méta-learning ou le concept de « learning to learn » [3] est à explorer dans cette thèse. Aussi, la détection de nouvelles classes parmi les observations non labellisées, ou parmi l’ensemble de test est un problème difficile dans le domaine médical. Il serait donc intéressant de proposer de nouvelles méthodes de classification afin d’apprendre rapidement de nouvelles classes avec peu d’exemples (Few-shot) voir sans exemples (Zero-shot) d’apprentissage surtout dans le cas des maladies rares. Dans une deuxième partie, les travaux de thèse aborderont le problème d’apprentissage des caractéristiques à partir des larges corpus multimodales très faiblement annotées pour des tâches de classification et de recherche d’information. Finalement, les performances des approches proposées seront comparées par rapport aux approches classiques de l’état de l’art. Des cas d’utilisations/applications pour l’aide au diagnostic de quelques pathologies seront étudiés en se basant sur les benchmarks de l’état de l’art.

[1] Y. LeCun, Y. Bengio, and G. Hinton, “Deep learning,” nature, vol. 521, no. 7553, p. 436,
2015.
[2] Litjens, Geert, et al. « A survey on deep learning in medical image analysis. » Medical image analysis 42 (2017): 60-88.
[3] Mengye Ren, Sachin Ravi, Eleni Triantafillou, Jake Snell, Kevin Swersky, Josh B. Tenenbaum, HugoLarochelle, and Richard S. Zemel. Meta-learning for semi-supervised few-shot classification. InInternational Conference on Learning Representations, 2018.

Compétences acquises à l’issue de la thèse : Des compétences seront développées à l’issue du cette thèse notamment en analyse des données médicales et en apprentissage profond dans les bases faiblement annotées ainsi que des connaissances du milieu clinique à travers une collaboration avec des cliniciens et des radiologues de CHU de Poitiers.

Présentation de l’équipe d’accueil : L’équipe ICONES de l’institut XLIM, à l’Université de Poitiers, est reconnue pour ses travaux sur la modélisation et le traitement des images couleurs et spectrales. Les principaux thèmes de recherche de l’équipe ICONES incluent le traitement du signal, la représentation d’images multi-valuées, l’intégration de modèles du système visuel humain pour des approches de traitement d’images bio-inspirées, l’analyse et la classification d’images et des vidéos en particulier par des approches d’Intelligence Artificielle, la métrologie optique, la mesure d’intégrité et la sécurité des images ainsi que l’évaluation de la qualité d’images nD. Des membres de l’équipe participent à plusieurs comités de normalisation (AFNOR, ISO JPEG et MPEG, CIE divisions 1 et 8). Les applications relèvent principalement de la sauvegarde et la mise en valeur du patrimoine culturel et architectural, des industries culturelles et créatives et de plus en plus, ces dernières années, du domaine de la santé.

Compétences souhaitées pour les candidats : Diplôme :Titulaire d’un Master 2 Recherche et/ou d’un diplôme d’ingénieur en Informatique ou mathématiques appliquées ou d’un autre domaine connexe.
De bonnes connaissances en apprentissage automatique et en particulier l’apprentissage profond, vision par ordinateur
Programmation : Python/Matlab

Pour plus d’informations et pour candidater, merci de contacter :

Date de dépôt : 02/21/2019 à 10 h 31 min




ED SISMI