Proposition de thèse : DAMIALab : indexation d’images


Thesis proposal : DAMIALab: image retrieval

L’ED SISMI propose le sujet de thèse suivant :

Intitulé du sujet : DAMIALab : indexation d’images

Ce projet serait sous la direction de Philippe Carré de XLIM à l’Université de Poitiers

Co-directeurs renseignés : Thierry Urruty / Arnaud Bour

Les financements sont : LabCom ANR

Le début de la thèse est prévu pour : 01/10/2022

Mots clés du sujet : indexation, image, apprentissage faiblement supervisé, IA

Présentation du sujet : Le laboratoire commun (LabCom DAMIALabs) proposé entre l’institut CNRS XLIM et l’entreprise Einden se positionne dans ce contexte de solutions DAM, avec comme question centrale l’indexation et la recherche de médias pour de grandes bases de données d’images thématiques ou associées à un fonds documentaire. Le défi scientifique et technique traité concerne le déploiement de solutions innovantes répondant de manière complémentaire à la problématique de l’indexation par le contenu. Plus précisément, nous proposons de concevoir et de déployer des méthodes provenant de l’Intelligence artificielle (IA) et de la fouille de données, permettant de caractériser, d’organiser et d’indexer les bases médias.

Objectifs : Méthodologiquement, nous proposons de nous appuyer sur des approches basées sur les images « brutes » ou sur une modélisation (avec une mise en concurrence) et d’exploiter des méthodes d’apprentissage automatique en intégrant notamment l’expert dans la boucle. Cette question de l’intégration de l’expert, de l’Active Learning, mais aussi de la construction de boucle de rétroaction suivant l’apprentissage par renforcement, constitue l’un des défis scientifiques traités au sein de ce LabCom.
Le projet scientifique et industriel envisagé se déploie suivant quatre axes et s’appuie sur les deux partenaires complémentaires.

Description du sujet : Depuis les années 2000, l’image et la vidéo numérique ont révolutionné le fonctionnement des métiers de la communication et du marketing. Le commerce, les marques, les services ou la culture ont progressivement basculé leurs communications vers le digital. Tous ces acteurs ont donc rapidement eu besoin d’un outil dédié à la gestion des médias numériques. Les solutions “DAM” ont d’abord intégré le savoir-faire des documentalistes et des archivistes. Puis, les solutions ont évolué vers la gestion de projets optimisant l’usage des actifs. Aujourd’hui, le cycle de vie des contenus médias s’est grandement accéléré avec des circuits multicanaux : e-commerce, catalogues, réseaux sociaux, etc.
Dans le cadre du LAbCom les principaux axes de développements à déployer durant la thèse seront :

Mots-clés : A ce jour, la solution Ephoto Dam propose déjà l’indexation automatiquement des mots-clés des images sur base de l’analyse de leur contenu. Mais il faut en passer par les API tiers des GAFA ce qui est exclu plus de 40% de la clientèle de la solution. L’enjeu est donc de proposer un système d’indexation automatique basé sur le fonds documentaire de chaque client. Cela permettrait de proposer une indexation automatique sans passer par un webservice tout en étant beaucoup plus précis qu’une indexation automatique type « big data », qui ne rentre pas scientifiquement dans chaque domaine d’activité de nos clients et reste peu pertinente pour eux. Avec une analyse adaptée à chaque fonds documentaire, la pertinence obtenue devrait permettre aux responsables des médiathèques de nos clients de se poser en chefs d’orchestre de l’intelligence artificielle de leur solution, plutôt qu’en correcteurs de son imprécision, pour obtenir un taux d’indexation automatique pertinente très élevée et libérateur de temps pour la valorisation des médias. Les technologies clefs impliquées concernent l’approche par apprentissage semi automatique, l’indexation interactive et l’apprentissage actif pour améliorer la qualification des images.
Requêtes augmentées clés
Les utilisateurs de la solution Ephoto Dam au sein d’une même organisation partagent souvent les mêmes besoins d’images à un instant t, de par l’actualité de leur entreprise ou de leur service. Également, certains utilisateurs ont des recherches récurrentes de par leur métier ou le poste qu’ils occupent. Dans un but de gain de temps, les requêtes augmentées permettraient de croiser de nombreuses statistiques et journaux d’usages pour proposer à chaque utilisateur une expérience de recherche personnalisée et prédictive en anticipant les recherches de l’utilisateur ou en lui proposant des rebonds pertinents à partir d’une première recherche. Les technologies clefs impliquées concernent les approches par apprentissage semi-automatique basées sur le contexte et le profil du client, l’analyse temporelle des journaux utilisateurs.

Compétences acquises à l’issue de la thèse : Traitement d’image, IA, apprentissage, Active Learning
Intégration et transfert technologique

Présentation de l’équipe d’accueil : L’institut CNRS Xlim (500 personnes) fait partie des laboratoires reconnus en sciences et techniques de l’information et de la communication (STIC) (notamment par le CNRS et dans le cadre des investissements d’avenir de type Labex ∑Lim et EUR TACTIC) et possède la maitrise de toute la chaine numérique au travers de ses différentes équipes. Les compétences des chercheurs vont des mathématiques appliquées à l’électronique en passant par l’optique, la photonique et l’informatique. Au sein d’Xlim, l’équipe Icones en lien avec ce projet de LAbCom (30 chercheurs permanents et non permanents) a organisé ses activités autour du traitement, de la caractérisation et de l’analyse des images et vidéos. La force et l’originalité de l’équipe au regard du contexte national et international sont liées au fait que l’équipe étudie toute la « chaîne de vie » d’une image ou vidéo. Elle développe ainsi une expertise de haut niveau concernant la caractérisation des images et possède de sérieuses connaissances reconnues dans le domaine de l’image numérique et des stratégies d’apprentissage.

Compétences souhaitées pour les candidats : IA, image, programmation

Pour plus d’informations et pour candidater, merci de contacter :

Date de dépôt : 05/04/2022 à 21 h 50 min




ED SISMI