Snabbfakta

    • Nancy

Ansök senast: 2024-11-19

PostDoc en Traitement Automatique des Langues (H/ F)

Publicerad 2024-09-20

Informations générales

Intitulé de l'offre : PostDoc en Traitement Automatique des Langues (H/F)
Référence : UMR7503-JEALAM-003
Nombre de Postes : 1
Lieu de travail : VANDOEUVRE LES NANCY
Date de publication : mardi 13 août 2024
Type de contrat : CDD Scientifique
Durée du contrat : 24 mois
Date d'embauche prévue : 1 octobre 2024
Quotité de travail : Temps complet
Rémunération : 3021,5 Euros bruts mensuels, ajustable selon expérience
Niveau d'études souhaité : Niveau 8 - (Doctorat)
Expérience souhaitée : Indifférent
Section(s) CN : Sciences et données

Missions

Le projet RADID SUMINO (commandité par Agence Innovation Défense ou AID) prend place dans la thématique « Relations avec l’usager : systèmes d’automatisation des tâches répétitives et chronophages », et répond, de manière nouvelle, à une problématique connue et fréquente : la gestion multi-documents pour la recherche d’informations.

Dans ce projet de 24 mois, nous adressons cette problématique selon deux axes représentant les deux grands objectifs :

(1) créer un outil de résumé mono et multi-documents hybride basé à la fois sur l’apprentissage non supervisé et sur l’exploitation d’une ontologie du domaine ciblé,

(2) coupler cet outil à un moteur de recherche basé également sur des ontologies métier et avec un outil de suivi de sujets au cours du temps (analyse diachronique).

Activités

Le travail côté LORIA consistera à adapter des travaux de recherche menés dans l'équipe SYNALP pour produire des résumés automatiques extractifs sans connaissances, notamment d'adapter les travaux existants aux résumés extractifs multi-documents et aux résumés de texte court sans connaissances. Il s'agira également d'interfacer les méthodes de résumé extractif obtenues avec des méthodes basées sur les ontologies de manière à produire des résumés abstractifs.

Enfin, le travail réalisé devrait permettre, dans un second temps, de mettre en place des méthodes de suivi de sujets au cours du temps.

Compétences

Expérience clairement attendue en traitement automatique des langues (TAL):
- Manipulation usuelle des modèles des langues et des outils du TAL.

Bonne expérience générale en apprentissage par machine, notamment en apprentissage non supervisé:
- Maîtrise des modèles d'apprentissage explicatifs.

Maîtrise des langages/environnement de programmation :
- Python
-C/C++

Contexte de travail

Le travail se déroulera au LORIA et le candidat, s'il est sélectionné, sera intégré à part entière à l'équipe SYNALP. Il pourra donc bénéficier d’un environnement de recherche riche et solide, dans une équipe reconnue internationalement.

Il participera à des réunions de travail en distanciel et en présentiel avec la société AIRUDIT, partenaire du projet. Il participera éventuellement à des réunions de suivi de projet avec l'AID.

Contraintes et risques

La contrainte principale sera de tenir les délais imposés par le commanditaire du projet RAPID SUMINO, à savoir l'AID, qui assurera le contrôle des résultats décrits dans les délivrables du projet :

R1: Mise en place d'un résumeur extractif, sans connaissances fonctionnant en différents mode (documents courts, documents longs, multi-documents) (T0+12).

R2: Mise en place d'un processus de collaboration des résumeurs obtenus avec des approches basées sur les ontologies pour produire des résumés abstractifs (T0+18).

R3: Mise en place de méthodes de suivi de sujets (T0+24).

Liknande jobb

Publicerad: 2024-09-09
Publicerad: 2024-09-20
  • Stockport