AI / Machine Learning Research Intern (x/f/m)
Doctolib développe des solutions innovantes pour améliorer l'accès aux soins et la qualité de vie des professionnels de santé. Dans le cadre de notre engagement pour une intelligence artificielle responsable, nous recherchons un.e stagiaire M2 pour évaluer les biais dans un système de dialogue en pédiatrie par l'analyse des conversations entre l'IA et les patients.
En collaboration avec les data scientists de Doctolib et les chercheurs du LISN (Université Paris-Saclay), vous contribuerez à garantir l'équité et la fiabilité de nos solutions d'IA appliquées à la santé. L'un des objectifs clés de ce stage sera la création d'un jeu de données annoté et anonymisé qui sera publié en open-source. Ce stage de 5 mois vous permettra de travailler sur un projet à fort impact sociétal, à l'intersection du traitement automatique des langues, de la santé et de l'éthique de l'IA.
Vos responsabilités incluent, mais ne sont pas limitées à :
- Réaliser une revue de la littérature sur les méthodes d'évaluation des biais dans les modèles de langue appliqués à la santé
- Analyser un corpus de dialogues anonymisés entre le système d’IA et les parents/patients en pédiatrie pour identifier les biais potentiels
- Définir et mettre en œuvre un schéma d'annotation pour caractériser les biais identifiés
- Construire un cadre d'évaluation s'appuyant sur une évaluation désagrégée par caractéristiques démographiques
- Appliquer ce cadre au système de dialogue et comparer les résultats avec d'autres modèles auto-régressifs
Avant de poursuivre votre lecture, si vous n'avez pas le profil exact décrit ci-dessous, mais que vous pensez que cette description de poste correspond à vos compétences et à vos aspirations, nous vous encourageons tout de même à postuler.
Vous pourrez être le prochain membre de notre équipe si vous :
- Maîtrisez Python et l'écosystème de traitement des données (pandas, scikit-learn)
- Êtes familier avec les modèles de langue et les bibliothèques associées (HuggingFace Transformers, vLLM ou équivalent)
- Possédez d'excellentes capacités de rédaction scientifique en français et en anglais
- Êtes en fin de Master 2 (professionnel ou recherche) ou d'école d'ingénieur
- Démontrez un intérêt pour les questions d'équité et de biais en intelligence artificielle
Ce serait fantastique si :
- Vous avez des connaissances en traitement automatique des langues, notamment en évaluation de modèles
- Vous possédez une expérience avec des cadres d'évaluation (benchmarks, métriques)
- Vous avez une sensibilité au domaine médical ou de la santé
- Des tickets restaurant d'une valeur de 8,5 € par jour, dont 4,5 € pris en charge par Doctolib
- Un programme d'intégration complet de 3 mois incluant la Doctolib Academy et diverses formations (langues, soft skills, compétences techniques)
- Une subvention du comité d'entreprise pour le remboursement partiel d'adhésions à des activités sportives ou de loisirs
- Un remboursement à 50% de l'abonnement aux transports en commun
- Codingame en ligne
- Entretien avec notre Talent Recruiter (30 minutes)
- Entretien avec Nicolas, notre Principal Data Scientist (30 minutes)
- Entretien avec LISN (60 minutes)
- Stage
- Temps Plein
- Levallois-Perret (Doctolib) et Orsay (LISN)
- Prise de poste : dès que possible
- Durée : 5 mois
Chez Doctolib, nous sommes convaincus que nous devons améliorer la santé pour tout le monde. Cela se reflète dans notre processus de recrutement. Nous évaluons les candidatures uniquement sur la base des qualifications et de la motivation, sans aucune forme de discrimination.
Plus les idées sont diverses, plus notre produit améliorera véritablement la santé pour tout le monde. Vous pouvez postuler chez Doctolib, quel que soit votre genre, religion, âge, orientation sexuelle, origine ethnique ou handicap.
Afin de garantir l'égalité des chances, nous vous invitons à exclure les informations personnelles (par exemple : photos, âge) de vos candidatures. Si vous avez besoin d'aménagements particuliers, merci de nous en informer pour que nous puissions adapter le processus de recrutement. Rejoignez-nous pour construire la santé dont nous rêvons tous !
Toutes les informations fournies sont traitées par Doctolib pour la gestion des candidatures. Pour plus de détails sur le traitement des données, cliquez ici. Veuillez contacter hr.dataprivacy(at)doctolib.com pour toute question ou pour exercer vos droits.