<! -- joue sur les accordéons : on peut fermer un soufflet sans que d'autre ne s'ouvre --> <! -- Pour avoir les accordéons fermés par défaut -->

Master Informatique – Parcours : Machine Learning pour la Science des Données (MLSD)

Présentation

Aujourd’hui, les décisions stratégiques des dirigeants d’entreprise, des scientifiques, des économistes ou encore des experts en santé reposent sur l’analyse de données massives et multi-vues (textes, images, séries temporelles, etc.), au cœur de la science des données. Ces données, souvent brutes et hétérogènes, constituent le carburant des intelligences artificielles modernes, qu’il s’agisse d’IA générative, de NLP (traitement automatique du langage), de computer vision, ou de systèmes multimodaux combinant plusieurs types de données. Or, pour en exploiter pleinement le potentiel, une ingénierie des données méthodique, combinée à des algorithmes de machine learning, est indispensable. Cette approche, centrale en science des données, permet de transformer les données brutes en informations stratégiques et exploitables.

OBJECTIFS

C’est précisément l’objectif du Master « Machine Learning pour la Science des Données » proposé en alternance (FA) et en formation initiale (FI) : former des experts capables de maîtriser les compétences clés suivantes :

  • Les fondamentaux du data engineering pour la gestion et l’optimisation des pipelines de données.
  • Les méthodes d’apprentissage machine (supervisé, non supervisé, semi-supervisé).
  • Les applications sectorielles : NLP pour le texte, computer vision pour l’image, systèmes multimodaux pour des analyses croisées, ou systèmes de recommandation.
  • Les enjeux des données massives non structurées et de l’IA responsable.

Programme

ORGANISATION

Organisation de la rentrée -> lien direct

Le M1 est organisé en deux semestres comprenant, en plus des enseignements communs avec les autres parcours, des UE spécifiques au parcours AMSD.

En master M2, les enseignements dispensés sont consacrés exclusivement à l’Apprentissage Machine, l’intelligence artificielle et la science des données, l’UE Anglais est également dispensée. Pour répondre efficacement aux objectifs de la formation, tous les enseignements se déroulent dans une salle machine.

Missions en entreprise et projets tutorés

La formation requière la réalisation d’un projet tutoré en première année. Le projet tutoré est programmé en second semestre. Plusieurs sujets sont proposés et s’articulent autour de l’apprentissage machine, l’intelligence artificielle et la science des données.

Cette formation en alternance (M1 et M2) requière un contrat en apprentissage ou de professionnalisation d’une durée de 1/2 an(s) au cours duquel plusieurs missions sont confiées à l’apprenti. La soutenance du stage et le rapport de mémoire en M1 et M2 clôturent la fin de l’année en juin. Un projet tutoré pluridisciplinaire est également proposé dès le mois de février ; il est évalué par un rapport et une soutenance.

Répartition des cours – Master 1
Semestres 1 - 30 ECTS
Programmation pour la science des données - 9 ECTS
programmtion avancée-Python et R
Programmation web
Programmation distribuée
Mathématiques pour Machine Learning - 9 ECTS
Statistique/probabilités
Optimisation pour l’apprentissage machine
Reconnaissance des formes
Sciences des données - 9 ECTS
Apprentissage supervisé I
Dimensionality reduction I
Time series I
Data engineering - 3 ECTS
Cloud Computing
Technologies de Conteneurisation
Semestres 2 - 30 ECTS
Big Data Analytics - 3 ECTS
Machine Learning - 9 ECTS
Clustering et Réduction de la dimension
Text mining et NLP
Deep Learning I
Droit et communication - 3 ECTS
Droit informatique
Analyse et Restitution
Projet et Recherche - 3 ECTS
Projet PludriDisciplinaire (PDD)
Anglais
Mission en entreprise - 12 ECTS
Répartition des cours – Master 2
Semestres 3 - 30 ECTS
Accompagnement - 0 ECTS
Mise à niveau et Business Intelligence
Apprentissage non supervisé - 9 ECTS
Clustering
Mixture models
Factorisation and Recommendation
Dimensionality reduction II
Apprentissage et décision - 12 ECTS
Supervised learning II
Reinforcement learning
Time series II
Deep Learning II
Graph learning
Natural Language Processing (NLP) - 6 ECTS
Generative AI
Reinforcement learning
Data embedding and learning
Data engineering - 3 ECTS
Big Data Analytics
Packaging
Semestres 4 - 30 ECTS
Projet et Recherche - 12 ECTS
Projet PludriDisciplinaire (PPD)
Anglais
UE Mission en entreprise - 18 ECTS

Admission

Ce master est destiné aux titulaires d’une licence Informatique, licence mathématiques appliquées ou équivalents avec un bon niveau en statistiques et calcul matriciel. Les candidatures de licence Mathématiques avec une compétence en informatique attestée par l’obtention d’UE spécifiques à la programmation et aux bases de données sont également étudiées.

Prérequis pour entrer en M1 : Licence d’informatique ou validation d’acquis personnels et professionnels (VAPP D. 23/08/1985)

Prérequis pour entrer en M2 : Master 1 en informatique ou Master mathématiques appliquées avec des pré-requis en science des données, diplôme d’ingénieurs ou validation d’acquis personnels et professionnels (VAPP D. 23/08/1985)

Candidatures

Dossier de candidatures :

  • Lettre de motivation (document obligatoire)
  • Curriculum vitae complet (document obligatoire)
  • Photocopie des relevés de notes bac et post bac (document obligatoire)
  • Lettre de recommandation (document facultatif)
  • Dossier VAPP85 (le cas échéant)

Période des candidatures : entre mars et juin
Période des entretiens : mai

Pour candidater en MASTER 1, rendez-vous à l’adresse suivante pour accéder à la plateforme Mon Master : https://monmaster.gouv.fr/formation
Document utile : Procédure Mon Master

Pour candidater en MASTER 2, rendez-vous à l’adresse suivante pour accéder à la plateforme eCandidat Université Paris Cité à partir du 1er avril: https://ecandidat.app.u-paris.fr/sciences1/#!offreFormationView
NB : Afin de pouvoir candidater, il vous sera nécessaire de créer un compte eCandidat si cela n’est pas déjà fait. Pour cela, rendez-vous à l’adresse suivante : https://ecandidat.app.u-paris.fr/sciences1/#!candidatCreerCompteView

 

Vous retrouverez le parcours sous l’onglet INFORMATIQUE (UFR SCIENCES FONDAMENTALES ET BIOMEDICALES) > Master > Parcours – cf illustration ci-dessous :

Et après

POURSUITE D’ÉTUDES

Avec le master MLSD, vous pouvez ensuite si vous le souhaitez poursuivre vos études en doctorat et réalisé ainsi une thèse en contrat doctoral ou CIFRE en partenariat avec une entreprise ; ce qui correspond à une sorte d’alternance en doctorat.

PASSERELLE

A l’issue de la première année, une réorientation en seconde année vers un autre parcours du Master Informatique est envisageable à l’appréciation du responsable du parcours concerné.

TAUX DE RÉUSSITE

90% en M1, 98% en M2 (FI), 100% (FA)

INSERTION PROFESSIONNELLE

Avec ce master et en tant que data scientist vous pouvez intégrer petites, moyennes et grandes entreprises dans divers secteurs. Voici une liste de métiers auxquels vous pouvez aussi prétendre : Data Engineer, Data Analyst, Architecte et Développeur d’outils d’analyse de données, Concepteur/Développeur de modèles mathématiques/statistiques, Ingénieur Recherche & Développement.

Contacts

Responsable du diplôme et du M2
Mohamed Nadif
mohamed.nadif@u-paris.fr

Responsable du Master 1
Lazhar Labiod

Coordinatrice pédagogique
Séverine Affeldt

Responsable de pôle alternance
Karima Doukkali

Site CFA numiA

Responsable administratif et pédagogique
Aline Dodeman
aline.dodeman@u-paris.fr

En bref

Composante(s)
UFR des Sciences fondamentales et biomédicales

Niveau d’études visé
BAC +5

Durée
2 ans

ECTS
120

Modalités de formation

  • Formation initiale
  • Formation continue
  • Formation en alternance

Validation des Acquis de l’Expérience
Oui

Langue des enseignements
Français

Lieu de formation
Campus Saint Germain des Prés

Pour en savoir plus, rendez-vous sur > u-paris.fr/choisir-sa-formation

Index