Master2 MSV et MDA


Statistiques en grande dimension

Ce cours est délivré dans le cadre des Master 2 Statistiques et Machine Learning et Probabilités et Statistiques et Mathématiques du Vivant.

Objectifs

L’objectif principal de ce cours est Les différentes situations sont illustrées à l'aide d'exemples issus des sciences du vivant.

Contenu

La principale difficulté du statisticien face aux données du XXIème siècle est de vaincre le fléau de la grande dimension. Ce fléau oppose aux statisticiens deux difficultés : d'une part il rend les méthodes statistiques classiques totalement inopérantes par manque de précision, d'autre part il oblige à développer des approches gardant sous contrôle la complexité algorithmique des procédures d'estimation.

Nous verrons comment vaincre ce fléau dans un contexte général, puis comment rendre opérationnels ces concepts, avec une attention sur les frontières du possible.

Documents

Ce cours est basé sur l'ouvrage Introduction to High-Dimensional Statistics

book

Vous êtes invités à partager vos solutions aux exercices (en anglais!) sur le wiki-site associé.

Organisation du cours

DateTopic
Lecturer
ChapterSlidesExercisesFurther reading
Sept 25Curse of dimensionality, multiple testing
C.G.
Chap 8
Slides
8.6.3
Paper 1, Paper 2
Oct 02Finding structures: Model selection (1)
C.G.
Chap 1 and 2
Slides
2.9.1 (part A and B), 2.9.3
Paper 1 (Paper 1bis), Paper 2
Oct 9Model selection (2)
C.G.
Chap 2

2.9.4
Paper 1
Oct 17Convex criterion, Lasso (1)
C.G.
Chap 4

4.5.1, 4.5.5
Paper 1
Oct 23Lasso (2), other sparsity pattern
C.G.
Chap 4
Slides
4.5.7
Paper 1, Paper 2
Nov 6Examples
T. M-H


4.5.4
Nov 13Graphical Models
C.G.
Chap 7

7.6.6
Paper
Nov 20
Graphical models
C.G.
Chap 7

7.6.7
Nov 27
supervised classification (1)
T. M-H
Chap 9

9.5.1
Dec 4
supervised classification (2)
T. M-H
Chap 9



Emploi du temps: le mardi de 9h00 à 12h00 en salle 1A7, à l'Institut de Mathématiques d'Orsay (Accès)


Examens années passées

Dispos ici