Programme
M2 MathSV

AccueilInformationsAdmission

Descriptif complet des cours :

Prérequis : télécharger (pdf)

 Semestre 1

Tronc commun de 5 UE obligatoires + séminaire :

Concepts fondamentaux de la biologie et de l’écologie (M. El Karoui, C. Dillmann, S. Billard)

  • Biologie moléculaire et génomique (Meriem El Karoui)
  • Physiologie, métabolisme et développement (Christine Dillmann)
  • Ecologie et évolution (Sylvain Billard)

Processus stochastiques (S. Méléard, C. Graham)

Ce cours introduit les notions principales de probabilités concernant l’étude des processus à temps continu. Il développe en particulier la théorie des équations différentielles stochastiques et des diffusions et celle des processus de saut. Les exemples seront pour l’essentiel tirés des applications à la biologie. Les grandes parties du cours seront les suivantes.

  • Processus à temps continu
  • Processus de Markov
  • Martingales à temps continu, temps d’arrêt
  • Mouvement brownien et calcul stochastique
  • Equations différentielles stochastiques
  • Processus de saut pur et mesures ponctuelles de Poisson,
  • Processus de branchement à temps continu et processus de naissance et mort,
  • Théorèmes limites. Applications aux approximations continues des processus de saut.

Modélisation déterministe (B. Maury, H-H. Rugh, A. Decoene)

  1. Systèmes dynamiques (10h, Hans Henrik Rugh). Souvent l’évolution d’un système physique ou biologique se décrit à travers une équation différentielle ordinaire (edo) dans un espace de phase. Il est rare que l’on connaisse ses solutions exactes. Néanmoins, et surtout en petite dimension, il est souvent possible de décrire de façon qualitative les solutions à l’aide des points fixes et leur stabilité. Dans cette partie du cours nous allons étudier les notions de champ de vecteurs, points fixes, stabilité, bifurcation et branchement, comportement asymptotique et ensuite discuter des phénomènes de synchronisation et attracteurs. Les exemples étudiés vont inclure les modèles de Lotka-Volterra (proie-prédateur), Malthus, Verhulst, réponse immunitaire. Si le temps le permet nous allons aussi discuter des modèles à temps discrets qui souvent peuvent être obtenus à partir d’une ode, à l’aide d’une section de Poincaré
  2. Modélisation par équations aux dérivées partielles (14 heures, B. Maury). Ce cours propose une introduction poussée à la modélisation, dans un cadre déterministe, des phénomènes physiques qui conditionnement le fonctionnement des organismes vivants : transport, diffusion, modèles fluides utilisés pour les écoulements physiologiques, modélisation de fludies complexes (porteurs d’entités passives ou actives). Au delà d’une présentation de la démarche de modélisation elle-même, qui permet d’exprimer les principes physiques sous la forme d’équations au dérivées partielles, nous donnerons les outils d’analyse mathématique permettant de donner un cadre à certaines de ces équations. Une partie du cours sera consacrée aux aspects de simulation numérique, avec un accent particulier mis sur les problèmes liés au couplage de différents modèles.
  3. Principes et algorithmes en identifications de paramètres (6h, A. Decoene). En pratique un modèle différentiel ou aux dérivées partielles doit être validé et comparé aux mesures expérimentales. Certains paramètres physiques (taux de diffusion, transport, vitesse de réaction) ne sont pas toujours connus et doivent être identifiés. Cette identification doit être robuste au sens où l’ajout d’une nouvelle mesure ne devrait pas modifier fortement l’estimation. Parfois les quantités à identifier sont des fonctions elles-mêmes. Cette courte introduction présentera les bases du vaste sujet de l’identification paramétrique dans un cadre déterministe. On parlera notamment des problèmes de conditionnement, de régularisation, de pénalisation, d’introduction d’a prioris, et de résolution numérique des problèmes d’optimisations. On présentera un cas réel de détermination des temps de doublements de mélanoblastes lors du développement embryonnaire (utiles pour la compréhension des mécanismes de cancérisation).

Statistiques en grande dimension (C. Giraud, T. Mary-Huart)

Objectifs

L’objectif principal de ce cours est
de comprendre les problèmes posés par la grande dimension ;
de fournir des bases conceptuelles et méthodologiques solides, indispensables pour développer des analyses statistiques pertinentes et performantes ;
acquérir des techniques mathématiques fondamentales en vue d’une thèse.
Les différentes situations sont illustrées à l’aide d’exemples issus des sciences du vivant.

Contenu

La principale difficulté du statisticien face aux données du XXIe siècle est de vaincre le fléau de la grande dimension. Ce fléau oppose aux statisticiens deux difficultés : d’une part il rend les méthodes statistiques classiques totalement inopérantes par manque de précision, d’autre part il oblige à développer des approches gardant sous contrôle la complexité algorithmique des procédures d’estimation.

Nous verrons comment vaincre ce fléau dans un contexte général, puis comment rendre opérationnels ces concepts, avec une attention sur les frontières du possible.

Documents

Ce cours est basé sur l’ouvrage Introduction to High-Dimensional Statistics
Vous êtes invités à partager vos solutions aux exercices (en anglais !) sur le
wiki-site associé

Page web du cours : http://www.cmap.polytechnique.fr/~giraud/MSV/stats.html

Optimisation et simulation numérique (J. Chiquet, E. Khun, S. Faure)

  1. Optimisation (Filippo Santambrogio). Cette partie sera concentrée sur les problèmes d’optimisation convexe : descente de sous-gradient, méthodes proximales, dualité, méthodes primales-duales, etc.
  2. Algorithmes stochastiques (Estelle Kuhn). L’optimisation peut se faire sur des quantités dépendant de variables aléatoires, typiquement une vraisemblance. Compte tenu du caractère aléatoire, l’optimisation peut demander une simulation de ces variables selon une loi de probabilité difficile à expliciter. Nous verrons quelques méthodes bien adaptées à ce contexte de simulation et qui s’insèrent bien dans des algorithmes d’optimisation stochastique, en particulier l’algorithme Expectation Maximisation (EM) et ses variantes.
  3. Algorithmique et environnements de programmation pour le calcul scientifique (Sylvain Faure). Introduction au calcul scientifique par la résolution de modèles issus de la biologie. On verra comment réaliser des simulations numériques permettant de reproduire certains phénomènes biologiques (par exemple le chimiotactisme, l’évolution d’une population, l’invasion de crapauds buffles en Australie,…). Il s’agira de mettre en évidence ce que modélisent les différents termes présents dans les équations étudiées (termes de diffusion, de convection, de réaction, de mortalité,..) et de voir les effets des conditions aux limites du domaine de calcul (Dirichlet, Neumann, Robin). Les travaux pratiques proposés permettront également d’introduire certains aspects plus techniques : méthodes numériques (discrétisations spatiale et temporelle, résolution de systèmes linéaires,...), quelques outils de génie logiciel (structuration d’un code, temps de calcul, optimisation,…) ou de visualisation des résultats.

Page web du cours : https://sites.google.com/site/stephanieallassonniere/enseignements/mathsv

Séminaire hebdomadaire en biologie, écologie et médecine.

Découverte des grands thèmes actuels en science du vivant et des enjeux mathématiques associés. Exposé par un invité, suivi d’un compte rendu individuel.

 Semestre 2

Quatre spécialisations :

  • Ecologie et modèles d’évolution : responsable S. Méléard
  • Biologie des systèmes et apprentissage : responsable S. Robin
  • Biomécanique : responsable B. Maury
  • Mathématiques pour la neuroimagerie : responsable A. Desolneux

Chaque étudiant choisit en concertation avec un responsable (de spécialité ou du M2) un projet ainsi que 3 UE à valider au choix parmi les UE ci-dessous :

Modèles aléatoires de populations : comportement en temps long et limites d’échelles (S. Méléard, V. Bansaye)

Nous étudions dans ce cours des modèles aléatoires motivés par l’étude de systèmes vivants en interaction et centrés sur les dynamiques individuelles. Les individus naissent et meurent et sont caractérisés par différents types qui influent sur leur comportement ou, sur leurs capacités reproductives ou de survie, et peuvent être transmis dans la reproduction. Les interactions peuvent être de différentes natures : partages des ressources, proies-prédateurs, hôtes-parasites.

Nous illustrons tout d’abord cette approche en modélisant par un processus de naissance et mort la dynamique d’une population non structurée et montrons comment suivant les échelles choisies, ce processus peut être approché par une équation logistique déterministe ou une équation de Feller logistique.

Nous associons ensuite un type à chaque individu : caractères génétiques, âge ou quantité de parasites. La dynamique de la population est alors décrite par un processus (de naissance et mort- à valeurs mesures ponctuelles dont les atomes représentent les états des individus. Ce modèle est une première étape pour modéliser une dynamique darwinienne, décrivant une population capable de générer et de sélectionner sa propre diversité. Nous étudions diverses approximations macroscopiques de ce modèle, en grande population, conduisant soit à des équations aux dérivées partielles non linéaires (intégro-différentielle ou de réaction-diffusion), soit à un processus à valeurs mesures de type super-processus non linéaire. Dans chaque cas, nous étudions les propriétés du modèle limite en insistant sur les techniques propres à chaque type.

L’introduction d’une structure d’âge permet de prendre en compte l’histoire passée des individus pour décrire des phénomènes de sénescence par exemple. Il y a un phénomène de renouvellement lors des naissances, et nous pouvons établir un nouveau théorème limite mettant en évidence deux échelles de temps : celle de l’individu et celle de la population.

Nous étudions également un modèle hôte-parasite qui peut être représenté par une diffusion de Feller branchante. A partir de l’étude de l’évolution des parasites le long d’une lignée généalogique, des théorèmes limites concernant la fraction d’hôtes parasités sont établis. En particulier, les critères séparant les différents scénarii (cas sur ou sous-critiques) sont donnés.

Prérequis : Calcul stochastique, processus de Markov et théorèmes limites

Outils probabilistes et statistiques pour l’étude de la diversité génétique d’une population (A. Veber)

Nous commencerons par introduire le modèle d’évolution génétique le plus connu et le plus utilisé, à savoir le modèle de Wright-Fisher. Les arbres généalogiques (aléatoires) associés constituent un point de vue complémentaire et très informatif. En effet, leur forme et propriétés générales dépendent fortement des hypothèses faites sur la manière dont les individus se reproduisent, ce que nous verrons à travers des modèles plus généraux appelés modèles de Cannings. Ces modèles probabilistes nous donnent un cadre de travail dans lequel nous pouvons tenter de reconstruire des quantités d’intérêt telles que des taux de mutation, ou tester si la population réelle étudiée satisfait bien les hypothèses de neutralité et de panmixie à leur base. Pour finir, nous considèrerons une déviation possible de ces hypothèses : l’existence d’une structure spatiale (discrète ou continue).

Statistiques spatiales pour l’environnement (L. Bel)

La plupart des processus étudiés en environnement ou climat concernent une zone géographique et les données mesurées sont spatialisées. Que l’on cherche à prédire le processus en des sites non observés ou dans le futur, à le modéliser à l’aide ou non de covariables, la dépendance spatiale induite doit être identifiée et prise en compte. Dans ce cours on abordera les trois composantes classiques de la statistique spatiale : support continu (géostatistique), support discret (modèles sur réseaux) et support aléatoire (processus ponctuels). Les exemples d’application illustrant les différentes approches sont issus de la pollution, du climat, de l’écologie ou encore de l’agronomie.

  • géostatisque : variographie, krigeage, simulations conditionnelles
  • modèles sur réseaux : voisinages, indices de corrélation spatiale, champs de Gibbs-Markov, modélisation AR, modèles avec erreur spatialisée
  • processus ponctuels spatiaux : modèles et tests sur la répartition, processus marqués.

Modèles statistiques pour la génomique (S. Robin et E. Lebarbier)

La génomique a pour objet de comprendre le développement, l’organisation et le comportement de la cellule et, plus largement, de l’organisme à partir d’informations recueillies au niveau moléculaire. Ces informations sont obtenues par une grande variété de technologies qui ont en commun la grande dimension des données qu’elles produisent.

  • Méthodes de segmentation
    - Analyse des variations du nombre de copies d’ADN (CNV)
  • Modèles à espaces d’état et inférence par maximum de vraisemblance
    - Rappels sur les modèles à espace d’états
    - Rappels sur les modèles de mélange et algorithme E-M
    - Recherche d’une structure génétique dans une population
  • Modélisation de la dépendance des états cachés
    - Classification de données génomiques et modèles de Markov cachés / algorithme ’forward-backward’
    - Modèles ’Pair-HMM’ et alignement de séquence
    - Modèle mixte pour une population apparentée / génétique quantitative
  • Inférence par maximum de vraisemblance approchée
    - Introduction aux modèles graphiques Approximation variationnelle : algorithmes VEM et VB-EM
    - Recherche de structure dans un graphe d’interaction

Modèles Dynamiques en Biologie Cellulaire (B. Laroche)

L’objectif de l’enseignement est l’initiation à l’analyse, la conception et l’estimation à partir de données expérimentales de modèles dynamiques paramétriques en biologie, plus particulièrement à l’échelle de la cellule ou de la bactérie. Les modèles considérés sont des systèmes dynamiques d’équations différentielles ou d’équations aux dérivées partielles. L’accent sera mis sur

  • les problèmes posés par la conception et l’analyse de modèles dynamiques non linéaires,
  • les problèmes liés à l’estimation des paramètres de ces modèles à partir de données expérimentales, en particulier dans le cas de modèles de dimension paramétrique importante en présence de données peu nombreuses.

Le cours sera illustré par des exemples variés (modèles en neurosiences, réseaux de gènes, physiologie et écologie microbienne).

Notions mathématiques abordées et utilisées :

  • Systèmes dynamiques non linéaires
  • rappels de théorie des bifurcations.
  • base des perturbations singulières
  • Propriétés structurelles des systèmes dynamiques : positivité, observabilité identifiabilité
  • Simplification et réduction d’ordre ; application aux modèles de compartiments.
  • Formulation de problèmes d’estimation : maximum de vraisemblance, pénalisation, approches de gradient matching et bayésiennes. Le cours sera illustré par de nombreux exemples tirés de la biologie cellulaire et de problèmes de modélisation en écologie microbienne à partir de données de séquençage haut débit.

Méthodes à noyaux pour l’apprentissage (J. Mairal et J.P. Vert)

Many problems in real-world applications of machine learning can be formalized as classical statistical problems, e.g., pattern recognition, regression or dimension reduction, with the caveat that the data are often not vectors of numbers. For example, protein sequences and structures in computational biology, text and XML documents in web mining, segmented pictures in image processing, or time series in speech recognition and finance, have particular structures which contain relevant information for the statistical problem but can hardly be encoded into finite-dimensional vector representations.

Kernel methods are a class of algorithms well suited for such problems. Indeed they extend the applicability of many statistical methods initially designed for vectors to virtually any type of data, without the need for explicit vectorization of the data. The price to pay for this extension to non-vectors is the need to define a so-called positive definite kernel function between the objects, formally equivalent to an implicit vectorization of the data. The « art » of kernel design for various objects have witnessed important advances in recent years, resulting in many state-of-the-art algorithms and successful applications in many domains.

The goal of this course is to present the mathematical foundations of kernel methods, as well as the main approaches that have emerged so far in kernel design. We will start with a presentation of the theory of positive definite kernels and reproducing kernel Hilbert spaces, which will allow us to introduce several kernel methods including kernel principal component analysis and support vector machines. Then we will come back to the problem of defining the kernel. We will present the main results about Mercer kernels and semigroup kernels, as well as a few examples of kernel for strings and graphs, taken from applications in computational biology, text processing and image analysis.

Page web du cours : http://cbio.ensmp.fr/ jvert/svn/kernelcourse/course/2015mva/index.html

Modélisation du système respiratoire (B. Maury)

  • Description du système respiratoire humain.
  • Modèles mécaniques à un degré de liberté, identification des paramètres des modèles à partir d’expériences in vivo.
  • Le poumon humain vu comme un arbre résistif, notion de Laplacien discret, résistance équivalente.
  • Modélisation du processus de transfert de l’oxygène vers le sang, couplage des modèles mécaniques avec les modèles de diffusion et de réaction chimique (oxygène et hémoglobine).
  • Modélisation multiniveau de la ventilation (couplage de modèles fluides de type Navier-Stokes avec des modèles mécaniques simplifiés du parenchyme).
  • Questions d’optimalité (le processus tel qu’il existe répond-il à des critères d’optimalité ? )

Modélisation directe et inverse en hémodynamique (M. Fernandez)

Ce cours abordera quelques problèmes rencontrés en simulation numérique des écoulements sanguins. Une hiérarchie de modèles sera présentée :

modèles tri-dimensionnels de portions d’artère, incluant des effets d’interaction fluide-structure entre la paroi des vaisseaux et l’écoulement du sang ;
modèles mono-dimensionnels hyperboliques, permettant en particulier l’étude de la propagation d’ondes de pression dans un réseau artériel.
modèles « zéro-dimensionnels » pour une représentation globale du système cardiovasculaire, incluant des mécanismes de contrôle et de régulation.

Dans chaque cas nous mettrons l’accent sur des difficultés numériques d’intérêt général, dont la compréhension dépasse le cadre de l’hémodynamique (algorithmes de couplage multiphysique, conditions aux limites, estimation de paramètres à partir de mesure, etc.)

Page web du cours : http://team.inria.fr/reo/fr/cours-master-hemodynamique-numerique/

Modèles mathématiques aux dérivées partielles en sciences du vivant (L. Corrias)

De nombreux phéomènes dynamiques observés en sciences du vivant sont modélisés à l’aide d’équations ou de systèmes d’équations différentielles. Ainsi, pour commencer, nous allons brièvement montrer comment l’évolution de certains systèmes vivants se modélise sous la forme d’équations aux dérivées partielles lorsque l’on tient compte des variables physiques et physiologiques des individus ou des populations et de leur capacité d’interaction avec l’environnement. Ensuite, nous allons analyser qualitativement et quantitativement les modèles obtenus. Afin de de comprendre si le modèle mathématique reproduit la réalité biologique observée, les problématiques suivantes seront abordées : existence des solutions, positivité, comportement asymptotique en temps long, explosion, stabilité/instabilité, formation de motifs. Les méthodes employées relèvent des techniques d’analyse mathématique classiques, mais aussi des techniques plus spécifiques. En particulier, nous aurons l’occasion d’appliquer le théorème du point fixe de Banach, le principe du maximum, les méthodes d’énergie et les méthodes d’entropie, par exemple. Enfin, une liste non exhaustive des modèles que nous analyserons est la suivante : équations et systèmes d’équations de réaction-diffusion comme l’équation de Fisher/KPP (locale et non-locale), le système de Lotka-Volterra avec diffusion, le système de FitzHugh-Nagumo, le système de Gray-Scott ; le système d’équations de convection-diffusion, comme le système de Keller-Segel ; des modèles pour la dynamiques des populations structurées.
Prérequis : le cours « Modélisation déterministe » du 1er trimestre.

Imagerie fonctionnelle cérébrale et interface cerveau ordinateur (T. Papadopoulo, M. Clerc, B. Thirion)

Ce cours porte sur l’imagerie cérébrale fonctionnelle et son application à la réalisation d’interfaces cerveau-ordinateur à partir de deux techniques non-invasives qui permettent l’activité cérébrale.

la M/EEG mesure le champ électromagnétique créé par les courants électriques corticaux ;
l’IRM fonctionnelle qui mesure un signal (BOLD) lié à la consommation énergétique des aires cérébrales.

Plan du cours :

  • Notions de base de physique :
    - Équations de Maxwell : régime quasistatique, loi de Biot et Savart.
    - Modèles de source.
  • Problème direct et inverse en M/EEG :
    - Problème direct : résolution par éléments finis.
    - Débruitage des signaux M/EEG.
    - Problème inverse (MUSIC, Beamforming, Imaging).
    - Validation.
  • Analyse statistique de données fonctionnelles :
    - modèle linéaire, modèles à effets mixtes.
    - test d’hypothèses, tests non paramétriques, comparaisons multiples.
    - Inférence de modèles de connectivité, apprentissage de réseaux et apprentissage de covariance.
  • Vers des interfaces cerveau-ordinateur :
    - Communiquer via l’activité du cerveau.
    - Extraction et classification de caractéristiques pertinentes, sélection de modèle.
    - Rôle du feedback.

Page web du cours : http://www.math.ens-cachan.fr/versi...RH=1347885756500

Géométrie et espace de formes (A. Trouvé, J. Glaunes)

Ce cours a pour objectif de proposer une exposition introductive d’un point de vue géométrique sur les modèles déformables qui consiste à construire des métriques riemanniennes sur des espaces d’objets (n-uplet de points, courbes, regions binaires, surfaces, champ de tenseurs, images en niveau de gris, mesures etc) considérés commes des variétes de dimension finie ou infinie à partir de l’étude des déformations infinitésimales naturelles agissant sur ces objets.

Nous montrerons que la construction et l’étude de ces métriques, le calcul effectif des géodésiques dans ces espaces de formes et la compréhension des cartes exponentielles locales sont des questions d’une grande importance théorique et pratique. Nous verrons que ce point de vue géométrique unifie un grand nombre de questions importantes très concrètes : appariements denses à partir de points marqués ou de nuages de points, appariements de variétés, appariements difféomorphique d’images dans le cas de grandes déformations, métamorphoses automatiques entre images et ouvre des voies nouvelles pour la construction de modèles probabilistes de formes.

Si le cours s’attachera principalement à expliquer les outils et les concepts qui sont assez nouveaux dans le cadre du traitement d’images et les algorithmes associés, nous proposerons plusieurs illustrations dans le cadre médical pour l’analyse de la variabilité anatomique.

Pré-requis : Les outils mathématiques nécessaires seront introduits au fur et à mesure notamment en ce qui concerne la geometrie riemannienne, les groupes de Lie et la mécanique hamiltonienne.

Statistical computing on manifolds and data assimilation : from medical images to anatomical and physiological models (H. Delingette, X. Pennec)

Le cours développe les techniques d’analyse d’image médicales avancées utilisées en modélisation statistique et mécanique pour l’anatomie et la physiologie computationelle.

La page web du cours est la suivante : http://www-sop.inria.fr/asclepios/cours/MVA/Module2/index.htm

 Stage

Stage ou mémoire de 4 mois