U.E. Modèles stochastiques et simulations en biologie Page d'accueil

Responsables :

Sophie Lemaire, Nicolas Delpierre et Judith Legrand

Objectifs :

Comprendre les modèles stochastiques discrets classiques utilisés en biologie, savoir construire un modèle à partir d'un problème biologique, savoir effectuer une étude par simulations d'un modèle avec le logiciel R et interpréter les résultats de simulations.

Prérequis :

Notions de base sur les probabilités et les variables aléatoires discrètes, des rappels seront cependant donnés pendant le cours.

Descriptif :

Les modèles mathématiques en biologie permettent de formaliser et appréhender des phénomènes complexes afin de comprendre leurs fonctionnements et de prédire leurs évolutions. L'utilisation de modèles stochastiques (par opposition aux modèles déterministes) s'impose pour étudier un système où à chaque instant, plusieurs évolutions sont possibles, chacune d'elles ayant une certaine probabilité d'être réalisée ; c'est le cas par exemple, lorsqu'on étudie l'évolution des génotypes par croisements. L'utilisation de tels modèles stochastiques et leur analyse par simulations a considérablement progressé dans de nombreux champs d'application.

L'objet du cours est la présentation des outils nécessaires pour comprendre et simuler les modèles stochastiques discrets classiques utilisés en biologie. Lorsqu'il n'est pas nécessaire de connaître tout l'historique du système pour prédire son évolution future, mais que la connaissance du présent suffit, l'évolution du système peut être modélisée par un processus stochastique simple appelé chaîne de Markov qui sera étudié dans ce cours. Les chaînes de Markov sont utilisées dans de nombreux domaines de la biologie : évolution moléculaire, analyse de la répartition des nucléotides d'une séquence d'ADN, évolution des fréquences génotypiques au sein d'une population, épidémiologie des maladies infectieuses, dynamique des populations, dynamique d'un écosystème.

Exemples de modèles.

Wright-Fisher model
Simulation de l'évolution au cours des générations du nombre d'allèles A dans 4 populations, initialement identiques, composées de 30 individus diploides (modèle de Fisher-Wright sans sélection, ni mutation).

Plan du cours :

  1. Présentations de systèmes biologiques modélisés par des chaînes de Markov par un enseignant de biologie.
  2. Rappels et compléments en probabilités (probabilités conditionnelles, loi d'un vecteur aléatoire discret). Utilisation de R pour effectuer des calculs de probabilités.
  3. Présentation de la simulation stochastique et des outils probabilistes pour interpréter les résultats de simulations (loi des grands nombres, estimation et représentation graphique d'une loi empirique). Utilisation de R pour simuler le comportement d'un système biologique modélisé.
  4. Etude des modèles stochastiques appelés "chaînes de Markov"
    • Définition et exemples de chaînes de Markov ;
    • Etude de la loi d'une chaîne de Markov à espace d'états fini à l'aide du calcul matriciel (loi à un instant donné, lois invariantes) et applications notamment en bioinformatique ;
    • Etude du temps d'atteinte d'un état d'une chaîne de Markov à espace d'états fini et application en génétique et en dynamique des populations ;
    • Estimations des paramètres d'une chaîne de Markov à espace d'états fini.
  5. Etude par simulations de systèmes biologiques modélisés par une chaîne de Markov présentés par un enseignant de biologie (par exemple : évolution des fréquences alléliques, dynamique temporelle d'une épidémie dans une population de taille fixe, modélisation de la PCR, modélisation d'une réaction biochimique, évolution de la taille d'une population par naissance, décès et immigration, succession d'espèces dans un écosystème, modèle de type proie-prédateur).

Fonctionnement

Cours intégré avec des TD sur ordinateurs utilisant le logiciel R.
Des exercices à corrections automatiques et de documents interactifs sont mis à disposition dans une classe WIMS pour aider à l'assimilation du cours.

Ouvrages de référence

Les livres énumérés ci-dessous sont disponibles à la bibliothèque universitaire.
  1. Cours de probabilités
    • Bogaert P. "Probabilités pour scientifiques et ingénieurs. Introduction au calcul des probabilités", deBoeck (2005)
    • J-M et R Morvan "Bien débuter en probabilités, Exercices avec rappels de cours de probabilités discrètes", Cepadues
    • K. P. Baclawski, "Introduction to Probability with R", Chapman & Hall
  2. Ouvrages généraux sur la modélisation
    • Allman E. Rhodes J. "Mathematical models in biology", Cambridge University Press (2004)
    • Coquillard P., Hill D. "Modélisation et simulation d'écosystèmes", Masson (1997)
    • Istas J. "Mathematical modeling for the life sciences", Springer (2005)
  3. Chaînes de Markov et applications
    • Engel, A. "Processus aléatoires pour les débutants". Cassini (2011)
    • Ycart, B. "Chaînes de Markov"
    • Kimmel M., Axelrod D.E. "Branching Processes in Biology". Springer-Verlag (2002)
    • Tan Wai-Yuan, "Stochastic models with applications to genetics, cancer, AIDS and other Biomedical systems", World Scientific (2002)
  4. Ouvrages de Bioinformatique
    • Deonier R., Tavaré S. Waterman M. "Computational Genome Analysis", Springer (2005)
    • Robin S., F. Rodolphe, S. Schbath, "ADN, mots et modèles", Belin (2003)
  5. Site officiel de R



Logo
Département de Mathématiques
, Université Paris-Sud, Bât. 425, F-91405 Orsay Cedex ,France