Emilie Devijver

Room 02.32
Statistics Section
Department of Mathematics
Celestijnenlaan 200b - box 2400
3001 Leuven
Belgique
Téléphone : +32 16 37 42 96

Courrier électronique : emilie.devijver at kuleuven.be
Photo

Présentation     Publications     Travaux effectués     Enseignement     Communications orales

Dernières nouvelles :

  • En octobre, je vais rejoindre l'équipe AMA du Laboratoire d'Informatique de Grenoble !
  • Je donnerai un exposé sur l'alignement de données fonctionnelles via des modèles mixtes non-linéaires à ERCIM à Londres en décembre !

Présentation

Mes travaux se situent dans le cadre de l'apprentissage statistique, avec une approche méthodologique, théorique et appliquée.

Situation actuelle : je suis en postdoc à KU Leuven. Nous travaillons, avec Irène Gijbels et Gerda Claeskens, sur l'alignement de données fonctionnelles via un modèle mixte fonctionnel non linéaire.

Pour plus d'informations, voici un CV (mis à jour en février 2017).

Publications et prépublications

    Publications

  1. An l1-oracle inequality for the Lasso in finite mixture of multivariate Gaussian regression models, Emilie Devijver, ESAIM: PS 19 (2015) 649-670.
  2. Finite mixture regression: a sparse variable selection by model selection for clustering, Emilie Devijver, Electron. J. Statist. Volume 9, Number 2 (2015), 2642-2674.
  3. Model-based clustering for high-dimensional data. Application to functional data, Emilie Devijver, ADAC (2016), first online.
  4. Block-diagonal covariance selection for high-dimensional Gaussian graphical models, Emilie Devijver et Mélina Gallopin, JASA (2016), first online.
  5. Joint rank and variable selection for parsimonious estimation in high-dimensional finite mixture regression model, Emilie Devijver, accepté pour publication dans JMVA.
  6. Prépublications

  7. Clustering electricity consumers using high-dimensional regression mixture models, avec Yannig Goude et Jean-Michel Poggi, soumis.
  8. Nonlinear network-based quantitative trait prediction from transcriptomic data, Emilie Devijver, Mélina Gallopin et Emeline Perthame, soumis
  9. Mixed effects modeling with warping for functional data using B-spline, Gerda Claeskens, Emilie Devijver et Irène Gijbels, soumis
  10. Functional statistics for dynamic decision-making data, Emilie Devijver, Jean-Charles Quinton, Adeline Samson et Annique Smeding, en rédaction

Résumé des travaux de recherche effectués

    A. Modèles de mélange pour la régression en grande dimension, application aux données fonctionnelles.

    J'ai effectué ma thèse au laboratoire de mathématiques d'Orsay et au sein de l'équipe Inria Select. Elle était encadrée par Pascal Massart et Jean-Michel Poggi.
    La soutenance a eu lieu le 2 juillet 2015. Mon manuscrit est disponible ici.
    Dans ma thèse, j'ai développé deux procédures automatiques, appelées Lasso-MLE et Lasso-Rank, pour estimer un modèle de mélange en régression quand la réponse et les covariables sont de grande dimension.
    Ces procédures sont par exemple adaptées au cas d'une réponse et de covariables fonctionnelles.
    J'ai obtenu des résultats théoriques qui justifient l'utilisation de l'heuristique des pentes dans ces procédures, et l'utilisation de l'estimateur du Lasso pour ses propriétés de régularisation l1.
    En collaboration avec Yannig Goude, nous avons utilisé la procédure Lasso-MLE sur des données individuelles de consommation électrique. La figure ci-contre représente un échantillon de 5 consommateurs sur une semaine en hiver. Les classes obtenues par notre méthode sont pertinentes dans un objectif de prédiction.
    Photo

    Publications

  • An l1-oracle inequality for the Lasso in finite mixture of multivariate Gaussian regression models, Emilie Devijver, ESAIM: PS 19 (2015) 649-670.

  • Finite mixture regression: a sparse variable selection by model selection for clustering, Emilie Devijver, Electron. J. Statist. Volume 9, Number 2 (2015), 2642-2674.

  • Model-based clustering for high-dimensional data. Application to functional data, Emilie Devijver, ADAC (2016), first online.

  • Joint rank and variable selection for parsimonious estimation in high-dimensional finite mixture regression model, Emilie Devijver, accepté pour publication dans JMVA.
  • Prépublications

  • Clustering electricity consumers using high-dimensional regression mixture models avec Yannig Goude et Jean-Michel Poggi, soumis.
  • Code informatique

    Le code Matlab, développé avec Benjamin Auder, pour la procédure Lasso-MLE et pour la procédure Lasso-Rank est disponible : Selmix.
    Nous sommes en train de développer, avec Benjamin Auder et Benjamin Goehry, la version R, bientôt disponible sur le CRAN !

    B. Réseaux de régulation de gènes.

    Photo Photo Photo Photo

    Ce projet est en collaboration avec Mélina Gallopin et Emeline Perthame.
    Il s'agit d'étudier la structure en réseau des gènes.
    Dans un premier travail, nous avons proposé une procédure d'inférence en grande dimension, validée par un contrôle du processus empirique sous-jacent.
    La méthode a été utilisée sur un échantillon de 200 gènes, dont les relations sont résumées par les graphes ci-contre.
    Nous avons sur ce sujet gagné le prix du poster à la conférence Mathématiques, oxygène du numérique : voici le poster vulgarisant nos travaux !
    Dans un second travail, nous avons proposé une procédure de prédiction d'une variable continue à partir de l'expression génétique.
    La méthode tient compte de l'hétérogéneité des individus et de la structure en réseau des données génétiques.
    Avec Emeline Perthame, nous travaillons actuellement sur l'obtention de bornes de confiance et de bornes de prédiction dans ces modèles.

    Publication

  • Block-diagonal covariance selection for high-dimensional Gaussian graphical models, Emilie Devijver et Mélina Gallopin, JASA (2016), first online.
  • Prépublication

  • Nonlinear network-based quantitative trait prediction from transcriptomic data , Emilie Devijver, Mélina Gallopin et Emeline Perthame, soumis (2017)
  • Code informatique

    Le code R, développé avec Mélina Gallopin, associé à la méthode shock d'inférence de réseau est disponible sur le CRAN : shock.
    Le code R, développé par Emeline Perthame, associé à la méthode BLLiM de pré est disponible sur le CRAN : xLLiM

    C. Alignement de données fonctionnelles.

    Ce projet correspond à mes études postdoctorales, en collaboration avec Irène Gijbels et Gerda Claeskens.
    Il s'agit de modéliser la variabilité des données fonctionnelles.
    Par exemple, dans la figure ci-contre, on observe une variabilité en phase et une variabilité en amplitude (données pinch disponibles dans le package R fda).
    Dans ce cadre, nous utilisons une procédure itérative pour estimer les paramètres d'un modèle mixte fonctionnel non linéaire.
    D'un point de vue théorique, nous voulons obtenir la consistance et la normalité asymptotique des estimateurs.
    Photo
    D'un point de vue appliqué, je travaille avec Jean-Charles Quinton, Adeline Samson et Annique Smeding sur des données de mouse-tracking.
    On fait passer des tests à des enfants sur un ordinateur, et on enregistre les mouvements de la souris.
    Ces mouvements présentent de fortes variabilités, et le modèle issu de mes études postdoctorales pourrait aider à l'interprétation des variabilités.
    Dans un premier travail, nous avons considéré un modèle mixte fonctionnel linéaire, pour comprendre l'influence des diverses covariables.
    Dans un autre projet, en collaboration avec Madison Giacofci, Valérie Monbet et Marie Morvan, nous étudions des données de spectrométries.
    L'idée est de découper les spectres en intervalles intéressants, et de modéliser les variabilités avec un modèle mixte fonctionnel, pour expliquer une variable binaire (malade ou non malade).

    Prépublications

  • Mixed effects modeling with warping for functional data using B-spline, Gerda Claeskens, Emilie Devijver et Irène Gijbels, soumis

  • Functional statistics for dynamic decision-making data, Emilie Devijver, Jean-Charles Quinton, Adeline Samson et Annique Smeding, en rédaction
  • Code informatique

    Le code R associé à la méthode d'alignement de données fonctionnelles est disponible sur le CRAN dans le package warpMix.

Enseignement

À l'international

Cours magistral Statistical Inference pour des étudiants de L3 de mathématiques et de Master de statistique, à KU Leuven
Organisation d'une école d'hiver à l'université de Prishtina (Kosovo) sur la théorie des graphes
Organisation d'une école d'été à l'université de Prishtina (Kosovo) sur les statistiques asymptotiques

Pendant ma thèse

TD/TP de mise à niveau en mathématiques pour les M1 BIBS
Préparation au concours Agro en L2 biologie (oral et écrit)
TD en première année de l'école d'ingénieur Polytech Paris-Sud

Encadrement de projets

Encadrement de deux projets en Licence à KU Leuven (à propos de modèles graphiques gaussiens)
Encadrement de TER en L3 MFA à Orsay (sur le processus de Galton-Watson)

Popularisation et vulgarisation scientifique

Organisation d'une école de printemps à destination des lycéens du Kosovo, dans le cadre d'Animaths International, sur les probabilités
Préconférences dans des lycées dans le cadre du cycle de conférences Un texte, un mathématicien
Relectrice pour le journal MATh.en.JEANS

Quelques communications orales passées et à venir

Exposé à ERCIM, Londres (12/2017)
Poster à la conférence IWFOS (06/2017)
Exposés aux JdS, Avignon (06/2017)
Exposé et poster aux Journées MAS, Grenoble (08/2016)
Exposé aux JSM, Chicago (08/2016)
Exposé aux JdS, Montpellier (06/2016)
Workshop "New Developments in Functional and Highly Multivariate Statistical Methodology", Oberwolfach (02/2016)
Exposé à la conférence "Statistical learning", CIRM (02/2016)
Poster au "Working Group in Model-based Clustering, Seattle (07/2015)
Poster à IFCS Biennial Conference, Bologne (07/2015)
Exposé aux Séminaire Parisien (06/2015)
Exposé aux JdS, Lille (06/2015)
Workshop "Probabilistic Techniques in Modern Statistics", Oberwolfach (05/2015)
Exposé à MBC2, Catania (09/2014)
Exposé à ISNPSTAT, Cadix (06/2014)
Exposé aux JdS, Rennes (06/2014)
Exposé au colloque de Statistique Mathématique et Applications, Fréjus (09/2013)