Christine Keribin:
Activités de recherche
- En délégation CNRS (2019-2020)
- Membre de l'équipe probabilités et statistiques du Laboratoire de
Mathématiques d'Orsay,
UMR 8628
- Membre du projet CELESTE
de INRIA Sacaly
- Membre du GDR Statistiques
et Santé depuis 2015
- Ancien membre du groupe SONATA (Stress Orphean Network and
Transcriptome
in Arabidopsis)-Stats, avec l'INRA/URGV
- Bénéficiaire en 2013 d'un semestre de décharge d'enseignement financé par le LabEx Mathématique
Hadamard (ANR-11-LABX-0056-LMH du Programme des Investissements
d'Avenir)
HDR soutenue le 26 novembre 2019
Mémoire de
thèse, 1999
Mots-clés
- classification non supervisée (clustering) et croisée
(co-clustering)
- modèles de mélange, modèle des blocs latents
- algorithmes d'estimation, méthodes variationnelles, modèles
bayésiens
- sélection de variables, choix de modèles
- apprentissage statistique, grande dimension, données
volumineuses
- modélisation applicative: neuroimagerie, génomique,
pharmacovigilance, fiabilité
Thèmes actuels
- Co-clustering et
données de grande dimension
avec
Christophe Biernacki (Inria-Modal)
- Co-clustering,
une méthode de régularisation du
clustering en grande dimension
- Apprentissage
non supervisé de données
volumineuses sous contrainte de ressources limitées (bourse
de thèse DGA Filippo Antonazzo)
avec Gilles Celeux (INRIA Saclay)
- Passage à l'échelle du modèle des blocs latents multiples
- Sélection de modèle
- Etude asymptotique des critères ICL et BIC dans le modèle de
blocs latents
- Applications industrielles
Avec Gilles Stoltz (Paris Sud) et SNCF (thèse Cifre Rémi
Coulaud)
- Prévision du temps d’échange lors du stationnement des trains
en gare
Avec Patrick Pamphile (Paris Sud) et PSA (thèse Cifre Oivier
Coudray)
- Construction d'un critère probabilisé de fatigue multiaxiale
Théorie et méthodologie
- Modèle des blocs latents pour la classification croisée
Avec Gilles Celeux (INRIA-SELECT) et Gérard Govaert
(UTC):
- modèle des blocs latents multinomial,
identifiabilité, algorithmes variationnels et bayésiens, sélection de
variables et choix de modèles, ICL, applications à des données
génomiques (projet SONATA, INRA et URGV)
Avec Vincent Brault (Université de Grenoble) et Mahendra Mariadassou
(INRA-MaIAGE)
- Propriétés asymptotiques des estimateurs dans le modèle de
blocs
latents
- Méthodes (bayésiennes) variationnelles
De la théorie aux applications
Modélisation de données applicatives
- Détection d’effets secondaires médicamenteux à partir de
bases de pharmacovigilance
avec Gilles Celeux (INRIA-SELECT) et Pascale
Tubert-Bitter (INSERM), thèse Valérie Robert: modèle des blocs latents
multiples, propriétés
et algorithmes d’estimation, sparsité et données massives
- Etude statistique des altérations génomiques tumorales
avec Yves Rozenholc (INRIA-SELECT) et Tatiana Popova
(Institut Curie): Estimation de la ploïdie et du degré de contamination
à partir
de données CGH , modélisation par modèle de mélange et algorithme
d’estimation
- Application des statistiques aux neurosciences
avec Gilles Celeux (Inria-Select) et Bertrand Thirion (Inria-Parietal),
thèse Vincent Michel:
Décodage de l'activité cérébrale à partir de cartes d'activation d'IRM
fonctionnelle; classification et régression en grande dimension
- Reconstruction d'arbres en phylogénie : inférence
statistique
et
algorithmes
avec Marie-Anne Poursat (LMO, Université Paris Sud)
Doctorant.e.s
- Filippo Antonazzo, co-direction avec Christophe Biernacki (Inria-Modal), Unsupervised learning of huge datasets with limited computer resources. Bourse DGA, démarrage en octobre 2019
- Olivier Coudray, co-direction avec Patrick Pamphile (Université Paris Sud). Construction d'un critère probabilisé de fatigue multiaxiale. Thèse Cifre PSA, démarrage en novembre 2019
- Rémi Coulaud, co-direction avec Gilles Stoltz (Université Paris Sud), Prévision de temps d’échange lors des stationnements de trains en gare. Thèse Cifre SNCF, démarrage en octobre 2019
- Valérie
Robert
(soutenue le 06/06/2017), codirection avec Gilles Celeux : Modèles
statistiques pour la
pharmacovigilance
- Vincent
Brault (soutenue le 30/09/2014), codirection avec Gilles Celeux : Estimation et
sélection de modèle
pour le modèle des blocs latents
- Vincent Michel (soutenue en 12/2010), codirection avec Bertrand
Thirion et
Gilles Celeux : Understanding the
visual
cortex by using classification techniques
Publications
- Brault V., Keribin
C., Mariadassou M.: Consistency and Asymptotic
Normality of Latent Blocks Model Estimators,
http://arxiv.org/abs/1704.06629, (soumis)
- Keribin C.: A note on BIC
and the slope heuristics, Journal de la SFdS,
Vol. 160 No. 3, 2019, pp 130-148, 2019
- Keribin C., Liu Y.
Popova T., Rozenholc Y.: A mixture model to characterize genomic
alterations of tumors, Journal de la SFdS, Vol. 160 No.1, pp 130-148, 2019
- Hernandez C., Keribin C., Drobinski P., Turquety S.: Statistical
modelling of wildfire size and intensity: a step toward
meteorological forecasting of summer extreme fire risk Annales
Geophysicae, 33 (1495–1506), DOI=10.5194/angeo-33-1495-2015, 2015
- Keribin C., Brault V., Celeux G., Govart G.:
Estimation and Selection for the Latent Block Model on Categorical
Data, , Statistics and Computing, DOI
10.1007/s11222-014-9472-2, online 2014
- Michel V., Gramfort A., Varoquaux G.,Eger E., Keribin C.,
and Thirion B.: A supervised clustering approach for fMRI-based
inference of brain
states, Pattern Recognition - Special Issue on Brain Decoding,
45(6): 2041-2042, 2012
- Michel V., Eger E., Keribin C. and Thirion B.: Multi-Class
Sparse Bayesian Regression for fRMI-based prediction,
International Journal of Biomedical Imaging 2011
- Keribin C.: Méthodes
bayésiennes variationnelles : concepts et applications en neuroimagerie
Journal de la Société Française de Statistiques, Vol. 151 No.2, pp 107-131, 2010
- Keribin C., Haughton D.:
Asymptotic probabilities of over-estimating and under-estimating the
order of a model in general regular families,
Communications in Statistics, Theory and Methods, vol 32-7, pp
1313-1404, 2003
- Gassiat E. , Keribin C.: The Likelihood Ratio Test
for the number of components of a mixture
with Markov regime , ESAIM PS, Vol. 4, pp 25-52, 2000
- Keribin C.: Consistent Estimation of the Order of
Mixture Models, Sankhya Series A, volume 62, Part. 1, pp 49-66, 2000
- Keribin C.: Estimation consistante de l’ordre de
modèles de mélange, CRAS Série I, 326(2), 1998
Actes de conférences
- Keribin C., Biernacki C: Le modèle des blocs latents, une méthode régularisée pour la classification en grande dimension, 51èmes Journées de Statsitique, Nancy, 2019
- Keribin C.,
Celeux G.,
Robert V.: The Latent Block Model: a useful model for high dimensional
data, ISI 2017, 61st World Statistics Congress, Marrakech, Maroc, 2017
- Brault V., Keribin C.,
Mariadassou, M.: Équivalence asymptotique des vraisemblances observée
et complète dans le modèle de blocs latents, XXIV èmes Rencontres de la
Société Francophone de Classification, Lyon, 2017
- Brault V., Keribin C., Mariadassou M.: Normalité
asymptotique de l'estimateur du maximum de vraisemblance dans le modèle
de blocs latents, in 48èmes Journées de
Statistique, Montpellier, 2016
- Robert V., Celeux G., Keribin C.: Modèle des
blocs latents et sélection de modèles en pharmacovigilance, in
48èmes Journées de
Statistique, Montpellier, 2016
- Liu Y., Keribin C.,
Popova T., Rozenholc Y.: Statistical
Estimation of Genomic
Tumoral Alterations, in 47èmes Journées de Statistique, Lille, 2015
- Robert V., Celeux G., Keribin C.: Un modèle
statistique pour la pharmacovigilance, in 47èmes Journées de
Statistique, Lille, 2015
- Keribin C.: L’utilisation
des logiciels dans les enseignements de statistique à l’université,
in 46èmes Journées de
Statistique, Rennes, 2014
- Keribin C., Brault V., Celeux G., Govart G.:
Estimation and Selection for the Latent Block Model on Categorical
Data, , Rapport de recherche INRIA, 2013
- Keribin C., Brault V., Celeux G., Govart G.: Model
selection for the binary latent
block model,
in Proceedings of COMPSTAT 2012
- Brault V., Celeux G., Keribin C.: Régularisation
bayésienne du modèle des blocs latents,
in 44èmes Journées de Statistique, Bruxelles, 2012
- Keribin C., Govaert G., Celeux G.: Estimation
d’un modèle à blocs latents par l’algorithme SEM,
in 42èmes Journées de Statistique, Marseille, 2010
- Michel V., Eger E., Keribin C., Poline J.-B. and
Thirion
B.: A supervised clustering approach for extracting predictive information
from brain activation images,
in IEEE Computer Society Workshop on Mathematical Methods in Biomedical
Image Analysis (MMBIA10) - IEEE Conference on Computer Vision and
Pattern Recognition, 2010.
- Michel V., Eger E., Keribin C. and Thirion B.:
Multi-Class Sparse Bayesian Regression for Neuroimaging data analysis,
in International Workshop on Machine Learning in Medical Imaging (MLMI)
In conjunction with MICCAI 2010
- Michel V., Eger E., Keribin C. and Thirion B.: Adaptive
multi-class bayesian sparse regression - an application to brain
activity classification, In MICCAI'09 Workshop on Analysis of
Functional Medical Images, 2009
Exposés invités
- Asymptotic criteria for model selection in the latent block model, MHC2020, Orsay, June 17-19, 2020
- EM and its variations: theory, methodology and applications, JSTAR2020, Rennes, March 26-27, 2020
- Some asymptotic properties of model selection
criteria in the latent block model, 12th Scientific meeting CLADAG
2019, Cassino (Italie), 2019
- Co-clustering: a versatile way to perform clustering in high dimension,11th
International Conference of the ERCIM WG on Computational and
Methodological Statistics (CMStatitistics 2018), Pisa, Italy, December,
2018
- The Latent Block Model: a
useful model for high dimensional
data, ISI 2017, 61st World Statistics Congress, Marrakech,
Maroc, 2017
- Méthodes Bayésiennes
Variationnelles: Journée spéciale du groupe Statistique
Mathématique de la SFdS, Paris, 2017
- Model selection with
intractable likelihood, ERCIM, Londres 2013
Mini cours invité
- Variational Bayes methods and algorithms, CIRM, Marseille, dans le cadre de la Semaine Bayésienne, mars 2016
Autres exposés
- Aggregating strategies for
online protfolio optimization, CMStatistics 2017, Londres
- Asymptotic normality of the
maximum
likelihood estimator for LBM : COMPSTAT2016 (Oviedo, Espagne);
Séminaire
AgroParis-Tech;Working Group on
Model-Based Clustering, Paris, 2016
- Sélection de modèles quand la
vraisemblance est incalculable, 47èmes
Journées de Statistique, Lille, 2015
- Les métiers des
mathématiques,
les maths cela sert!, Congrès Maths en Jeans, Paris, 2015
- L'utilisation des logiciels
dans les enseignements de statistique à l'université, 46èmes
Journées de Statistique, Rennes, 2014
- Statistical estimation of
genomic alterations of tumors, ERCIM, Pise 2014
- Model selection for the
binary
latent block model, COMPSTAT, Chypre, 2012
- Estimation dans le modèle des
blocs latents, séminaire parisien de statistique, 2012
- L’estimation des modèles à
blocs latents, séminaire d'Orsay; séminaire ECAIS
(Paris-Descartes), 2011
- Estimation d’un modèle à blocs latents par l’algorithme SEM, 42èmes
Journées de Statistique, Marseille, 2010
- Test de modèles en phylogénie, Journées MAS Nancy, 2004
- Reconstruction d'arbres phylogénétiques: inférence
statistique
et algorithmes, séminaire Grenoble, 2003
- Tester le nombre de populations dans un modèle de mélange à
régime markovien, Journées MAS Rennes, 2000
- Estimation consistante de l'ordre de modèles de mélanges, XVIIIème
Rencontre Franco-Belge de Statisticiens, Louvain-la-Neuve, 1997
- Estimation d'un processus MA bruité par maximum de
vraisemblance tronquée, Journée Chaînes de Markov
Cachées, Université d'Evry, 1997
Conseil scientifique pour Stats4Trade
Méthodes statistiques pour la reconstruction phylogénétique: PMCov, logiciel d'estimation des
paramètres d'un modèle covarion