Prochainement

Pas d'événement prévu ce mois

Passés

Jeudi 21 juin 15:30-16:30 Gilles Blanchard (Université de Potsdam)
Is adaptive early stopping possible in statistical inverse problems ?

Plus d'infos...

Lieu : salle 3L15

Résumé : (Joint work with M. Hoffmann and M. Reiss)
Consider a statistical inverse problem where different estimators $\hatf_1, \ldots , \hatf_K$ are available (ranked in order of increasing « complexity », here identified with variance) and the classical problem of estimator selection. For a (data-dependent) choice of the estimator index $\hatk$, there exist a number of well-known methods achieving oracle adaptivity in a wide range of contexts, for instance penalization methods, or Lepski’s method.
However, they have in common that the estimators for \em all possible values of $k$ have to be computed first, and only then compared to each other in some way to determine the final choice. Contrast this to an « early stopping » approach where we are able to compute iteratively the estimators for $k= 1, 2, \ldots $ and have to decide to stop at some point without being allowed to compute the following estimators. Is oracle adaptivity possible then ? This question is motivated by settings where computing estimators for larger $k$ requires more computational cost ; furthermore, some form of early stopping is most often used in practice.
We propose a precise mathematical formulation of this question — in the idealized framework of a Gaussian sequence model with $D$ observed noisy coefficients. In this model, we provide upper and lower bounds on what is achievable using linear regularized filter estimators commonly used for statistical inverse problems.

Is adaptive early stopping possible in statistical inverse problems ?  Version PDF
Jeudi 21 juin 14:00-15:00 Olivier Zindy (LPSM)
Universalité de la densité critique pour le modèle de marche aléatoire activée

Plus d'infos...

Résumé : Le modèle de marche aléatoire activée (Activated Random Walk model) est un système de particules où les particules se déplacent indépendamment selon une marche aléatoire simple, mais chaque particule peut également passer à un état « passif » quand elle est seule sur un site, et ce jusqu’à l’éventuelle visite d’une autre particule qui la réveille. Les physiciens conjecturent qu’en toute généralité la compétition entre désactivation locale et diffusion globale conduit à une transition de phase non-triviale quand la densité initiale de particules augmente : à base densité les configurations locales se stabilisent alors qu’à haute densité une activité persiste indéfiniment. De nombreux résultats mathématiques ont été obtenus récemment mais la plupart des preuves exigent des hypothèses contraignantes sur la distribution initiale de particules. Dans cet exposé, nous montrerons que les propriétés de stabilisation ne dépendent que de la densité initiale quelque soit la distribution.
(Travail en collaboration avec Leonardo T. Rolla et Vladas Sidoravicius)

Universalité de la densité critique pour le modèle de marche aléatoire activée  Version PDF
Jeudi 14 juin 14:00-15:00 Badr-Eddine Chérief-Abdellatif  (CREST, ENSAE, Université Paris Saclay)
Consistency of Variational Bayes Inference for Estimation and Model Selection in Mixtures

Plus d'infos...

Résumé : Mixture models are widely used in Bayesian statistics and machine learning and proved their efficiency in many fields such as computational biology or natural language processing... Variational inference, a technique for approximating intractable posteriors thanks to optimization algorithms, is extremely popular in practice when dealing with complex models such as mixtures. The contribution of this paper is two-fold. First, we study the concentration of variational approximations of posteriors, which is still an open problem for general mixtures, and we derive consistency and rates of convergence. We also tackle the problem of model selection for the number of components : we study the approach already used in practice, which consists in maximizing a numerical criterion (ELBO). We prove that this strategy indeed leads to strong oracle inequalities. We illustrate our theoretical results by applications to Gaussian and multinomial mixtures.

Consistency of Variational Bayes Inference for Estimation and Model Selection in Mixtures  Version PDF
Jeudi 7 juin 14:00-15:00 Camille Male (Université de Bordeaux)
Spectre de matrices aléatoires : aspects analytiques de l’indépendance des trafics et liberté avec amalgamation

Plus d'infos...

Lieu : salle 3L15

Résumé : La théorie des probabilités libres, inventée par Voiculescu dans les années 80, est un outil robuste pour l’étude spectrale des grandes matrices aléatoires. Dans un contexte non commutative, la liberté joue le rôle de l’indépendance statistique. Ce simple parallèle produit une théorie très riche, avec des analogues de nombreux concepts de probabilités. L’indépendance libre décrit les limites de grandes matrices aléatoires indépendantes dans des situations génériques, en particulier pour les matrices unitairement invariantes et les matrices de Wigner.
Cependant de nombreux modèles de matrices échappent à cette théorie. C’est pour s’adapter à ces modèle que fut créée la théorie des trafics. Celle-ci étend la théorie des probabilités non commutatives, en étant munie d’une notion d’indépendance plus riche. Les matrices aléatoires invariantes par conjugaison par des matrices de permutation constituent le modèle canonique de matrices asymptotiquement indépendantes au sens des trafics.
L’objectif de cet exposé est de donner une introduction à ce sujet et de présenter une découverte récente, offrant les premières perspectives analytiques de la théorie : les matrices aléatoires permutation invariantes sont asymptotiquement libres avec amalgamation sur l’espace des matrices diagonales.

Spectre de matrices aléatoires : aspects analytiques de l’indépendance des trafics et liberté avec amalgamation  Version PDF
Jeudi 24 mai 14:00-17:00  
Journée des doctorants de probabilités-statistiques

Plus d'infos...

Lieu : salle 3L15

Résumé : 14h00 : Thomas Budzinski, cartes causales surcritiques
Résumé : On s’intéresse à des cartes causales construites à partir d’arbres de Galton-Watson surcritiques conditionnés à survivre, en reliant à chaque hauteur les sommets consécutifs. Dans un premier temps, on mettra en évidence des propriétés métriques « hyperboliques » de ces cartes, exploitant le fait qu’il est très difficile de s’y déplacer horizontalement. Dans un second temps, on étudiera la marche aléatoire sur ces cartes, et on montrera dans le cas sans feuille qu’elle a une vitesse positive. Certaines des méthodes utilisées sont robustes et peuvent permettre d’obtenir des résultats sur d’autres modèles comme les PSHIT, variantes hyperboliques de l’UIPT.
14h40 : Solene Thepaut, rang effectif et estimation de normes de matrice bruitée
Résumé : Le nombre de groupes recherchés fait partie des paramètres indispensables au fonctionnement des algorithmes de clustering utilisés pour partitionner des observations dans un jeu de données. Souvent, et particulièrement quand les groupes parmi les données ne sont pas clairement délimités, il est difficile d’estimer le nombre K de clusters dans lesquels on veut classer nos observations. Plusieurs méthodes existent pour trouver ou estimer K sans avoir à tester de manière itérative celui qui donnera la meilleure partition. Dans notre cas, on a accès à une matrice représentant notre jeu de données : Y= A + E, où Y est la matrice des observations, A la matrice contenant les données ‘réelles’ et E un bruit que l’on suppose gaussien. A cause de la nature aléatoire du bruit E, il est difficile d’estimer la nombre de clusters existants parmi nos données réelles à partir de la matrice des observations Y. On introduit alors la notion de rang effectif d’une matrice, plus souple que la rang et que l’on définit comme une fonctionnelle de normes de Schatten. Estimer le rang effectif de la matrice A à partir de Y revient à estimer le plus précisément possible les normes de Schatten de A à partir des normes de Schatten de Y.
15h20 : pause
15h30 : Thomas Lehericy, inégalités isopérimétriques dans la quadrangulation infinie uniforme du plan
Résumé : Les cartes planaires sont des graphes planaires plongés sur une surface, vus à homéomorphisme conservant l’orientation près. Introduites dans les années 80 dans le cadre de la gravité quantique, elles sont au cœur d’un champ de recherche actif en physique théorique, en combinatoire et en probabilités. Dans un premier temps, je présenterai une description des quadrangulations, qui sont des cas particuliers de cartes planaires, à l’aide d’un processus de branchement. J’expliquerai ensuite comment cette décomposition permet de résoudre une conjecture de Krikun (2009), et de répondre à une question d’Angel (2004), liée à des inégalités isopérimétriques dans la quadrangulation infinie du plan. Ces inégalités sont les plus fortes établies dans ce cadre à ce jour, et fournissent un cadre rigoureux à plusieurs observations sur la géométrie de l’objet limite.
16h10 : Augustin Touron, modélisation multivariée de variables météorologiques
Résumé : Pour réaliser des études d’impact ou encore étudier le changement climatique, on a recours à des générateurs de temps. Ces modèles statistiques permettent de générer facilement des séries réalistes de variables climatiques telles que la température ou les précipitations. Les modèles à espace d’états tels que les modèles de Markov caché sont particulièrement populaires pour atteindre cet objectif. Nous introduisons une généralisation des modèles de Markov caché permettant de prendre en compte la saisonnalité des variables climatiques. Nous verrons comment estimer les paramètres d’un tel modèle et comment on peut l’utiliser en pratique comme générateur de temps.

Journée des doctorants de probabilités-statistiques  Version PDF
Jeudi 17 mai 14:00-15:00 Marco Cuturi (CREST-ENSAÉ)
Regularization for Optimal Transport and Dynamic Time Warping Distances

Plus d'infos...

Lieu : salle 3L15

Résumé : Machine learning deals with mathematical objects that have structure. Two common structures arising in applications are point clouds / histograms, as well as time series. Early progress in optimization (linear and dynamic programming) have provided powerful families of distances between these structures, namely Wasserstein distances and dynamic time warping scores. Because they rely both on the minimization of a linear functional over a (discrete) space of alignments and a continuous set of couplings respectively, both result in non-differentiable quantities. We show how two distinct smoothing strategies result in quantities that are better behaved and more suitable for machine learning applications, with applications to the computation of Fréchet means.

Regularization for Optimal Transport and Dynamic Time Warping Distances  Version PDF