Rang effectif et estimation de normes de matrice bruitée

Lundi 22 janvier 10:30-12:00 - Solène Thépaut - LMO - PS

Résumé : Rang effectif et estimation de normes de matrice bruitée
Le nombre de groupes recherchés fait parti des paramètres indispensables au fonctionnement des algorithmes de clustering utilisés pour partitionner des observations dans un jeu de données. Souvent, et particulièrement quand les groupes parmi les données ne sont pas clairement délimités, il est difficile d’estimer le nombre K de clusters dans lesquels on veut classer nos observations. Plusieurs méthodes existent pour trouver ou estimer K sans avoir à tester de manière itérative celui qui donnera la meilleure partition.
Dans notre cas, on a accès à une matrice représentant notre jeu de données : Y= A + E, où Y est la matrice des observations, A la matrice contenant les données ‘réelles’ et E un bruit que l’on suppose gaussien. A cause de la nature aléatoire du bruit E, il est difficile d’estimer la nombre de clusters existants parmi nos données réelles à partir de la matrice des observations Y.
On introduit alors la notion de rang effectif d’une matrice, plus souple que la rang et que l’on défini comme une fonctionnelle de normes de Schatten.
Estimer le rang effectif de la matrice A, à partir de Y revient à estimer le plus précisément possible les normes de Schatten de A, à partir des normes de Schatten de Y.

Effective rank and estimation of the rank of noisy matrices

The number of clusters is an essential parameter for clustering algorithms used to split observations of a dataset into different clusters. It is often difficult to estimate the number K of clusters in which we want to assign observations, especially when the clusters are not well delimited. Several methods already exists to find or estimate K without testing all the possibilities to find the best partition.
In our case, we have access to a matrix containing our dataset : Y = A + E, where Y is the matrix of observations, A the matrix of the ‘real’ data and E a noise we suppose gaussian. Because of the random nature of E, it is difficult to estimate K from the matrix of observations Y.
We introduce the notion of effective rank of a matrix, more flexible than the rank and defined as a functional of the Schatten norms.
To estimate the effective rank of the matrix A from Y we need to estimate, as precisely as possible, the Schatten norms of A from the Schatten norm of Y.

Lieu : Institut de Mathématiques - Salle 3L8

Rang effectif et estimation de normes de matrice bruitée  Version PDF