Mesures de la taille d’un ensemble d’hypothèses et garanties de généralisation.

Mercredi 18 avril 13:30-14:30 - Guillaume Maillard - LMO-PS

Résumé : En apprentissage statistique, on cherche à prédire une variable d’intérêt à partir d’autres variables que l’on a à disposition. Pour ce faire, plus l’ensemble de fonctions considéré est grand, plus il sera facile d’approcher la forme inconnue de cette dépendance. Cependant, le risque existe alors que la relation observée sur les données soit due purement au hasard. Si c’est le cas, la règle établie sur les données ne se généralisera pas à de nouvelles observations. C’est ce qu’on appelle le surapprentissage. Pour l’éviter, il faut trouver un moyen approprié de mesurer la complexité d’un ensemble de fonctions. Je décrirai quelques mesures classiques et en déduirai des majorations de l’erreur de généralisation.
Measure of the size of a set of hypotheses and warranty of generalization
In statistical learning, one tries to predict a variable of interest from other variables at its disposition. To do so, the bigger the set of functions used, the easier it will be to approach the the unknown form of dependence. However, there is a risk that the relationship observed among data is purely fortuitous. If it’s the case, the established law on data will not generalize well to new observations. It’s the so-called over-fitting. In order to avoid it, one needs an appropriate way to measure the diversity of a set of functions. I will describe some classical measures and I will deduce bounds on the error of generalization.

Lieu : Salle 2L8 (IMO)

Mesures de la taille d’un ensemble d’hypothèses et garanties de généralisation.  Version PDF
juillet 2018 :

Rien pour ce mois

juin 2018 | août 2018