Thèse CIFRE en cours
Auteur : Augustin TOURON
Date de soutenance : 2018, à préciser
Directrice de thèse : Elisabeth GASSIAT
Encadrant industriel : Thi-Thu HOANG (EDF)
Résumé :
Dans le contexte de mix énergétique actuel, la gestion des productions photovoltaïques et éoliennes devient un enjeu de plus en plus important à côté d’autres types de production classique comme les productions nucléaire, thermique et hydraulique. Afin d’assurer l’équilibre offre-demande sur tous les horizons, la consommation est également étudiée et modélisée. La consommation électrique en France est météo-sensible : on observe par exemple une augmentation en moyenne de 2 300MW par degré perdu en hiver. Ainsi, la température est une des variables importantes dans le modèle de prévision de consommation. Actuellement, la gestion de différents moyens de production et la prévision de consommation sont faites indépendamment les uns et les autres. Cependant la corrélation entre ces variables existe bel et bien : par exemple quand il fait très chaud, la consommation, liée à l’utilisation de la climatisation, augmente et la production photovoltaïque a tendance à augmenter également ; quand il fait froid, la consommation, liée à l’utilisation du chauffage, augmente et la production éolienne a tendance à augmenter. La corrélation entre la consommation et différents moyens de production peut être traduite par la corrélation entre les aléas physiques : température, précipitation, vent et rayonnement.
Le fait d’avoir des aléas cohérents entre eux devient un besoin primordial pas seulement pour EDF mais aussi pour d’autres acteurs du secteur énergétique. Dernièrement, à la demande de RTE, Météo France a établi un référentiel climatique basé sur 100 scénarios (200 dans la prochaine version de ce référentiel) issus d’un modèle atmosphérique. L’objectif de ce travail était de fournir une très longue série chronologique représentative du climat actuel pour plusieurs paramètres météorologiques cohérents entre eux à l’aide du modèle ARPEGE-Climat. Ce référentiel a été mis à disposition des acteurs de l’Energie, et est d’ores et déjà utilisé par RTE dans son Bilan Prévisionnel. Cependant la solution proposée par Météo-France présente différents inconvénients. Nous en citons deux ici : premièrement le fait de simuler un climat constant en visant une année cible ne traite pas complètement l’ensemble des sources de variabilité, deuxièmement le fait de corriger les sorties du modèle par rapport aux observations indépendamment pour chaque variable ne garantit pas la conservation de la cohérence.
Le principe des modèles climatiques comme ARPEGE-climat est de reproduire le comportement de l’atmosphère et les interactions avec d’autres composantes du système (végétation, océan,…) à une maille globale et pour une longue période. Ils sont faits pour représenter les circulations et les interactions physiques à l’échelle planétaire et anticiper les conséquences des modifications du bilan radiatif induites par les activités humaines, mais pas pour reproduire fidèlement l’évolution des conditions locales. Il est donc nécessaire d’appliquer des méthodes de descente d’échelle (« downscaling ») afin de reproduire la variabilité à petite échelle. Les générateurs stochastiques, qui peuvent générer des variables météorologiques au niveau local, sont de puissants outils statistiques de downscaling.
Cette thèse vise à développer un modèle stochastique multivarié (au pas journalier) pour répondre à la fois au besoin de cohérence des variables atmosphériques et à celui de la descente d’échelle. Dans la littérature, les modèles stochastiques peuvent être classés dans quatre catégories : méthodes de ré-échantillonnage, méthode Box et Jenkins, processus ponctuels et modèles hiérarchiques. L’approche envisagée pour cette thèse se range dans la dernière catégorie et est basée sur l’utilisation d’une chaine de Markov cachée (de Castro, Gassiat, Le Corff 2015, et de Castro, Gassiat, Lacour 2015) afin de modéliser simultanément différentes variables météorologiques : température, précipitation, rayonnement et vent ; le type de temps étant considéré comme une variable latente ou observée selon la manière de le traiter dans le modèle. Le type de temps est observé quand il est extrait d’une classification des états atmosphériques. Pour rappel, dans ce cas, un type de temps est caractérisé par un état récurrent de l’atmosphère associé à des structures préférentielles des variables météorologiques (hauteur du géopotentiel à 500hPa, direction et force de vent, température, nébulosité, pluie,…). Les types de temps sont des états quasi-stationnaires à l’échelle synoptique de la circulation atmosphérique sous nos latitudes et dépendent plus fortement des conditions locales (échelle de la France par exemple) que les régimes de temps qui sont leurs équivalents à très grande échelle (Europe de l’ouest- Atlantique nord). Le type de temps est latent quand il est déterminé par une classification des variables météorologiques considérées ou quand il est considéré comme une variable cachée dans la chaine de Markov cachée. L’approche de chaine de Markov cachée pour des variables météorologiques en utilisant des types de temps n’est pas une idée nouvelle (voir Alliot et al., 2015 pour des références). Cependant ce genre de modèle reste toujours un challenge pour les chercheurs car différentes difficultés de modélisation peuvent être rencontrées à cause de la complexité des variables :
• Définition du type de temps : on a le choix entre le considérer comme une classification des variables considérées localement à une station dans le modèle stochastique (température, précipitation, vent et rayonnement) et le considérer comme une classification des variables atmosphériques à une échelle plus grande (par exemple les types de temps en France : conditions anticycloniques, flux d’Ouest perturbé, flux de Sud à Sud-Ouest, flux de Nord à Nord-Ouest, retour d’Est). Deux principales difficultés sont rencontrées, (1) le choix de l’espace des phases dans lequel se placer pour réaliser la classification des types de temps et (2) la détermination du nombre optimal de classes.
• Non stationnarité des variables : les variables météorologiques sont souvent non stationnaires avec une saisonnalité marquée, ou une tendance (la température) ou une variabilité inter-annuelle. Une chaine de Markov homogène ne nous permet pas de prendre en compte cette non stationnarité. Une chaine de Markov cachée non-homogène pourrait être une solution pour ce problème (Carey-Smith et al., 2014)
• Longues vagues de chaleur ou longues périodes de sécheresse : une autre limitation d’un modèle de Markov homogène est que le temps de séjour suit une loi géométrique, qui ne peut pas reproduire de longues vagues de chaleur ou de longues périodes de sécheresse (Rasko et al., 1991)
• Structure de dépendance entre les variables : la précipitation est une variable compliquée à modéliser en elle-même, et cette difficulté sera encore accentuée par la présence d’autres variables. La distribution jointe doit être assez flexible pour capturer différentes caractéristiques des relations entre les variables mais en même temps elle ne devra pas être trop compliquée pour qu’on puisse l’interpréter.
• Comportement des extrêmes : la modélisation des extrêmes n’est pas un point fort de l’approche par chaine de Markov. Notre objectif principal est d’avoir des scénarios conjoints qui représentent bien les valeurs normales. Mais il serait bien d’avoir également des scénarios qui représentent bien les extrêmes, car les extrêmes sont importants pour notre vision des risques. Il faudrait alors trouver un moyen de modéliser, en plus des valeurs normales, les extrêmes et ce de manière multivariée.