La théorie des valeurs extrêmes ( TVE ) est basée sur l'approximation asymptotique des lois des maxima convenablement normalisés de vecteurs aléatoires dont les composantes sont des variables supposées i.i.d. Les deux dernières décénnies ont vu le développement de la modélisation statistique des valeurs extrêmes. En témoignent les nombreux ouvrages récents : Joe H. (1997), Embrechet et al (1998), Kotz et Nadarajah (2000), Réiss et Thomas (2005)) et beaucoup de révues. Les modèles des valeurs extrêmes sont appliquées à une grande variété de problèmes tels l'environnement ( vitesse du vent, extrêmes pluviométriques et de températures,...), la pluviométrie, la finance et l'assurance ( Mesure du risque, Valeur à risque VaR, modèle de volatilité stochastique) et même internet. La modélisation statistique des valeurs extrêmes révêt deux aspects: l'estimation de la structure conjointe (en dimension supérieure à 1) et l'estimation des distributions marginales. En théorie univariée la distribution des valeurs extrêmes généralisées (GEV) (generlized extreme values en anglais) permet de résumer toutes les distributions limites possibles de la loi asymptotique du maximum d'un échantillon. En revanche, dans le cas bivarié ( et multivarié en général ) il n'existe pas une telle famille paramétérique. Cependant lorsque les distributions marginales sont connues il est possible de les caractériser par une fonction convexe dite fonction de dépendance de Pickands. Dans ce chapitre, nous rappelons d'abord les théorèmes de convergences avant d'établir le lien entre ces résultats et la théorie des valeurs extrêmes à travers le théorème de Fisher-Tippet un des fondements de cette théorie. 1. Distributions des valeurs extrêmes univariées 1.1. Les théorèmes limites 1.1.1. Théorème des grands nombres La loi des grands nombres a été formalisée au XVIIe XVIIe siècle lors de la découverte de nouveaux langages mathématiques. Essentiellement, la loi des grands nombres indique que lorsque l'on fait un tirage aléatoire dans une série de grande taille, plus on augmente la taille de l'échantillon, plus les caractéristiques statistiques du tirage (l'échantillon) se rapprochent des caractéristiques statistiques de la population. Mais il est intéressant de noter que la taille de l'échantillon à prendre pour approcher les caractéristiques de la population initiale ne dépend que faiblement voire pas du tout de la taille de la série initiale : pour un sondage au Luxembourg ou aux États-Unis, il suffit, pour obtenir une précision égale de prendre un échantillon de même taille. C'est sur cette loi que reposent la plupart des sondages Ils interrogent un nombre suffisamment important de personnes pour connaître l'opinion (probable) de la population entière. De même, sans la formalisation de la loi des grands nombres, l'assurance n'aurait jamais pu se développer avec un tel essor. En effet, cette loi permet aux assureurs de déterminer les probabilités que les sinistres dont ils sont garants se réaliseront ou non. La loi des grands nombres sert aussi en statistique inférentielle, pour déterminer une loi de probabilité à partir d'une série d'expériences. Cette loi comprend deux énoncés, appelés respectivement loi faible des grands nombres et loi forte des grands nombres. a) Loi faible des grands nombres
Théorème 2.1.
Preuve:
![]() b) Loi faible des grands nombres Théorème 2.2.
Le théorème de la limite centrale (ou : de la limite centrée ou même l'appellation franglaise " théorème central limite" est un ensemble de résultats sur la convergence faible d'une suite de variables aléatoires en probabilité. Intuitivement, d'après ces résultats, toute somme de variables aléatoires indépendantes et identiquement distribuées tend vers une certaine variable aléatoire. Le résultat le plus connu et le plus important est simplement appelé « théorème de la limite centrale » qui concerne une somme de variables aléatoires dont le nombre tend vers l'infini. Dans le cas le plus simple, considéré ci-dessous pour la démonstration du théorème, ces variables sont indépendantes et possèdent la même moyenne et la même variance. En général, la somme croît indéfiniment en même temps que le nombre de termes. Pour tenter d'obtenir un résultat fini, il faut centrer cette somme en lui soustrayant sa moyenne et la réduire en la divisant par son écart-type. Sous des conditions assez larges, la loi de probabilité converge alors vers une loi normale unitaire. L'omniprésence de la loi normale s'explique par le fait que de nombreux phénomènes considérés comme aléatoires sont dus à la superposition de causes nombreuses Théorème 2.3.
Dans les applications pratiques, ce théorème permet en particulier de remplacer une somme de variables aléatoires en nombre assez grand mais fini par une approximation normale, généralement plus facile à manipuler. Il est donc intéressant de voir comment la somme s'approche de la limite. Une somme de variables continues est une variable continue dont on peut comparer la densité de probabilité à celle de la limite normale. Ce théorème de probabilités possède une interprétation en statistique mathématique. Cette dernière associe une loi de probabilité à une population. Chaque élément extrait de la population est donc considéré comme une variable aléatoire et, en réunissant un nombre n de ces variables supposées indépendantes, on obtient un échantillon. La somme de ces variables aléatoires divisée par n donne une nouvelle variable nommée la moyenne empirique. Celle-ci, une fois réduite, tend vers une variable normale réduite lorsque n tend vers l'infini. 1.2. Les distributions des valeurs extrêmes 1.2.1. Statistiques d′ordre ou loi des records Remarque:
Le résultat suivant donne la distribution de la statistique d'ordre Proposition 2.1.
Ou encore en remarquant que ![]() 1.2.2. Le théorème de Fisher -Tippett. Un des résultats fondamentaux de la T.V.E. est le théorème suivant établi en 1928 par Fisher et Tippett Définition (lois de même type)
![]() Fisher et Tippet trouvent en 1928 une solution à ce problème au moyen q'un théorème qui porte leur nom et qui est l'un des fondements de la théorie des valeurs extrêmes. Théorème2.4. (de Fisher-Tippett ou théorème des 3 types extremes)
Définition:
![]() Par conséquent on peut se limiter à une quelconque de es lois extrêmes pour une caractérisation sans perdre de généralité. On définit de façon analogue, une distribution des valeurs extrêmes associée au minimum. Théorème2.5. ( lois extrêmes du minimum)
![]() Conclusion: Une distribution de valeurs extrêmes est donc la limite d'une suite convenablement normalisée de la loi du maximun ou du minimum. 1.2.3. Distribution généralisée de valeurs extrêmes. Etant donné qu'il est difficile de travailler avec trois distributions à la fois Von Mises (1954) et Jenkinson (1955) ont proposé une famille paramétrique de distribution ou distribution GEV-Generalized Extreme Value - qui permet d'unifier les trois types extrêmes ci-dessus. Théorème7(d'unification des trois types)
Ainsi le paramètre de forme donne, à travers ses différentes valeurs possibles, une grande flexibilité
à la distribution GEV de sorte à prendre en compte les
trois types de comportement asymptotiques représentés par les distributions extrêmes ci-dessus. Remarque: En remplaçant la variable centrée réduite par x on obtient la forme standard de la distribution GEV : paramètres de forme.1.3. Le Max- domaine d 'attraction La recherche du domaine d'attraction peut être considérée comme l'étude réciproque de la recherche de la distribution des valeurs extrêmes associée éventuellement à une distribution. Dans le cas univarié, le problème consiste à répondre à la question suivante: étant donné une loi H de type extrême (donc appartenant à l'une des trois familles Fréchet, Gumbel et Weibull) quels sont les critères vérifiés par une distribution quelcon- que F pour que la loi du maximum de la suite de variables aléatoires i.i.d. de loi F converge vers H? Dans le cas les distributions marginales sont identiques, la recherche du domaine d'attraction d'une distribution multivariée peut être comme une extension du cas univarié. 1.3.1. Définition et exemples a) Définition
Pour la distribution exponentielle F(x)=1- exp(-x); x>0 ![]() Conclusion: Le maximum convenablement normalisé de la loi exponentielle converge vers la loi de Gumbel. distribution exponentielle appartient au max- domaine d'attraction de Gumbel. • Aussi, les lois dans le domaine d'attraction de la loi de Gumbel sont parfois appelées de type exponentielle. Pour la distribution de Pareto ![]() ![]() Conclusion: La distribution de Pareto appartient au max-domaine d'attraction de Fréchet. Aussi, les lois dans le domaine d'attraction de la loi de Fréchet sont parfois appelées de type Pareto. Problème: Si une distribution admet des coefficients de normalisation comment les déterminer? 1.3.2. Caractérisation du domaine d′attraction La caractérisation du domaine d'attraction fait intervenir la notion de fonction à variation régulière. a) Fonction a variation régulière Définition
![]() Définition
La proposition suivante donne les propriétés principales des fonctions à variations régulières. Proposition
1.3.3. Coefficients de normalisation d′une distribution ![]() Le résultat suivant permet de faire le lien entre la fonction de hasard d'une distribution et ses éventuelles coefficients de normalisation. Propriété:
unitaire et la loi normale unitaire sont le max-domaine d'attraction. Pour
la distribution exponentielle, il suffit de justifier les coefficients
de normalisation ci-dessus utilisés (en effet il avait déjà été établi que Gumbel). ![]() Conclusion: la distribution normale aussi appartient à .Remarque: Toute distribution n'appartient nécessairement à un domaine d'attraction !!! ![]() 1.3.4. Domaine d′attraction des distributions extrêmes Sachant une distribution F, comment déterminer le max-domaine d'attraction auquel elle appartient et trouver les constantes de normalisation associées?. La réponse à cette question est relativement est complexe et dépend de la forme de la fonction F. Les résultats suivants donnent les critères les plus utilisés. a) Le max-domaine d'attraction de Fréchet ![]() ![]() Théorème
![]() On peut citer: ![]() • ![]() • les lois -stables, >2 ( lien wiki)![]() b) Le max-domaine d'attraction de Weibull ![]()
![]() c) Le max-domaine d'attraction de Gumbel ![]() La caractérisation du MDA de Gumbel est
difficile à énoncer du fait qu'il n'existe
pas de condition nécessaire et suffisante relativement simple.
Mais si la fonction F est de classe C2, une condition suffisante relativement simple à vérifier est la suivante : ![]() Le résultat suivant établit une relation entre deux fonctions appartenant au ![]() Propriété
2. Distributions des valeurs extrêmes bivariées La théorie bivariée (et multivariée en général ) des valeurs extrêmes n'est pas une extension immédiate du cas univarié. Le problème qui se pose lorsque l'on quitte le cas unavrié consiste à répondre à trouver une réponse à la question "comment ordonner les couples de variables aléatoires?". En effet il est plutôt rare que les deux composantes d'un même couple soient des maxima ou des minima sur l'ensemble des composantes. L'ensemble n'étant
pas muni d'un ordre total d'une norme naturelle, on doit
alors déterminer dans quel sens les observations serons
ordonnées. Ainsi, plusieurs approches ont été envisagées pour cela, les définitions sur les statistiques d'ordre ci-dessus définies ne permettant pas d'ordonner les couples. L'approche la plus partagée a consisté à ordonner les vecteurs composante par composante. Une telle approche conduit, dans le cas bivarié à la définition ci-dessous. 2.1. Définition et Propriétés 2.1.1. Définition et exemple
Notation: Dans toute la suite on considère la notation B.E.V.- pour "bivariate extreme values " en anglais. Exemple![]() En effet : ![]() Conclusion: la distribution de Galambos est une distribution B.E.V. Remarque: Les distributions B.E.V. que nous verrons ont des marges symétriques F(x)=G(x). Par conséquent, on peut déterminer les coefficients de normalisation an =cn et bn =dn de la marge comme précédemment. Définition
2.1.2. Propriétés Les résultats suivants donnent les propriétés essentielles d'une distribution B.E.V. Théorème
![]() Exemple: ![]() Théorème
Exemple![]() 2.2. Caractérisation des distributions BEV Dans la théorie bivariée des valeurs extrêmes, il n'existe pas une forme paramétrique générale permettant, comme dans le cas univarié, de résumer les différents types de comprotements asymptotiques de la loi du maxi- mum ou celle du minimum. Cependant, lorsque les distributions marginales sont connues, Le théorème suivant, dû à Pickands, permet, pour des marges de Fréchet unités de déterminer une expression d'une distribution B.E.V au moyen d'une fonction convexe dite fonction de dépendance. Théorème (Théorème de représentation de Pickands)
Définition:
Remarque: L'expression d'une distribution BEV en fonction de son générateur varie en fonction du type demarge considérée. En effet, pour des marges de type Gumbel par exemple la caractérisation ci-dessus est donnée par : Cependant le générateur lui-mêmeA n'est pas liée au type de marge considérée. Par conséquent, le fait de considérer une marge de type Fréchet unitaire par exemple n'est nullement restrictif étant donné que les trois types extrêmes sont liées entre elles par de simples relations fonctionnelles (remarque) Applications Déterminons le générateur associé à la distribution B.E.V de Galambos ![]() ![]() En admettant que la fonction ci-dessous est un générateur extrême construisons la distribution BEVassocié de marges de Fréchet standard : avec . ![]() ![]() 2.3. Familles parametriques usuelles de distributions BEV Il a existé deux approches dans la modélisation de la dépendance entre les distributions marginales univariées d' une distribution BEV: la méthode paramétrique et la méthode non-paramétrique. Les modèles paramétriques peuvent être regroupés en deux grandes classes : le modèle mixte et le modèle logistique. Les familles paramétriques usuelles de distributions BEV sont en général des extensions symétriques ou asymétriques de ces deux modèles. Dans cette section nous donnons les principales distributions BEV ainsi que leurs fonctions de dépendance. La distribution marginale extrême univariée considérée est loi de Fréchet standard. 2.3.1. La famille mixte Le modèle mixte à un paramètre (Tawn 1994)![]() Tawn (1994) et Nader (1996) développent des extensions respectivement asymétrique et symétrique de cette famille. Le modèle mixte asymétrique (Tawn 1988) ![]() Le modèle mixte symétrique généralisée (Nader1996) 2.3.2. La famille logistique et ses extensions a) La famille logistique Le modèle logistique (Gumbel 1960a) ![]() Le modèle symétrique a été l'objet de beaucoup d'extensions symétriques et asymétriques b) Extentions symétriques du modèle logistique Le modèle logistique négative à un paramètreC'est la distribution de Galambos ci-dessus ( Galambos 1975 ) ![]() Il existe essentiellement deux extensions à deux paramètres de cette distribution Le modèle logistique négative à 2 paramètres (Galambos1975)![]() Le modèle logistique négative à deux paramètres (Joe 1997)![]() Le modèle bilogistique de Smith (1990) ![]() Le modèle logistique généralisée de Nader (1996)![]() Le modèle bilogistique négative de Tawn (1994)![]() Le modèle de Hüsler-Réiss (1989)![]() c) Extensions asymétriques du modèle logistique Le modèle logistique asymétrique génralisé (Tawn1988)![]() Le modèle logistique négative asymétrique (Joe1990)![]() Le modèle de Coles et Tawn (1991) |
||||||||||||||||||||||||||||||||||