Distributions des valeurs extrêmes univariées et bivariées     
Chapitre1 Distributions  extrêmes univariées
Distributions extrêmes bivariées Chapitre3
             
           
            La théorie des valeurs extrêmes ( TVE ) est basée sur l'approximation asymptotique des lois des maxima convenablement normalisés de vecteurs aléatoires dont les composantes sont  des variables supposées i.i.dLes deux dernières décénnies ont vu le développement de la modélisation statistique des valeurs extrêmes.  En témoignent les nombreux ouvrages récents : Joe H. (1997),  Embrechet  et al (1998), Kotz et Nadarajah (2000), Réiss et Thomas (2005)) et beaucoup de révues.  Les modèles des valeurs extrêmes sont appliquées à une grande variété de problèmes tels l'environnement ( vitesse du vent,  extrêmes pluviométriques et de températures,...), la pluviométrie,   la finance et l'assurance ( Mesure du risque, Valeur à risque VaR, modèle de volatilité stochastique) et même internet.
    La modélisation statistique des valeurs extrêmes révêt deux aspects: l'estimation de la structure conjointe  (en dimension supérieure à 1) et l'estimation des distributions marginales. En théorie univariée la distribution des valeurs extrêmes généralisées (GEV) (generlized extreme values en anglais) permet de résumer toutes  les distributions limites possibles de la loi asymptotique du maximum d'un échantillon.  En revanche, dans le cas bivarié ( et multivarié en général ) il n'existe pas une telle famille paramétérique. Cependant lorsque les distributions marginales sont connues il est possible de les caractériser par une fonction convexe dite fonction de dépendance de Pickands.
 
 Dans ce chapitre,
nous rappelons d'abord les théorèmes de convergences avant d'établir le lien entre ces  résultats et  la théorie des valeurs extrêmes à travers le théorème de Fisher-Tippet  un des fondements de cette théorie.

1. Distributions des valeurs extrêmes univariées
1.1. Les théorèmes limites
 1.1.1. Théorème des grands nombres
 La loi des grands nombres a été formalisée au XVIIe  XVIIe siècle lors de la découverte de nouveaux  langages   mathématiques.  Essentiellement, la loi des grands nombres indique que lorsque l'on fait un tirage  aléatoire dans une série de grande taille, plus  on augmente la taille de l'échantillon, plus les caractéristiques statistiques du tirage  (l'échantillon) se rapprochent des  caractéristiques statistiques de la population. Mais il  est intéressant de noter que  la taille de l'échantillon à prendre pour  approcher les caractéristiques de la population initiale ne dépend que faiblement voire pas du tout de la taille de la série initiale :  pour un sondage  au Luxembourg ou aux États-Unis, il suffit, pour obtenir une précision égale de prendre un échantillon de   même taille.  C'est sur cette loi que reposent la plupart des sondages Ils interrogent un nombre suffisamment  important de personnes pour connaître l'opinion (probable) de la population entière. De même, sans la formalisation de la loi des grands nombres, l'assurance n'aurait jamais pu se développer avec un tel essor. En effet, cette loi permet aux assureurs de  déterminer les probabilités que les sinistres dont ils sont garants se réaliseront ou non.  La loi des grands nombres sert aussi en statistique inférentielle, pour déterminer une loi de probabilité à partir  d'une  série d'expériences.  Cette loi comprend  deux énoncés, appelés respectivement loi faible des grands nombres et loi  forte des grands  nombres.
  a)  Loi faible des grands nombres
     Théorème 2.1.
    Preuve:









     b)  Loi faible des grands nombres
     Théorème 2.2.   
Ces trois lois de probabilité sont appelées distributions de valeurs extrêmes (voir [3] et [7]).
 1.1.2. Théorème de la limite centrale
     Le théorème de la limite centrale (ou : de la limite centrée ou même l'appellation  franglaise  " théorème  central limite" est un ensemble de résultats sur la convergence faible d'une suite de  variables aléatoires en  probabilité. Intuitivement, d'après ces résultats, toute somme de variables aléatoires indépendantes et identiquement distribuées tend vers une certaine variable aléatoire.  Le résultat le plus connu et le plus important est simplement appelé « théorème de la limite centrale » qui concerne une somme de variables aléatoires dont le nombre tend vers l'infini.
      Dans le cas le plus simple, considéré ci-dessous pour la démonstration du théorème, ces variables sont  indépendantes et possèdent la même moyenne et la même variance. En général, la somme croît indéfiniment en  même temps que le nombre de termes. Pour tenter d'obtenir un résultat fini, il faut centrer cette somme en lui soustrayant sa moyenne et la réduire en la divisant par son écart-type. Sous des conditions assez larges, la loi de probabilité converge alors vers une loi normale unitaire. L'omniprésence de la loi normale s'explique par le fait que de nombreux phénomènes considérés comme aléatoires sont dus à la superposition de causes nombreuses
  Théorème 2.3.
 
  
      Dans les applications pratiques, ce théorème permet en particulier de remplacer une somme de  variables aléatoires en nombre assez grand mais fini par une approximation normale, généralement plus facile à manipuler. Il est donc intéressant de voir comment la somme s'approche de la limite. Une somme de variables  continues est une variable continue dont on peut comparer la densité de probabilité à celle de la limite normale.  Ce théorème de probabilités possède une interprétation en statistique mathématique. Cette dernière associe une loi de probabilité à une population. Chaque élément extrait de la population est donc considéré comme une variable aléatoire et, en réunissant un nombre n de ces variables supposées indépendantes, on obtient un échantillon. La somme de ces variables aléatoires divisée par n donne une nouvelle variable nommée la moyenne  empirique. Celle-ci, une fois réduite, tend vers une variable normale réduite lorsque n tend vers l'infini.

                                                                       
1.2. Les distributions des valeurs extrêmes 
1.2.1. Statistiques d′ordre ou loi des records
  
Remarque:
  • Statistique ordinaire→ pour décrire et interpréter les tendances centrales des distributions sans tenir compte des extrêmes. 
  • Statistique  extrême → pour l' interpolation et la justifiacation asymptotiques des distributions.  
 Problème: Connaissant la distributions F des Xi . Comment déterminer les distributions  FM et FW   des variables Mn et Wn respectivement?          
Le résultat suivant donne la distribution de la  statistique d'ordre
Proposition 2.1.
Conséquence
      En effet , il suffit de remplacer i par n et par 1 dans les formules ci-dessus.
    Ou encore en remarquant que   
       

1.2.2. Le théorème de Fisher -Tippett.

   Un des résultats fondamentaux de la T.V.E. est le théorème suivant établi en 1928 par Fisher et Tippett
    Définition (lois de même type)  
    Problème:

    Fisher et Tippet trouvent en 1928 une solution à ce problème au moyen q'un théorème qui porte leur nom et qui est l'un des fondements de la théorie des valeurs extrêmes.   
   Théorème2.4. (de Fisher-Tippett ou théorème des 3 types extremes)
   Le théorème de Fisher - Tippet  montre si que l'ensemble des distributions est large (chap1) alors celui des distributions des valeurs extrêmes est plutôt restreint.
    Définition:
 Les trois lois de probabilité ci-dessus sont appelées distributions de valeurs extrêmes .
Une distribution des valeurs extrêmes  du maximum est donc une distribution G pouvant  s'obtenir  comme limite d'une suite convenablement normalisée de maxima de v.a. i.i.d.
 Remarque
 
     Par conséquent on peut se limiter à une quelconque de es lois extrêmes pour une caractérisation 
     sans perdre de généralité. 
 On définit de façon analogue, une distribution des valeurs extrêmes associée au minimum.
 Théorème2.5. ( lois extrêmes du minimum)

  Conclusion:  Une distribution de valeurs extrêmes est donc la limite d'une suite convenablement
                         normalisée 
de la loi du maximun ou du minimum.
 
1.2.3. Distribution généralisée de valeurs extrêmes.
   
    Etant donné qu'il est difficile de travailler avec trois distributions à la fois Von Mises (1954)  et Jenkinson
   (1955) ont proposé une famille paramétrique de distribution  ou distribution GEV-
    Generalized Extreme Value - qui permet d'unifier les trois types extrêmes ci-dessus.

  Théorème7(d'unification des trois types)
 Cas particuliers

Ainsi le paramètre de formedonne, à travers ses différentes valeurs possibles, une grande flexibilité à la distribution GEV de sorte à prendre en compte les trois types
 de comporte
ment asymptotiques représentés par les distributions extrêmes ci-dessus.  
 Remarque: En remplaçant la variable centrée réduite par x on obtient la forme standard de la
  distribution GEV :   paramètres de forme.
                                         
1.3. Le Max- domaine d 'attraction 
       La recherche du domaine d'attraction peut être considérée comme l'étude réciproque de la recherche de la distribution des valeurs extrêmes associée éventuellement à une distribution.  Dans le cas  univarié, le problème consiste à répondre à la question suivante: étant donné une loi  H de type extrême (donc appartenant à l'une des trois familles Fréchet, Gumbel et Weibull)  quels sont les critères vérifiés par une distribution quelcon-
 que F pour que la loi du maximum  de
la suite de variables aléatoires i.i.d. de loi F converge vers H?
      Dans le cas les distributions marginales sont identiques, la recherche du domaine d'attraction  d'une distribution multivariée peut être comme une extension du cas univarié.
 1.3.1. Définition et exemples
    a)  Définition
  b) Exemples 
   Pour la distribution exponentielle F(x)=1- exp(-x); x>0
 
Conclusion:
  Le maximum convenablement normalisé de la loi exponentielle  converge vers la  loi de Gumbel. distribution exponentielle appartient au max- domaine d'attraction   de Gumbel.
    • Aussi, les lois dans le domaine d'attraction de la loi de Gumbel sont parfois  appelées  de type exponentielle.
   Pour la distribution de Pareto 

 Conclusion: La distribution de Pareto appartient au max-domaine d'attraction de Fréchet. Aussi, les lois dans
                       le domaine d'attraction de la loi de Fréchet sont parfois appelées  de type Pareto.
 Problème: Si une distribution admet des coefficients de normalisation comment les déterminer?

   1.3.2. Caractérisation du domaine d′attraction
    La caractérisation du domaine d'attraction fait intervenir la notion de fonction à variation régulière.
   a) Fonction a variation régulière
 Définition

  Définition
 Exemple: Considérons la fonction F(x)=log(log(x)),∀x>1
    La proposition suivante donne les propriétés principales des fonctions à variations régulières.
 Proposition   

    1.3.3. Coefficients de normalisation d′une distribution

    Le résultat suivant permet de faire le lien entre la fonction de hasard d'une distribution  et ses éventuelles coefficients de normalisation.
   Propriété:
Exemple d'application: Déterminer les éventuelles distributions de valeurs extrêmes dont la loi exponentielle
                                        unitaire et la loi normale unitaire sont le max-domaine d'attraction.
 Pour la distribution exponentielle, il suffit de justifier les coefficients de normalisation ci-dessus utilisés (en effet il
  avait déjà été établi que   Gumbel). 

   Conclusion: la distribution normale aussi appartient à .
 Remarque: Toute distribution n'appartient nécessairement à un domaine d'attraction !!!


1.3.4. Domaine d′attraction des distributions extrêmes
 Sachant une distribution F, comment déterminer le max-domaine d'attraction auquel elle  appartient  et  trouver les constantes de normalisation associées?. La réponse à cette question est relativement est complexe et dépend de la forme de la fonction F. Les résultats suivants donnent les critères les plus utilisés.
    a) Le max-domaine d'attraction de Fréchet  

 Théorème
    
  On peut citer:  
     
      •

      • les lois -stables, >2 ( lien wiki)


     b) Le max-domaine d'attraction de Weibull
Quelques distributions du MDA(_{})

 c) Le max-domaine d'attraction de Gumbel 
    La caractérisation du MDA de Gumbel est difficile à énoncer du fait  qu'il n'existe  pas de condition nécessaire et suffisante relativement simple. Mais si la  fonction F est de classe C2, une condition suffisante relativement simple à vérifier est la suivante :    
Le résultat suivant établit une relation entre deux fonctions  appartenant au 
    Propriété
  On peut citer entre autres:

                                     
2. Distributions des valeurs extrêmes bivariées   
       La théorie bivariée (et multivariée en général ) des valeurs extrêmes n'est pas une extension immédiate du cas
univarié. Le problème qui se pose lorsque l'on quitte le cas unavrié consiste à répondre à trouver  une  réponse à la question "comment ordonner les couples de variables aléatoires?". En  effet il est plutôt  rare que les deux composantes d'un même couple soient des maxima ou des minima  sur l'ensemble des composantes. L'ensemble n'étant pas muni d'un ordre total  d'une norme naturelle, on doit alors déterminer dans quel sens les observations serons ordonnées.
 Ainsi, plusieurs approches ont été envisagées pour cela, les définitions sur les statistiques d'ordre ci-dessus définies ne permettant pas d'ordonner les couples. L'approche la plus partagée a consisté à ordonner les vecteurs composante par composante. Une telle approche conduit, dans le cas bivarié à la définition ci-dessous.

2.1. Définition et Propriétés 

 2.1.1.  Définition  et exemple
Une loi de probabilité est dite distribution bivariée de valeurs extrêmes du maximum
       si sa fonction de répartition G peut s'obtenir comme limite de la suite de distributions
       d'un couple de maxima convenablement normalisé i.e. s'il existe une suite
 
   Comme dans le cas univarié on dit que la distribution H appartient au max-domaine d'attraction de G.
  Notation: Dans toute la suite on considère la notation  B.E.V.- pour "bivariate extreme values " en anglais.
Exemple

    En effet :

  Conclusion: la distribution de Galambos est une distribution B.E.V.
  Remarque: Les distributions B.E.V. que nous verrons ont des marges symétriques F(x)=G(x).
                    Par conséquent, on peut déterminer les coefficients de normalisation an =c et bn =dn 
                    de la marge comme précédemment.
  Définition

2.1.2. Propriétés  
    Les résultats suivants donnent les propriétés essentielles d'une distribution B.E.V.
 Théorème
Toute distribution B.E.V. est continue. De plus, ses distributions marginales
 appartiennent 
à l'une des trois  types  des distributions paramétriques données
 par le théorème de  
Fisher-Typpet.
    

  Exemple:
 

 Théorème
Exemple
    
                                                                  
2.2. Caractérisation des distributions BEV    Dans la théorie bivariée des valeurs extrêmes, il n'existe pas une forme paramétrique  générale  permettant, comme dans le cas univarié, de résumer les différents types de comprotements  asymptotiques de la loi du maxi-
mum ou celle du minimum. Cependant, lorsque les distributions marginales sont connues, Le théorème suivant, dû à Pickands, permet, pour des marges  de Fréchet unités de déterminer une expression d'une distribution B.E.V au moyen d'une fonction convexe dite  fonction de dépendance.
    Théorème (Théorème de représentation de Pickands)
  Définition:
La fonction A est appelée fonction de dépendance ou générateur de la disribution BEV
  Remarque:  L'expression d'une distribution BEV en fonction de son générateur varie en  fonction du type de
                marge considérée. En effet, pour  des marges de type Gumbel par  exemple la caractérisation ci-dessus
                 est donnée par : Cependant le générateur lui-même
                A n'est pas liée au type de marge considérée. Par conséquent, le fait de considérer une marge de type
                 Fréchet unitaire par exemple n'est nullement  restrictif étant donné que les  trois types extrêmes sont
                 liées entre elles par de simples relations fonctionnelles (remarque)
  Applications
Déterminons le générateur associé à la distribution B.E.V de Galambos
 

  En admettant que la fonction ci-dessous est un générateur extrême construisons la distribution BEV
       associé de
 marges de Fréchet standard :avec . 


                                                      
2.3. Familles parametriques usuelles de distributions BEV Il a existé deux approches dans la modélisation de la dépendance entre les distributions   marginales univariées d' une distribution BEV: la méthode paramétrique et la méthode non-paramétrique. Les modèles paramétriques peuvent être regroupés en deux grandes  classes : le modèle mixte et le modèle logistique.
 Les familles paramétriques usuelles de distributions BEV sont en général des extensions symétriques ou  asymétriques de ces  deux modèles. Dans cette section nous donnons les principales distributions BEV ainsi que leurs fonctions de dépendance. La distribution marginale extrême univariée considérée   est loi de Fréchet standard.
 2.3.1. La famille mixte
   
Le modèle mixte à  un paramètre (Tawn 1994)

    Tawn (1994) et Nader (1996) développent des extensions respectivement asymétrique et symétrique
     de cette famille.
    Le modèle mixte asymétrique (Tawn 1988)

    Le modèle mixte symétrique généralisée (Nader1996)
 
 
 2.3.2. La famille logistique et ses extensions
  a)  La famille logistique
   Le modèle logistique  (Gumbel 1960a)

 Le modèle symétrique a été l'objet de beaucoup d'extensions symétriques et asymétriques
 b)  Extentions symétriques du modèle logistique
    Le modèle logistique négative à  un paramètre
 C'est la distribution de Galambos ci-dessus ( Galambos 1975 )

Il existe essentiellement deux extensions à deux paramètres de cette distribution
  Le modèle logistique négative à 2 paramètres (Galambos1975)

    Le modèle logistique négative à  deux paramètres (Joe 1997)
 
   
Le modèle bilogistique de Smith (1990) 

   Le modèle logistique généralisée de Nader (1996)

  Le modèle bilogistique négative de Tawn (1994)

  Le modèle de Hüsler-Réiss (1989)

  c) Extensions asymétriques du modèle logistique
  Le modèle logistique asymétrique génralisé (Tawn1988)

  Le modèle logistique négative asymétrique (Joe1990)

  Le modèle de Coles et Tawn (1991)

 
                                                             Haut de page