Aménagement des pêches artisanales
 
Chapitre 1. Démographie
Chapitre 2. Eléments de Statistiques Appliquées pour Ecologues et Aménagistes 
2.1 Sommaire 
  2.1.1 Eléments de statistiques appliquées pour écologues et aménagistes 
  2.1.2 Eléments caractéristiques d'une série statistique 
  2.1.3 Variance échantillonnale et Ecart-Type échantillonnale  
  2.1.4 Distributions de Probabilité 
  2.1.5 Echantillonnage ou Sampling 
  2.1.6 Hypothèses statistiques et Tests de signification (StatisticalHypotheses and Tests of Significance) 
  2.1.7 Méthodes d'analyses multivariées 
2.2 Objectif 
2.3 Pré-requis 
Chapitre 3. Méthodes d’estimation de la taille des populations.
Chapitre 4. Age, Croissance et Mortalité
Chapitre 5. Stock, Production, recrutement
Chapitre 6. SELECTIVITE DES FILETS
Chapitre 7. Transformation et conservation des produits de pêche
Chapitre 8. Exercices d’application
Chapitre 9. Ressources du cours
Page d'accueil Table des matières Niveau Supérieur Précédent Haut de la page Suivant Eléments de Statistiques Appliquées pour Ecologues et Aménagistes Résumé QCM Bibliographie Webographie Glossaire Aide
 

2.1.7. Méthodes d'analyses multivariées

Typologie des méthodes multivariées.

Comme nous l'avons vu plus haut une population peut être définie par une variable (taille), deux variables (taille et poids) ou plus de variables. Si la population est définie par plus de deux variables on utilise soit les méthodes de régressions multiples soit les méthodes d'analyses multivariées pour décrire la population. Nous considérons ici le cas des analyses multivariées. Dans la plupart des cas et surtout pour ce qui concerne nos populations à échantillonner (cas de la faune) on suppose que les éléments de la population sont distribués selon la loi du hasard et que cette distribution obéit à la loi normale. Les méthodes d'analyse multivariée sont des statistiques descriptives qui permettent de comprendre l'organisation des données autour des axes du plan (plan euclidien, plan tridimensionnel). 
Les méthodes communément utilisées sont les ACP (analyse en composantes principales), les AFC (Analyses factorielles par correspondance), les AC (analyses canoniques), les Classifications hiérarchiques. Le tableau 10 donne une typologie des méthodes multivariées couramment utilisées et les objectifs poursuivis dans l'application de chacune de ces méthodes multivariées ou des méthodes de régressions multiples. 

Tableau 6: Typologie des méthodes d'analyse multivariées

.

Définition de la matrice de données

Une matrice de données est un groupe de données rangées en ligne (horizontalement) et en colonnes (verticalement) et délimitée par des crochets. Les données sont les éléments de la matrice. Chaque donnée est définie par deux nombres en indice (exemple aij) où le 1er nombre en indice désigne la ligne tandis que le second est la colonne de la matrice. Une matrice est désignée par le nombre de lignes et le nombre de colonnes (exemple matrice de dimension r.c). Donnons un exemple de données matricielles : considérons le poids à la naissance de différentes lignées de lionceaux. Le poids des lignées sont décrites par les variables x1, x2, x3, x4 et N lions ont été étudiés. Les données peuvent être arrangées de la façon suivante :


Figure 20 : Exemple de matrice de données

Un tel arrangement des données est connu sous les noms de matrice et vecteur et les principes de manipulation de ces nombres sont regroupés sous l'appellation algèbre des matrices. C'est cette algèbre des matrices qu'on appelle virtuellement analyses multivariées. Il va de soi que la complexité de cette algèbre des matrices nécessite l'utilisation de l'ordinateur pour effectuer les opérations prescrites dans les différentes méthodes d'analyses des données. Il existe plusieurs types de matrice comme le décrit le schéma ci-dessous 

Figure 21 : Exemple de types de matrices de données

La méthode d'analyse en composantes principales (ACP) ∙

L'ACP est un modèle linéaire qui explique la variation d'abondance des espèces étudiées en relation avec les valeurs des données sur les facteurs de l'environnement concerné. Le modèle transforme les variables observées en nouvelles variables non corrélées appelées composantes principales. Chaque composante principale (yj) est la combinaison linéaire des variables observées (x1, …….xp) telle que yj= a1jx1+……….+ apjxp, avec apj les éléments du vecteur caractéristique de la matrice de covariance S de l'échantillon. La première composante principale des observations est une composante linéaire dont l'équation s'écrit y1= a11x1+………….ap1xp et l'équation matricielle est y1=a'1X. Cette matrice aura pour variance S2y1= a'1Sa1, S est la matrice de covariance. La matrice X est composées de données supposées suivre une distribution multivariée avec m le vecteur des moyennes.

                                       X11…………………x1p 

                         X=  

                                       XN1………………….xNp 

Exercice : Exemple d'application dans SAS (statistical analysis system) de l'ACP Considérons une matrice de données avec les variables x1, x2, x3 et x4. Le programme suivant peut être utiliser dans SAS pour l'ACP. Voir SAS user's guide pour l'écriture complète d'un programme. NB: ce programme SAS est la version sur DOS. Une version sur Windows existe.

data bubale;

options pagesize=80 linesize=90;

input species season length weight age sexe;

cards;

proc print;

run;

proc factor method=principal corr simple scree ev score nfactors=5;

var season length weight age sexe;

proc princomp out=prin;

title'ACP1 de Bubale Nazinga';

var season length weight age sexe;

title'ACP2 de Bubale Nazinga';

proc print data=prin;

var prin1-prin5;

run;

proc plot;

plot prin2*prin1=length/ vpos=19;

plot prin3*prin1=length/ vpos=19;

Title 'Distribution des points';

run;

plot prin2*prin1=season/ vpos=1ç;

plot prin3*prin1=season/ vpos;

Title'Distribution des points en fonction de la saison';

run;

La méthode d'analyse des correspondances ∙

Cette méthode d'analyse des correspondances est très utilisée surtout en écologie pour organiser les données par catégories sur le plan euclidien. La matrice de données est composée de lignes qui sont les sites et de colonnes qui sont les espèces. Les données sont surtout des fréquences, des productions, des couvertures végétales, etc.

                                          Colonnes= espèces 

                                        1…………………..........p      

Lignes=sites                      2 .................................

                                         ………………….............

                                          n..................................

N.B : Ce sont en fait des tableaux de contingence auquel l'ACP ne s'adapte pas. Dans l'ACP on parle d'individus en lignes et de variables en colonnes or dans l'analyse des correspondances (AC) on parle de caractères en lignes et caractères en colonnes. Dans l'ACP lignes et colonnes jouent le même rôle. L'exercice suivant est la situation des inscriptions dans une université sur 11 années académiques (colonnes). Les étudiants sont répartis dans des différentes facultés (lignes). On demande de saisir les données et de procéder à leur analyses en AC dans SAS.

Le programme suivant est proposé (voir manuel de statistiques pour écologues et aménagistes de la faune): 

1. Data incription ;

2. Input …………. ; 

3. Run ;

4. proc corresp all ;

5.proc var x1 x2 …..xp ; 

6. run ;

La méthode d'analyse factorielle discriminante ∙

Soit deux populations A et B présentant des différences nettes et des différences apparentes. L'analyse discriminante est appliquée quand il n'y a pas de différence nette. On définit une nouvelle variable z telle que z= L1x1+L2x2+………..Lpxp telle que A possède la plus grande valeur de z et B la plus petite. z est appelée fonction discriminante.

<> Exercice d'application : Soit deux écosystèmes de productivités différentes E1 et E2. On peut faire une séparation (discrimination) des 2 populations en utilisant un programme pour l'analyse factorielle discriminante (conf. manuel de statistiques pour écologues et aménagistes de la faune). Le programme suivant est proposé :  

1. Data hippotrague ; 

2. Input……………. ; 

3. run;

4. Proc discrim data= hippotrague simple wcov pcov manova list out= sxcal; 

5. run;

Page d'accueil Table des matières Niveau Supérieur Précédent Haut de la page Suivant Eléments de Statistiques Appliquées pour Ecologues et Aménagistes Résumé QCM Bibliographie Webographie Glossaire Aide