• Document: Introduction à l analyse en composantes principales
  • Size: 352.34 KB
  • Uploaded: 2019-04-16 09:35:36
  • Status: Successfully converted


Some snippets from your converted document:

Eric Depiereux – Pratique des biostatistiques © module 250 http://www.fundp.ac.be/biostats/ Introduction à l’analyse en composantes principales Tables des matières : TABLES DES MATIERES : ....................................................................................... 1 OBJECTIFS................................................................................................................ 2 L’ANALYSE EN COMPOSANTE PRINCIPALE (ACP).............................................. 3 Cas de deux variables................................................................................................................................................... 3 Plus de 2 variables ........................................................................................................................................................ 6 Exemple de calcul ......................................................................................................................................................... 8 Interprétation .............................................................................................................................................................. 14 Limites de l’interprétation ........................................................................................................................................ 15 Analyse graphique des résultats. .............................................................................................................................. 16 6/09/06 1/17p Eric Depiereux – Pratique des biostatistiques © module 250 http://www.fundp.ac.be/biostats/ Objectifs L’analyse en composantes principales est la plus ancienne, la moins sophistiquée et la plus centrale des analyses factorielles. L’analyse en facteurs communs et spécifiques , l’analyse des correspondances et canonique des correspondance, l’analyse discriminante en découlent plus ou moins directement. Comprendre les fondements de l’ACP est une porte d’entrée de prédilection dans cette famille d’analyse. On peut considérer l’ACP comme une analyse descriptive visant à représenter au mieux sur un plan des objets situés dans un hyperespace dont les dimensions échappent à notre contrôle mental et nos possibilités de représentation graphique. Voici une image très parlante : L’ombre plane de ce chameau tri-dimensionnel est projetée sur deux plans. Le plan de droite est beaucoup plus informatif que le plan de gauche ! Il permet pratiquement de se passer de la troisième dimension… Si l’on reprend l’équation : variabilité = information + bruit , trouver le plan le plus informatif revient à trouver les directions dans lesquelles se trouvent la plus grande variance. En effet, si le bruit est plus grand que l’information… les données ne sont guère pertinentes. 6/09/06 2/17p Eric Depiereux – Pratique des biostatistiques © module 250 http://www.fundp.ac.be/biostats/ L’Analyse en composante principale (ACP) Cas de deux variables Imaginons 2 variables standardisées Z1 et Z2 formant la matrice Z, et la matrice orthogonale C correspondant à une rotation de 45° (voir module 220, rotation orthogonale). Le produit s’écrit Y = ZC Z C Y 0,369 -0,570 -0,142 -0,664 1,108 0,570 0,71 -0,71 1,187 -0,380 -1,477 -1,331 0,71 0,71 = -1,985 0,103 -1,108 -0,951 -1,456 0,111 0,000 0,951 0,672 0,672 1,108 1,331 1,724 0,158 moyenne 0,000 0,000 0,000 0,000 variance 1,000 1,000 1,819 0,181 RZ Ry 1,000 0,819 1,000 0,000 0,819 1,000 0,000 1,000 Nous constatons que les variables z1 et z2 sont corrélées (R = 0,819) et ont une variance 1, tandis que les variables y1 et y2 ne sont pas corrélées (R = 0) et ont une variance 1,819 et 0,181 respectivement. La variance totale (2) est inchangée. La corrélation a donc été transformée en variance. Dans le système d’axe Y (composantes principales), on trouve une grande variance (beaucoup d’information) et une petite variance (bruit ?). 6/09/06 3/

Recently converted files (publicly available):