Analyse factorielle multiple procustéenne
Journal de la société française de statistique, Volume 148 (2007) no. 2, p. 65-97

To compare two homologous clouds of points, the classical method is the procrustes analysis and, in the case of more than two clouds of points, the Generalized Procrustes Analysis (GPA). The multiple factor analysis (MFA) also provides a superimposed representation in order to compare several homologous clouds of points. In this latter superimposed representation, the clouds of points to compare experience other distorsions different from only rotations. MFA can be complemented by a procrustes adjustment of each initial cloud of points on the average cloud of the MFA. This superimposed representation of these initial clouds of points respects, at the same time, the procrustes pattern and is included in MFA framework, hence the name of Procrustes Multiple Fator Analysis (PMFA). This new representation is especially very useful when initial clouds are two-dimensional ones. The properties of this new representation are here described. It happens that we only have a part of the data set. This situation is frequent in the case of the presented application. An algorithm of imputation is here described allowing the use, even in that case, of the PMFA. This situation is illustrated by an application in sensory analysis.

Pour comparer deux nuages de points homologues, la méthode de référence est l'analyse procustéenne et, dans le cas de plus de deux nuages, l'analyse procustéenne généralisée (APG). L'analyse factorielle multiple (AFM) fournit aussi une représentation superposée permettant de comparer des nuages de points homologues. Dans cette représentation superposée les nuages à comparer subissent des déformations autres que les seules rotations. Il est possible de compléter l'AFM par un ajustement procustéen de chacun des nuages initiaux sur le nuage moyen de l'AFM. On obtient ainsi une représentation de ces nuages qui à la fois respecte le modèle procustéen et s'inscrit dans le cadre de l'AFM, d'où le nom d'analyse factorielle multiple procustéenne (AFMP). Cette nouvelle représentation est précieuse lorsque les nuages initiaux sont bidimensionnels. Les propriétés de cette nouvelle représentation sont décrites. Il arrive que l'on ne dispose pas d'une partie des données. Cette situation est fréquente dans le cas de l'application présentée. On décrit ici un algorithme d'imputation qui permet d'utiliser l'AFMP même dans ce cas. Cette situation est illustrée par une application en analyse sensorielle.

Keywords: multiple factor analysis, generalized procrustes analysis, missing data, imputation
@article{JSFS_2007__148_2_65_0,
     author = {Morand, Elisabeth and Pag\`es, J\'er\^ome},
     title = {Analyse factorielle multiple procust\'eenne},
     journal = {Journal de la soci\'et\'e fran\c caise de statistique},
     publisher = {Soci\'et\'e fran\c caise de statistique},
     volume = {148},
     number = {2},
     year = {2007},
     pages = {65-97},
     language = {fr},
     url = {http://www.numdam.org/item/JSFS_2007__148_2_65_0}
}
Morand, Elisabeth; Pagès, Jérôme. Analyse factorielle multiple procustéenne. Journal de la société française de statistique, Volume 148 (2007) no. 2, pp. 65-97. http://www.numdam.org/item/JSFS_2007__148_2_65_0/

[1] Arnold G.M. et Williams A. A. (1986) The use of generalised procrustes analysis in sensory analysis, Statistical procedure in food research, Elsevier, p. 233-253.

[2] Commandeur J.J.F. (1991) Matching configurations. DSWO press, Leiden.

[3] Dijksterhuis G. B. et Punter P. (1990) Interpreting generalized procrustes analysis « Analysis of Variance » tables. Food Quality and Preference, 2, p. 255-265.

[4] Dijksterhuis G. B. et Gower J.C. (1991) The interpretation of generalized procrustes analysis and allied methods. Food Quality and Preference, 3, p. 67-87.

[5] Escofier B. et Pagès J. (1998) Analyses factorielles simples et multiples, Dunod.

[6] Escoufier Y. (1973) Le traitement des variables vectorielles. Biometrics, 29, p. 751-760. | MR 334416

[7] Gower J.-C. (1975) Generalized Procrustes Analysis. Psychometrika, 40, p. 33-51. | MR 405725 | Zbl 0305.62038

[8] Kazi-Aoual F., Hitier S., Sabatier R. et Lebreton J.-D. (1995) Refined Approximation to Permutation Tests for Multivariate Inference. Computational Statistics and Data Analysis, 20, p. 643-656. | MR 1369186 | Zbl 0875.62183

[9] Krzanowski W. J. (1990) Principles of Multivariate Analysis. A User's Perspective, Oxford Statistical Science Series, Oxford. | MR 1133626 | Zbl 0678.62001

[10] Morand E. et Pagès J. (2003) Incorporation de rotations procrustéennes dans une analyse factorielle multiple procrustéenne. Revue de Nouvelles Technologies de l'Information, C1(1), p. 101-111.

[11] Morand E. et Pagès J. (2006) Procrustes multiple factor analysis to analyse the overall perception of food products. Food Quality and Preference, 17, p. 36-42.

[12] Pagès J. (2003) Recueil direct de distances sensorielles : application à l'évaluation de dix vins blancs de Val-de-Loire. Science des Aliments, 23(5/6), p. 679-888.

[13] Qannari E.M, Macfie H.J.H et Courcoux P.(1999) Performance indices and isotropic scaling factors in sensory profiling. Food Quality and Preference, 10, p. 17-21.

[14] R DEVELOPMENT CORE TEAM (2004). R : A language and environment for statistical computing. R Foundation for Statistical Computing, Vienna, Austria. ISBN 3-900051-07-0, URL http ://www.R-project.org.

[15] Saporta G. (1990) Probabilités analyse des données et statistiques, Technip. | Zbl 0703.62003

[16] Schlich P. (1996) Defining and validating assessor compromises about products distances and attribute correlations, Multivariate Analysis of Data in Sensory Science, Elsevier, p259-306.

[17] Sibson R. (1978) Studies in the robustness of multidimensional scaling : Procrustes Analysis. J. Royal Statist. Soc. B, 40, p. 234-238. | Zbl 0389.62086

[18] Ten Berge J.M.F. (1977) Orthogonal procrustes rotation for two or more matrices. Psychometrika, 42(2), p. 267-276. | MR 501589 | Zbl 0362.92020