ACPVI multibloc. Application en épidémiologie animale
Journal de la société française de statistique, Volume 148 (2007) no. 4, p. 77-94

We discuss factor analytic methods to study a set of (K+1) data tables where we wish to predict a data set Y from K other data sets X k (k=1,,K). The methods of analysis are based on an extension of Principal Component Analysis on Instrumental Variables, also called Redundancy Analysis. We outline the general approach and show its relationships to existing methods. The method of analysis is illustrated on the basis of a case study in animal epidemiology.

Des analyses factorielles permettant l’étude conjointe de (K+1) tableaux de données sont proposées pour le cas où un tableau Y est prédit à l’aide de K tableaux X k (k=1,,K). Ces méthodes factorielles sont basées sur une extension de l’Analyse en Composantes Principales sur Variables Instrumentales (ACPVI), appelée aussi analyse des redondances. Une discussion sur le positionnement des méthodes développées par rapport aux méthodes existantes est présentée. La démarche est illustrée sur la base d’une étude de cas en épidémiologie animale.

Keywords: principal component analysis on instrumental variables, redundancy analysis, multiblock analysis
@article{JSFS_2007__148_4_77_0,
     author = {Bougeard, St\'ephanie and Hanafi, Mohamed and Qannari, El Mostapha},
     title = {ACPVI multibloc. Application en \'epid\'emiologie animale},
     journal = {Journal de la soci\'et\'e fran\c caise de statistique},
     publisher = {Soci\'et\'e fran\c caise de statistique},
     volume = {148},
     number = {4},
     year = {2007},
     pages = {77-94},
     language = {fr},
     url = {http://www.numdam.org/item/JSFS_2007__148_4_77_0}
}
Bougeard, Stéphanie; Hanafi, Mohamed; Qannari, El Mostapha. ACPVI multibloc. Application en épidémiologie animale. Journal de la société française de statistique, Volume 148 (2007) no. 4, pp. 77-94. http://www.numdam.org/item/JSFS_2007__148_4_77_0/

[1] A.J. Burnham, R. Viveros et J.F. Macgregor (1996), Framework for latent variable multivariate regression. Journal of chemometrics, 10 :31-45.

[2] J.D. Carroll (1968), A generalization of canonical correlation analysis to three or more sets of variables. In 76th annual convention of the American psychological association, pages 227-228.

[3] P. Cazes (1975), Protection de la régression par utilisation de contraintes linéaires et non linéaires. Revue de statistique appliquée, XXIII(3) :37-57. | Numdam | MR 415904

[4] D. Chessel et P. Mercier (1993), Couplage de triplets statistiques et liaisons espèces environnement. In LEBRETON J.D. et ASSELAIN B., éditeur : Biométrie et environnement, pages 15-44. MASSON, Paris.

[5] P.T. Davies et M. K.S. Tso (1982), Procedures for reduced-rank regression. Appl. Statist., 31 :244-255. | MR 694919

[6] A.E. Hoerl et R.W. Kennard (1970), Ridge regression : biaised estimation for nonorthogonal problems. Technometrics, 12 :55-67. | Zbl 0202.17205

[7] G. Kissita (2003), Les analyses canoniques généralisées avec tableau de référence généralisé : éléments théoriques et appliqués. Thèse de doctorat, Université Paris Dauphine

[8] G. Kissita, P. Cazes, M. Hanafi et R. Lafosse (2004), Deux méthodes d'analyse factorielle du lien entre deux tableaux de variables partitionnés. Revue de statistique appliquée, LII(3) :73-92. | Numdam

[9] R. Lafosse et M. Hanafi (1997), Concordance d'un tableau avec K tableaux : définition de K+1uples synthétiques. Revue de statistique appliquée, XLV (4) :111-126. | Numdam

[10] K.E. Muller (1981), Relationships between redundancy analysis, canonical correlation and multivariate regression. Psychometrika, 46(2) :139-142. | MR 649218 | Zbl 0505.62035

[11] H. Nocairi, M. Hanafi et E.M. Qannari (2005), Approche continuum de la discrimination de type ridge. Revue de statistique appliquée, LIII(2) :29-41.

[12] C.R. Rao (1964), The use and interpretation of principal component analysis in applied research. Sankhya, A., 26 :329-358. | MR 184375 | Zbl 0137.37207

[13] N. Rose, G. Larour, G. Le Digherher, E. Eveno, J.P. Jolly, P. Blanchard, A. Oger, M. Le Dinma, A. Jestin et F. Madec (2003), Risk factors for porcine post-weaning multisystemic wasting syndrome (PMWS) in 149 french farrow-to-finish herds. Preventive Veterinary Medicine, 61 :209-225.

[14] R. Sabatier (1987a), Analyse factorielle de données structurées et métriques. Statistique et analyse des données, 12(3) :75-96. | Numdam | MR 984840

[15] R. Sabatier (1987b), Méthodes factorielles en analyse de données : approximations et prise en compte de variables concomitantes. Thèse de doctorat, Université des sciences et techniques du Languedoc.

[16] G. Saporta (2006), Probabilités, analyse des données et statistique (2nd édition). Technip, Paris. | Zbl 1185.62008 | Zbl 0703.62003

[17] M. Stone (1974), Cross-validatory choice and assessment of statistical predictions. Journal of the Royal Statistical Society, 36(1) :111-147. | MR 356377 | Zbl 0308.62063

[18] M. Tenenhaus (1998), La régression PLS. Théorie et pratique. Technip, Paris. | MR 1645125 | Zbl 0923.62058

[19] M. Tenenhaus (1999), L'approche PLS. Revue de statistique appliquée, 47(2) :5-40. | Numdam

[20] M. Tenenhaus, J. Pages, L. Ambroisine et C. Guinot (2005a), PLS methodology to study relationships between hedonic judgements and product characteristics. Food quality and preference, 16 :315-325.

[21] M. Tenenhaus, V.E. Vinzi, Y.M. Chatelin et C. Lauro (2005b), PLS path modeling. Computational statistics and data analysis, 48 :159-205. | MR 2134489 | Zbl 05374099 | Zbl pre05374099

[22] J.P. Van De Geer (1984), Linear relations among K sets of variables. Psychometrika, 49 (1) :79-94.

[23] A. Van Den Wollenberg (1977), Redundancy analysis : an alternative for canonical correlation analysis. Psychometrika, 42(2) :207-219. | Zbl 0354.92050

[24] M. Vivien (2002), Approches PLS linéaires et non-linéaires pour la modélisation de multi-tableaux : théorie et applications. Thèse de doctorat, Université de Montpellier 1.

[25] J.A. Westerhuis et P.M.J. Coenegracht (1997), Multivariate modelling of the pharmaceutical two-step process of wet granulation and tableting with multiblock partial least squares. Journal of chemometrics, 11(5) :379-392.

[26] J.A. Westerhuis, T. Kourti et J.F. Macgregor (1998), Analysis of multiblock and hierarchical PCA and PLS model. Journal of chemometrics, 12 :301-321.

[27] H. Wold (1982), Soft modelling : the basic design and some extensions. In K.G JÖRESKOG et H. WOLD, éditeurs : System under indirect observation. Part 2, pages 1-54. North-Holland, Amsterdam. | MR 692219 | Zbl 0517.62065

[28] S. Wold (1984), Three PLS algorithms according to SW. In S. WOLD, éditeur : Symposium MULDAST (multivariate analysis in science and technology), pages 26-30, Umea University, Sweden.

[29] S. Wold, N. Kettaneh et K. Tjessem (1996), Hierarchical multiblock PLS and PC models for easier model interpretation and as an alternative to variable selection. Journal of chemometrics, 10 :463-482.

[30] S. Wold, H. Martens et H. Wold (1983), The multivariate calibration problem in chemistry solved by the PLS method. In Ruhe A. B. et KASTROM, éditeurs : Proceedings of the Conference on Matrix Pencils, pages 286-293. Springer Verlag, Heidelberg. | MR 697741 | Zbl 0499.65065