Conception et analyse de la forme limite d'une famille de coefficients statistiques d'association entre variables relationnelles. 1ère partie
Mathématiques informatique et sciences humaines, Volume 118 (1992), pp. 33-52.

This study gives a large synthesis view and prospective on a very general family of association coefficients between descriptive relational variables, that we have elaborated. On the other hand, very accurate technical results are provided. We assume the empirical observation of the descriptive variables on a set $O$ of elementary objects. A given coefficients is obtained by a statistical normalization of a raw association index with respect to a hypothesis of no relation (or independence). The raw index $s$ is conceived from a set theoretic representation of the two relational variables to be compared. The case where the two variables associated are unary, provides a clear setting up of the comparison problem. We particularly analyse the case where the two relation on $O$, induced by the two descriptive variables to be compared are binary. The latter case is extremely useful in qualitative data analysis. The normalization of the raw index $s$ takes into account the distribution of the random raw index $S$ under an independence hypothesis. The reduction of the “centred” index [$s-E\left(S\right)$ where $E$ denotes the mathematical expecitation] is done with the standard deviation $\sqrt{var\left(S\right)}$. It is specific expression of the variance $var\left(S\right)$, which enables to set up the limiting form of an association coefficient, under natural asymptotic conditions. Then, we carefully study the very important cases where the descriptive variables are nominal or ordinal qualitative. The limit expression permits to realize the nature of the normalization, from a purely formal point of view. Next, we take up the study of the general case of the comparison of two $q$-ary relations. Accurate results are given in the latter context. Finally, we express our current research and their future developement ; more particularly by situating the place of this work in our approach of data analysis by means of hierarchical classification.

Cette étude offre une large vision de synthèse prospective : mais aussi, des résultats techniques précis sur une famille très générale que nous avons élaborée de coefficients d'association entre variables descriptives relationnelles à partir de leur observation empirique sur un ensemble O d'objets élémentaires. Un même coefficient est obtenu à partir d'une forme de normalisation statistique par rapport à une hypothèse d'absence de liaison, d'un indice brut d'association. Ce dernier suppose une représentation de type ensembliste des deux variables relationnelles à comparer. Le cas où les deux variables sont unaires introduit et pose clairement le problème. Nous étudions particulièrement le cas où les deux relations induites par les deux variable sont binaires. Ce cas est d'un extrême utilité en analyse des données qualitatives. La normalisation suppose le centrage et la réduction par l'écart type de l'indice brut aléatoire. C'est une expression particulière de la variance de ce dernier qui permet de mettre en évidence la forme limite du coefficient d'association dans des conditions qualitatives nominales ou ordinales. L'expression limite permet de se rendre compte d'un point de vue purement formel de la nature de la normalisation ainsi effectuée. Nous abordons ensuite un cas assez général de recherches actuelles et développements futurs, en situant la place de ce travail dans l'aspect «classification hiérachique» de notre approche en analyse des données.

Lerman, Israël-César. Conception et analyse de la forme limite d'une famille de coefficients statistiques d'association entre variables relationnelles. 1ère partie. Mathématiques informatique et sciences humaines, Volume 118 (1992), pp. 33-52.

