L'histoire de la loi d'Estoup-Zipf : documents
Mathématiques et Sciences humaines, Tome 44 (1973), p. 41-56
En 1896, V. Pareto découvrait une loi empirique qui porte depuis son nom ; il a montré que le logarithme du nombre cumulé d’individus percevant un revenu r supérieur ou égal à x est une fonction du log de x : logN rx =-αlogx. On trouva ensuite de nombreuses applications de la loi de Pareto par exemple en statistique lexicale. Dans ce domaine plusieurs auteurs contribuèrent à la mise en forme de la loi d’Estoup-Zipf : cet article présente quelques points de repère (1912-1928-1935).
In 1896, V. Pareto discovered the empirical law which is named after him ; he demonstrated that the logarithm of the accumulated number of individuals collecting an income r greater than or equal to x is a function of logx, namely logN rx =-αlogx. Afterwards one found numerous applications of Pareto’s law, for example in lexical statistics. In this field, many authors have contributed in giving form to Estoup-Zipf’s law. This article presents some benchmarks : 1912-1928-1935.
@article{MSH_1973__44__41_0,
     author = {Petruszewycz, M.},
     title = {L'histoire de la loi d'Estoup-Zipf : documents},
     journal = {Math\'ematiques et Sciences humaines},
     publisher = {Ecole Pratique des hautes \'etudes, Centre de math\'ematique sociale et de statistique},
     volume = {44},
     year = {1973},
     pages = {41-56},
     mrnumber = {354071},
     language = {fr},
     url = {http://www.numdam.org/item/MSH_1973__44__41_0}
}
Petruszewycz, M. L'histoire de la loi d'Estoup-Zipf : documents. Mathématiques et Sciences humaines, Tome 44 (1973) pp. 41-56. http://www.numdam.org/item/MSH_1973__44__41_0/

[1] Mandelbrot, B., « Les constantes, chiffrées du discours », Encyclopédie de la Pléiade Le Langage, vol, publié sous la direction d'A. Martinet, Paris, Gallimard, 1966, pp. 46-56.

[1 bis] Mandelbrot, B., « Word frequencies and Markovian models of discourse », Structure of language and its mathematical aspects, Proceedings of symposia in applied math., vol. XII, Ann. math. statist., Providence, USA, 1961.

[2] Gougenheim, C., Michea, R., Rivenc, P., Sauvageot, A., L'élaboration du français fondamental (1er degré), Étude sur l'établissement d'un vocabulaire et d'une grammaire de base, Paris, Didier, 1964.

[3] Pratt, F., Histoire de la cryptographie : Les écritures secrètes depuis l'Antiquité jusqu'à nos jours, Trad. du capitaine E. Arnaud, Paris, Payot, 1940.

[4] Zipf, G.K., Relative frequency as a determinant of phonetic change, Harvard Studies in classical Philology, vol. 40, Cambridge, Mass., Harvard University Press, 1929.

[5] Dewey, G., Relative frequency of English speech sounds, Harvard Studies in Education, Cambridge Mass., Harvard University Press, 1923. Très curieux livre écrit dans une orthographe simplifiée prônée par le Simplified Spelling Bord. De nombreuses recherches sur les fréquences de lettres, bigrammes [...] mots ont été à cette époque effectuées dans ce cadre aux USA.

[6] Germanet, F., « La sténographie, ses origines et son histoire, ses principes et son avenir, Paris, Aix-en-Provence, 1899.

[7] Thieirry-Mieg, J.-J., Phonographie à pente unique, nouveau système d'écriture abrégée, Paris, Firmin Didot, 1853.

[8] Guiraud, P., Bibliographie critique de la statistique linguistique, Utrecht, Spectrum, 1954.

[9] Navarre, A., Histoire générale de la sténographie et de l'écriture à travers les âges, Paris, Delagrave, s.d. Ouvrage introuvable que m'a aimablement communiqué Mlle Barrascud, Directrice de l'Institut Sténographique de France.

[10] Zipf, G.K., « The psychology of language », Encyclopedia of psychology, edited by P. L. Harriman, New York, Philosophical Library, 1946.

[11] Zipf, G.K., Human Behavior and the principle of least effort : An introduction to human ecology, New York, Hafner, 1949.

[12] Zipf, G.K., « Selected studies of the Principle of Relative Frequency », Language, Cambridge, Mass., 1932.

[13] Zipf, G.K., The psychobiology of language : An introduction to dynamic philology, Boston, Mass., Houghton-Mifflin, 1935.

[14] Condon, E.U., « Statistics of vocabulary », Science, vol. 57, march 16, 1928, n° 1733, p. 300.

[15] Eldridge, R.C., Six thousand common English words, privately printed at Niagara Falls, NY.

[16] Petruszewycz, M., « Loi de Pareto et processus markovien », Math. Sci. hum., n° 3, avril 1963, pp. 21-29. | Numdam