Guénoche, Alain; Grandcolas, Stéphane
Approximations par arbre d'une distance partielle
Mathématiques et Sciences humaines, Tome 146 (1999) , p. 51-64
MR 1707210 | 1 citation dans Numdam
URL stable : http://www.numdam.org/item?id=MSH_1999__146__51_0

Mots clés: reconstruction d'arbre, distance partielle, méthode séquentielle
En classification par arbre, on cherche à ajuster une dissimilarité donnée par une distance d'arbre. Mais bien souvent, surtout par comparaison de séquences biologiques, les valeurs obtenues sont peu fiables, voire indéterminées. On a alors une distance partielle qui n'est pas définie pour toute paire. Dans ce cas, on peut soit développer une méthode spécifique qui n'utilise que les valeurs disponibles, soit estimer les valeurs manquantes et utiliser une méthode classique pour reconstruire l'arbre. Cet article présente deux méthodes de ce type et les compare à l'aide de simulations sur des distances d'arbre partielles et bruitées.
In tree clustering, we try to approximate a given dissimilarity matrice by a tree distance. In some cases, especially when comparing biological séquences, some dissimilarity values cannot be evaluated and we get some partial dissimilarity with undefined values. In that case one can develop a sequential method to reconstruct a valued tree or evaluate the missing values using a tree model. This paper introduces two methods of this kind and compare them simulating noisy partial tree dissimilarities.

Bibliographie

Barthélemy, J.P., Guénoche, A., Les arbres et les représentations des proximités, Collection "Méthodes et Programmes", Masson, 1988, Trees and Proximity Representations, J. Wiley,1991.

Buneman, P., "The recovery of trees from measures of dissimilarity", Mathematics in Archaeological and Historical Sciences, F.H. Hodson, D.G. Kendall, P. Tautu (Eds.), Edimburg University Press, (1971), 387-395.

De Soete, G., "Ultrametric tree representations of incomplete dissimilarity data ", J. of Classification, 1, (1984), 235-242.

De Soete, G., "Additive-tree representations of incomplete dissimilarity data", Qual. Quantity, 18, (1984), 387-393.

Duret, L., Mouchiroud, D., Gouy, M., "Hovergen : a database of homologous vertebrate genes", Nucleic Acids Res., 22, (1994), 2360-2365.

Gascuel, O., "Concerning the NJ Algorithm and its Unweighted Version, UNJ", Mathematical Hierarchies and Biology, B. Mirkin et al. (Eds.), DIMACS Series Discrete Mathematics and Theoretical Computer Science 37, AMS, (1997), 149-170. MR 1600536 | Zbl 0933.92026

Guénoche, A., Leclerc, B., "La méthode des triangles pour reconstruire un arbre à partir de distances incomplètes", Actes des Journées de la Société Francophone de Classification, Agro-Montpellier, (1998), 117-120.

Guénoche, A., Leclerc, B., "The triangles method to build phylogenetic trees from incomplete distance matrices", soumis à publication, (1998), 18 p.

Lapointe, F.J., Kirsch, J.A.W., "Estimating phylogenies from lacunose distances matrices : Additive is superior to Ultrametric estimation", Molecular Biology Evolution, 13(6), (1996), 266-284.

Leclerc, B., "La méthode de dispersion", communication personnelle (1986). Voir Barthélemy, J.-P. & Guénoche, A., p. 74 (1988) & p. 73 (1991).

Leclerc, B., "Minimum spanning trees for tree metrics : abridgements and adjustments ", J. of Classification, 12, (1995), 207-241. MR 1379502 | Zbl 0845.62046

Leclerc, B., Makarenkov, V., "On some relations between 2-trees and tree metrics", Discrete Math., 192, (1998), 223-249. MR 1656734 | Zbl 0958.05029

Makarenkov, V., Leclerc, B., "The fitting of a tree metric to a given dissimilarity with the weighted least squares crterion", Journal of Classification, (1999), 223-249. MR 1656734

Robinson, D.R., Foulds, L.R., "Comparison of phylogenetic trees", Mathematical Biosciences, 53, (1981), 131-147. MR 613619 | Zbl 0451.92006

Saitou, N., Nei, M., "The neighbor-joining method: a new method for reconstructing phylogenetic trees", Molecular Biology Evolution, 4, (1987), 406-425.

Studier, J.A., Keppler, K.J., "A note on the neighbor-joining method of Saitou and Nei", Molecular Biology Evolution, 5, (1988), 729-731.

Zaretskii, K., "Construction d'un arbre sur la base d'un ensemble de distances entre ses feuilles" (en russe), Uspekhi Mat. Nauk., 20, (1965), 90-92. Zbl 0151.33302

Waterman, M.S., Smith, T.F., Singh, M., Beyer, W.A., "Additive Evolutionary Trees", Journal of Theoretical Biology, 64, (1977), 199-213. MR 503996