Abstract
Dendrograms are widely used to represent graphically the clusters and partitions obtained with hierarchical clustering schemes. Espaliers are generalized dendrograms in which the length of horizontal lines is used in addition to their level in order to display the values of two characteristics of each cluster (e.g., the split and the diameter) instead of only one. An algorithm is first presented to transform a dendrogram into an espalier without rotation of any part of the former. This is done by stretching some of the horizontal lines to obtain a diagram with vertical and horizontal lines only, the cutting off by diagonal lines the parts of the horizontal lines exceeding their prescribed length. The problem of finding if, allowing rotations, no diagonal lines are needed is solved by anO(N 2) algorithm whereN is the number of entities to be classified. This algorithm is the generalized to obtain espaliers with minimum width and, possibly, some diagonal lines.
Résumé
Les dendrogrammes sont fréquemment utilisés pour représenter graphiquement les classes et les partitions obtenues par les méthodes de classification hiérarchique ascendantes ou descendantes. Les espaliers sont des dendrogrammes généralisés où la longueur des lignes horizontales est utilisée en plus de leur niveau pour représenter deux caractéristiques de chaque classe (par exemple l'écart et le diamètre) au lieu d'une seule. On présente d'abord un algorithme pour transformer un dendrogramme en espalier sans permettre de rotation d'aucune partie du premier. Ceci est fait en allongeant certaines des lignes horizontales de façon à obtenir un diagramme utilisant seulement des lignes horizontales et verticales, puis en coupant par des lignes diagonales les parties des lignes horizontales excèdant la longueur qui leur est affectée. Le problème de déterminer si, les rotations étant permises, aucune ligne diagonale n'est nécessaire est résolu par un algorithme polynomial enO(N 2) oùN est le nombre d'objets à classifier. Cet algorithme est généralisé pour résoudre le problème de déterminer un espalier de largeur minimum avec, éventuellement, des lignes diagonales.
Similar content being viewed by others
References
BROSSIER, G. (1980). “Représentation ordonnée des classifications hiérarchiques,”Statistique et Analyse des Données, 2, 31–44.
BUFFON, G. L., LECLERC, Comte de (1749),Histoire Naturelle, Premier Discours: De la manière d'étudier et de traiter l'histoire naturelle, Paris.
CHANDON, J., LEMAIRE, J., and POUGET, J. (1980). “Construction de l'ultramétrique la plus proche d'une dissimilarité au sens des moindres carrés,”RAIRO-Recherche Opérationnelle, 14(2), 157–170.
DELATTRE, M., and HANSEN, P. (1980). “Bicriterion, Cluster Analysis”IEEE Transactions on Pattern Analysis and Machine Intelligence, PAMI-2(4), 277–291.
GLASBEY, C.A. (1987), “Complete Linkage as a Multiple Stopping Rule for Single Linkage Clustering,”Journal of Classification, 4, 103–109.
GORDON, A. D. (1981),Classification: Methods for the Exploratory Analysis of Multivariate Data, New York: Chapman and Hall.
GORDON, A. D. (1987), “A Review of Hierarchical Classification”Journal of Royal Statistical Society A, 150, part 2, 119–137.
GOWER, J. C., and ROSS, G. J. S. (1969), “Minimum Spanning Trees and Single Linkage Cluster Analysis,”Applied Statistics, 18, 54–64.
GUENOCHE, A., HANSEN, P., and JAUMARD, B. (1991), “Efficient Algorithms for Divisive Hierarchical Clustering with the Diameter Criterion,”Journal of Classification, 8, 5–30.
HARTIGAN, J. A. (1975),Clustering Algorithms, New York: Wiley.
HUBERT, L. (1973), “Monotone Invariant Clustering Procedures,”Psychometrika, 38(1), 47–62.
JAMBU, M. (1978),Classification automatique pour l'analyse des données, Paris: Dunod (Cluster Analysis and Data Analysis, Amsterdam: North-Holland, 1983).
JOHNSON, S. C. (1967), “Hierarchical Clustering Schemes,”Psychometrika, 12, 241–254.
KAUFMAN, L., and ROUSSEEUW, P. J. (1990),Finding Groups in Data: An Introduction to Cluster Analysis, New York: Wiley.
LANCE, G. N., and WILLIAMS, W. T. (1967), “Mixed-data Classificatory Systems: I. Agglomerative Systems,”Australian Computer Journal, 1, 15–20.
MCCAMMON, R. B. (1968), “The Dendrograph: A New Tool for Correlation,”Geological Society of America bulletin, 79, 1663–1670.
RAO, M. R. (1971), “Cluster Analysis and Mathematical Programming,”Journal of American Statistical Association, 66, 622–626.
SNEATH, P. H. A., and SOKAL, R. R. (1973),Numerical Taxonomy. The Principles and Practice of Numerical Classification, Freeman: San Francisco.
SOKAL, R. R., and ROHLF, F. J. (1962), “The Comparison of Dendrograms by Objective Methods,”Taxon, 11, 33–40.
Author information
Authors and Affiliations
Additional information
Work of the first and second authors has been supported by FCAR (Fonds pour la Formation de Chercheurs et l'Aide à la Recherche) grant 92EQ1048, and grant N00014-92-J-1194 from the Office of Naval Research. Work of the first author has also been supported by NSERC (Natural Sciences and Engineering Research Council of Canada) grant to École des Hautes Études Commerciales, Montréal and by NSERC grant GP0105574. Work of the second author has been supported by NSERC grant GP0036426, by FCAR grant 90NC0305, and by an NSF Professorship for Women in Science at Princeton University from September 1990 until December 1991. Work of the third author was done in part during a visit to GERAD, Montréal.
Rights and permissions
About this article
Cite this article
Hansen, P., Jaumard, B. & Simeone, B. Espaliers: A generalization of dendrograms. Journal of Classification 13, 107–127 (1996). https://doi.org/10.1007/BF01202584
Issue Date:
DOI: https://doi.org/10.1007/BF01202584