Iris de Fisher: sus posibilidades para un aprendizaje significativo de la clasificación y discriminación multivariantes<br>Iris de Fisher: its possibilities for a meaningful learning of the multivariate classification and discrimination

Autores

  • Diamela Giselle Titionik Universidad Nacional de La Pampa
  • Laura Beatriz Wagner Universidad Nacional de La Pampa
  • Maria Paula Dieser Universidad Nacional de La Pampa
  • María Critina Martín Universidad Nacional del Sur
  • Erica Schlaps Universidad Nacional de Tierra del Fuego, Antártida e Islas del Atlántico Sur
  • Lorena Veronica Cavero Universidad Nacional de La Pampa

DOI:

https://doi.org/10.23925/1983-3156.2019v21i1p093-110

Palavras-chave:

análisis lineal discriminante, análisis de clusters, software R

Resumo

El conjunto de datos “Iris de Fisher” ha sido extensamente utilizado en la literatura estadística y en numerosos artículos sobre testeo y comparación de técnicas de discriminación y clasificación multivariadas. Sin embargo, los modelos creados a partir de estas técnicas, requieren el cumplimiento de ciertos supuestos que no son satisfechos por este conjunto de datos. El objetivo de este trabajo es presentar una propuesta para introducir los procedimientos del Análisis Lineal Discriminante y el Análisis de Agrupamientos (Clusters) utilizando estos datos clásicos, en un curso de análisis estadístico multivariado exploratorio, mediante el empleo del software R, con especial atención en el análisis de los supuestos necesarios, la estimación e interpretación de los modelos obtenidos, y la validación de resultados.

The "Fisher's Iris" data set has been extensively used in the statistical literature and in numerous articles on testing and comparing multivariate discrimination and classification techniques. The models created from these technique, require the fulfillment of certain assumptions, but these assumptions are not satisfied by this data set. The aim of this work is presenting a proposal to introduce the procedures of Linear Discriminant Analysis and Clusters Analysis using these classic data, in a course of exploratory multivariate analysis, using R software, with special focus on necessary assumptions analysis, the obtained models estimation and interpretation, and the results validation.

Metrics

Carregando Métricas ...

Referências

ANDERSON, E. The irises of the Gaspé Peninsula. Bulletin of the American Iris Society, v. 59, p. 2–5, 1935.

AUSUBEL, D. Psicología educativa. México: Trillas, 1976.

BATANERO, C. et al. Enseñanza de la estadística a través de proyectos. In: BATANERO, C.; DÍAZ, C. (Eds.): Estadística con proyectos. Granada: Departamento de Didáctica de la Matemática, 2011, p. 9–46.

BEZDEK, J. C. et al. Will the Real Iris Data Please Stand Up? IEEE Transactions on Fuzzy Systems, v. 7, n. 3, p. 368–369, 1999.

de OLIVEIRA BUSSAB, W.; MIAZAKI, E. S.; de ANDRADE, D. Introdução à Análise de Agrupamentos. San Pablo: Asociación Brasilera de Estadística, 1996.

DÍAZ BARRIGA, F. Cognición situada y estrategias para el aprendizaje significativo. Revista Electrónica de Investigación Educativa, v. 5, n. 2, 2003.

DUNN, J. C. A Fuzzy Relative of the ISODATA Process and Its Use in Detecting Compact Well-Separated Clusters. Journal of Cybernetics, v. 3, n. 3, p. 32–57, 1973.

FISHER, R. A. The Use of Multiple Measurements in Taxonomic Problems. Annals of Eugenics, v. 7, n. 2, p. 179–188, 1936.

FORGY, E. W. Cluster analysis of multivariate data: efficiency vs. interpretability of classifications. Biometrics, v. 21, p. 768–769, 1965.

FRANKLIN, C. et al. Guidelines for assessment and instruction in statistics education (GAISE) report: A Pre-K-12 curriculum framework. Alexandria, VA: American Statistical Association, 2005.

GAL, I. Adult's statistical literacy. Meanings, components, responsibilities. International Statistical Review, v. 70, n. 1, p. 1–25, 2002.

HARTIGAN, J. A.; WONG, M. A. A k-means clustering algorithm. Applied Statistics, v. 28, p. 100–108, 1979.

JOHNSON, R. A.; WICHERN, D. W. Applied multivariate statistical analysis. 6th ed. New Jersey: Pearson Prentice Hall, 2007.

KAUFMAN, L.; ROUSSEEUW, P. J. Finding Groups in Data: An Introduction to Cluster Analysis. New York: Wiley, 1990.

MACQUEEN, J. Some methods for classification and analysis of multivariate observations. In L. M. Le Cam y J. Neyman (Eds.), Proceedings of the Fifth Berkeley Symposium on Mathematical Statistics and Probability. Berkeley, CA: University of California Press, 1967, p. 281–297.

PISON, G.; STRUYF, A.; ROUSSEEUW, P. J. Displaying a clustering with CLUSPLOT. Computational Statistics & Data Analysis, v. 30, p. 381–392, 1999.

POZO MUNICIO, J. I.; PÉREZ ECHEVERRÍA, M. del P. Aprender para comprender y resolver problemas. In: (Eds.), Psicología del aprendizaje universitario. Madrid: Ediciones Morata, 2009, p. 31–53.

SOKAL, R. R.; ROHLF, F. J. The comparison of dendrograms by objective methods. Taxon, v. 11, p. 33–40, 1962.

WELCH, B. L. Note on Discriminant Functions. Biometrika, v. 31, p. 218–220, 1939.

WILD, C.; PFANNKUCH, M. Statistical thinking in empirical enquiry. International Statistical Review, v. 67, n. 3, p. 223–265, 1999.

Downloads

Publicado

2019-04-29

Edição

Seção

Artigos