METHODS OF CLASSIFICATION IN MINING OF METEOROLOGICAL DATA

Authors

  • Silvia Haro Rivera Escuela Superior Politécnica de Chimborazo, Riobamba, Ecuador
  • Lourdes Zúñiga Lema Escuela Superior Politécnica de Chimborazo, Riobamba, Ecuador
  • Antonio Meneses Freire Universidad Nacional de Chimborazo, Riobamba, Ecuador
  • Luis Vera Rojas Escuela Superior Politécnica de Chimborazo, Riobamba, Ecuador
  • Amalia Escudero Villa Escuela Superior Politécnica de Chimborazo, Riobamba, Ecuador

DOI:

https://doi.org/10.47187/perf.v2i20.40

Keywords:

classification methods, data mining, meteorological data

Abstract

One of the objectives of data mining is classification, which aims to classify a variable within one of the categories of a class. In this work, meteorological variables of the Cumandá station were considered. In order to determine the appropriate model for the data set, the Naive Bayes, CN 2 Rule Induction, K-NN, Tree and Random Forest classification models, as well as Cross validation, Random sampling, leave one out and Test on train data, that modify the parameters associated with the classifier, were applied. Orange Performance software was used to calculate performance measures, Classification Accuary, Global Accuracy and Sensitivity. It was concluded that the classifiers Naive Bayes, CN 2 Rule Induction and K-NN presented values higher than 75 % of correctly classified instances. The decision tree and the Random Forest exceeded 80%. Regarding the methods that allow to modify the parameters associated to the classifier, it was determined that Cross-validation presented better results in all the applications. The highest precision is reached in the classifier random forest with 83 .9% applying cross-validation, followed by simple random sampling with 83.1% of true positives among the cases classified as positive.

Downloads

Download data is not yet available.

References

Hernández E, Duque N, Cadavid J. Big Data: Una exploración de investigaciones, tecnologías y casos de aplicación. Tecnológicas. 2017.

Duque N, Orozco M. Minería de datos para el análisis de datos meteorológicos. Tendencias en Ingeniería de Software e Inteligencia Artificial. ;: p. 105-114.

Segrera S, Moreno M, Miguel L. Aplicación de la minería de datos en la evaluación de la aptitud física de las tierras para el cultivo de la caña de azúcar. III taller nacional de minería de datos y aprendizaje. 2005;: p. 349-358.

Sandoval Z, Prieto F. Caracterización de café cereza empleando técnicas de visión artificial. Facultad nacional de agronomía-medellín. 2007;: p. 4105-4127.

Pascual D, Pla F, Sánchez S. Algoritmos de agrupameinto. Revista Facultad de Ingeniería. 2008;: p. 163-175.

Medina R, Ñique C. Bosques Aleatorios como extensión de los árboles de clasificación con los programas R y python. Interfases. 2017;: p. 165-189.

Robles Y, Sotolongo A. Integración de los algoritmos de minería de datos 1r, prism E id3 a postgrEsql. Gestión de tecnología y sistemas de información. 2013;: p. 389-406.

Ochoa L, Paredes K, Araya C. Evaluación de técnicas de minería de datos para la predicción del rendimiento académico. Global partnerships for development and Engineering Education. 2017.

Graham W. Data mining with rattle and R New York, USA: springer; 2011.

Orozco E, García DA. Métodos de clasificación para identificar lesiones en piel a partir de espectros de reflexión difusa. Revista Ingeniería Biomédica. 2010;: p. 34-40.

Published

2018-12-31

How to Cite

Haro Rivera, S., Zúñiga Lema, L., Meneses Freire, A., Vera Rojas, L., & Escudero Villa, A. (2018). METHODS OF CLASSIFICATION IN MINING OF METEOROLOGICAL DATA. Perfiles, 2(20), 107-113. https://doi.org/10.47187/perf.v2i20.40