MÉTODOS DE CLASIFICACIÓN EN MINERÍA DE DATOS METEOROLÓGICOS
DOI:
https://doi.org/10.47187/perf.v2i20.40Palabras clave:
métodos de clasificación, minería de datos, datos meteorológicosResumen
Uno de los objetivos de la minería de datos es la clasificación, la cual tiene como fin clasificar una variable dentro de una de las categorías de una clase. En este trabajo se consideraron variables meteorológicas de la estación Cumandá. Con el objetivo de determinar el modelo adecuado al conjunto de datos, se aplicaron los modelos de clasificación: Naive Bayes, CN2 Rule Induction, K-NN, Tree y Random Forest; así como también los métodos que modifican los parámetros asociados al clasificador: Cross validation, Random sampling , leave one out y test on train data . Mediante el software orange canvas se calcularon las medidas de rendimiento, Classification Accuary, Precisión Global y Sensibilidad. Se concluyó que los clasificadores naive bayes, cn 2 rule induction y K-nn presentaron valores superiores al 75% de instancias correctamente clasificadas. El árbol de decisión y el Bosque Aleatorio superaron el 80 %. En cuanto a los métodos que permiten modificar los parámetros asociados al clasificador se determinó que Validación Cruzada, presentó mejores resultados en todas las aplicaciones. La mayor precisión se alcanza en el clasificador bosque aleatorio, con un 83.9% aplicando validación cruzada, seguido por el muestreo aleatorio simple con un porcentaje del 83.1% de verdaderos positivos entre los casos clasificados como positivos.
Descargas
Citas
Hernández E, Duque N, Cadavid J. Big Data: Una exploración de investigaciones, tecnologías y casos de aplicación. Tecnológicas. 2017.
Duque N, Orozco M. Minería de datos para el análisis de datos meteorológicos. Tendencias en Ingeniería de Software e Inteligencia Artificial. ;: p. 105-114.
Segrera S, Moreno M, Miguel L. Aplicación de la minería de datos en la evaluación de la aptitud física de las tierras para el cultivo de la caña de azúcar. III taller nacional de minería de datos y aprendizaje. 2005;: p. 349-358.
Sandoval Z, Prieto F. Caracterización de café cereza empleando técnicas de visión artificial. Facultad nacional de agronomía-medellín. 2007;: p. 4105-4127.
Pascual D, Pla F, Sánchez S. Algoritmos de agrupameinto. Revista Facultad de Ingeniería. 2008;: p. 163-175.
Medina R, Ñique C. Bosques Aleatorios como extensión de los árboles de clasificación con los programas R y python. Interfases. 2017;: p. 165-189.
Robles Y, Sotolongo A. Integración de los algoritmos de minería de datos 1r, prism E id3 a postgrEsql. Gestión de tecnología y sistemas de información. 2013;: p. 389-406.
Ochoa L, Paredes K, Araya C. Evaluación de técnicas de minería de datos para la predicción del rendimiento académico. Global partnerships for development and Engineering Education. 2017.
Graham W. Data mining with rattle and R New York, USA: springer; 2011.
Orozco E, García DA. Métodos de clasificación para identificar lesiones en piel a partir de espectros de reflexión difusa. Revista Ingeniería Biomédica. 2010;: p. 34-40.
Descargas
Publicado
Cómo citar
Número
Sección
Licencia
Esta obra está bajo una licencia internacional Creative Commons Atribución-NoComercial 4.0.