Por favor, use este identificador para citar o enlazar este ítem: http://dspace.espoch.edu.ec/handle/123456789/9395
Registro completo de metadatos
Campo DC Valor Lengua/Idioma
dc.contributor.authorHaro Rivera, Silvia-
dc.contributor.authorZúñiga Lema, Lourdes-
dc.contributor.authorVera Rojas, Luis-
dc.contributor.authorMeneses Freire, Antonio-
dc.contributor.authorEscudero Villa, Amalia-
dc.date.accessioned2019-01-25T14:25:16Z-
dc.date.available2019-01-25T14:25:16Z-
dc.date.issued2018-10-22-
dc.identifier.urihttp://dspace.espoch.edu.ec/handle/123456789/9395-
dc.descriptionUno de los objetivos de la minería de datos es la clasificación, la cual tiene como fin clasificar una variable dentro de una de las categorías de una clase. En este trabajo se consideraron variables meteorológicas de la estación cumandá. con el objetivo de determinar el modelo adecuado al conjunto de datos, se aplicaron los modelos de clasificación : Naive Bayes, CN2 Rule Induction , K-NN, Tree y Random Forest; así como también los métodos que modifican los parámetros asociados al clasificador: Cross validation, Random sampling , leave one out y test on train data . mediante el software orange canvas se calcularon las medidas de rendimiento, classification Accuary , Precisión Global y Sensibilidad . Se concluyó que los clasificadores naive bayes , cn 2 rule induction y K-nn presentaron valores superiores al 75% de instancias correcta- mente clasificadas. El árbol de decisión y el Bosque Aleatorio superaron el 80%. En cuanto a los métodos que permiten modificar los parámetros asociados al clasificador se determinó que Validación Cruzada, presentó mejores resultados en todas las aplicaciones. La mayor precisión se alcanza en el clasificador bosque aleatorio, con un 83.9% aplicando validación cruzada, seguido por el muestreo aleatorio simple con un porcentaje del 83.1% de verdaderos positivos entre los casos clasificados como positivos.es_ES
dc.description.abstractOne of the colectivamente of data mining is classification, which aims to classify a variable within one of the categories of a class. In this work, meteorological variables of the Cumandá station were considered. In order to determine the appropriate model for the data set, the Naive Bayes, CN2 Rule Induction, K-NN, Tree and Random Forest classification models, as well as Cross validation, Random sampling, Leave one out and Test on train data, that modify the parameters associated with the classifier, were applied. Orange Performance software was used to calculate performance measures, Classification Accuary, Global Accuracy and Sensitivity . It was concluded that the classifiers Naive Bayes , CN2 Rule Induction and K-NN presented values higher than 75% of correctly classified instances. The decision tree and the Random Forest exceeded 80%. Regarding the methods that allow to modify the parameters associated to the classifier, it was determined that Cross-validation presented better results in all the applications. The highest precision is reached in the classifier random forest with 83.9% applying cross-validation, followed by simple random sampling with 83.1% of true positives among the cases classified as positive.es_ES
dc.language.isospaes_ES
dc.publisherEscuela Superior Politécnica de Chimborazoes_ES
dc.rightsinfo:eu-repo/semantics/openAccesses_ES
dc.subjectMÉTODOS DE CLASIFICACIÓNes_ES
dc.subjectMINERÍA DE DATOSes_ES
dc.subjectDATOS METEOROLÓGICOSes_ES
dc.subjectCLASSIFICATION METHODSen
dc.subjectDATA MININGen
dc.subjectMETEOROLOGICAL DATAen
dc.titleMétodos de clasificación en minería de datos meteorológicos.es_ES
dc.typeinfo:eu-repo/semantics/articlees_ES
dc.rights.urihttps://creativecommons.org/licenses/by-nc-sa/3.0/ec/es_ES
Aparece en las colecciones: Número 20, Vol.2 (Julio - Diciembre 2018)

Ficheros en este ítem:
Fichero Descripción Tamaño Formato  
per_n20_v2_13.pdf459,29 kBAdobe PDFVista previa
Visualizar/Abrir


Este ítem está sujeto a una licencia Creative Commons Licencia Creative Commons Creative Commons