Por favor, use este identificador para citar o enlazar este ítem:
http://dspace.espoch.edu.ec/handle/123456789/21724
Título : | Comparación de técnicas de relleno de datos faltantes de la variable velocidad de viento de los años 2014 al 2021 |
Autor : | Velastegui Cujilema, Evelyn Mishelle Horna Zhinin, Erick Adrian |
Director(es): | Pérez Londo, Natalia Alexandra |
Tribunal (Tesis): | Aguilar Reyes, Johanna Enith |
Palabras claves : | ESTADÍSTICA;IMPUTACÍON;RELLENO DE DATOS;METEREOLÓGICOS;MÉTRICAS;ESTACIONES |
Fecha de publicación : | 13-dic-2023 |
Editorial : | Escuela Superior Politécnica de Chimborazo |
Citación : | Velastegui Cujilema, Evelyn Mishelle; Horna Zhinin, Erick Adrian. (2023). Comparación de técnicas de relleno de datos faltantes de la variable velocidad de viento de los años 2014 al 2021. Escuela Superior Politécnica de Chimborazo. Riobamba |
Identificador : | UDCTFC;226T0160 |
Abstract : | Based on the meteorological study of the wind speed, which is one of the important variables that allowed the generation of energy from wind sources, being the latter that was tested to be able to know its consistency, to this was added that the studies in meteorology are very changeable due to different variables that occurred with the passing of time. The main objective of this work was to compare the techniques for filling missing data of the variable Wind Speed from 2014 to 2021, in the province of Chimborazo. The data matrix of this study was obtained from the Alternative Energies and Environment Group (GEAA), with a total of 703248 data, where through a purification of information a sample of 10964 missing data was taken from the 11 stations. The descriptive statistical analysis showed a minimum wind speed (1,000 m/s) at the Cumandá station and a maximum speed (20,703 m/s) at the Tixán station; the Rosner’s test for outliers revealed (677) outlier data. From the function (V IM.impute.pmm()) missing data were identified, where the most representative data were found at the Atillo, Multitud and Tunshi stations in the study years. With the Random Forest, Mean (MICE), Hot Deck and Iterative PCA Imputation methods, it was possible to impute and make the necessary adjustments in each station, graphically it was observed that Alao had a good adjustment between the real data and the imputed data, by means of the metrics EMP, EMC and DAM the Quimiag station presented low values 0.0021, 0.0002 and 0.0021 respectively for the mean (MICE) and Hot Deck techniques being those that best adjusted to the real data |
Resumen : | En base al estudio meteorológico de una de las variables importantes que es la velocidad de viento que permitió la generación de fuentes eólicas siendo la energía que fue puesto a prueba para poder conocer su consistencia, a esto se agregó que los estudios en meteorología son muy cambiantes debido a distintas variables que se produjeron con el pasar del tiempo. El presente trabajo tuvo como objetivo principal comparar las técnicas de relleno de datos faltantes de la variable Velocidad de Viento de los años 2014 al 2021, en la provincia de Chimborazo. La matriz de datos de este estudio se obtuvo del Grupo de Energías Alternativas y Ambiente (GEAA), con un total de 703248 datos, donde a través de una depuración de información se tomó una muestra de 10964 datos faltantes en las 11 estaciones. El análisis estadístico descriptivo mostró una velocidad de viento mínima (1.000 m/s) en la estación Cumandá y una velocidad máxima (20.703 m/s) en la estación Tixán, mediante el Test de Rosner’s Outlierse evidenció (677) datos atípicos. A partir de la función (VIM.impute.pmm()) se identificó datos faltantes, donde la mayor representatividad de los datos se encontraron en las estaciones Atillo, Multitud y Tunshi en los años de estudio. Con los métodos Random Forest, Media (MICE), Hot Deck e Iterative PCA Imputation se logró imputar y se realizaron los ajustes necesarios en cada estación, gráficamente se observó que Alao tuvo un buen ajuste entre los datos reales y los imputados, mediante las métricas EMP, EMC y DAM la estación Quimiag presentó valores bajos 0.0021, 0.0002 y 0.0021 respectivamente para las técnicas de la media (MICE) y Hot Deck siendo las que mejor se ajustan a los datos reales. |
URI : | http://dspace.espoch.edu.ec/handle/123456789/21724 |
Aparece en las colecciones: | Ingeniero en Estadística Informática; Ingeniero/a Estadístico/a |
Ficheros en este ítem:
Fichero | Descripción | Tamaño | Formato | |
---|---|---|---|---|
226T0160.pdf | 3,76 MB | Adobe PDF | Visualizar/Abrir |
Este ítem está sujeto a una licencia Creative Commons Licencia Creative Commons