Por favor, use este identificador para citar o enlazar este ítem: http://dspace.espoch.edu.ec/handle/123456789/21717
Título : Analíticas de aprendizaje y análisis estadístico implicativo: comparación de técnicas clusters para variables modales
Autor : Armas Analuisa, Shirley Estefania
Director(es): Pazmiño Maji, Rubén Antonio
Tribunal (Tesis): Pérez Londo, Natalia Alexandra
Palabras claves : ANÁLISIS ESTADÍSTICO IMPLICATIVO;ANALÍTICAS DE APRENDIZAJE;VARIABLES MODALES;ANÁLISIS CLÚSTER;SIMILARIDAD;COHESION
Fecha de publicación : 10-mar-2022
Editorial : Escuela Superior Politécnica de Chimborazo
Citación : Armas Analuisa, Shirley Estefania. (2022). Analíticas de aprendizaje y análisis estadístico implicativo: comparación de técnicas clusters para variables modales. Escuela Superior Politécnica de Chimborazo. Riobamba
Identificador : UDCTFC;226T0153
Abstract : In an increasingly digitalized world, data analysis has been gaining relevance day by day due to its study has become a fundamental and essential aspect when providing strategic solutions for decision making, therefore, not using the appropriate techniques for the treatment of this information creates repetitive and, in some cases, even unsolvable processes, causing slowness in the calculations and not taking advantage of resources such as execution time and memory space. Given this problem, this research proposed to perform a comparative analysis of the execution time and memory space used between clustering methods similar to the Implicative Statistical Analysis (ASI) and Learning Analytics (LA). For this purpose, a pre-experimental design with modal variables was used, considering for ASI the callHierarchyTree and callSimilarityTree methods and for LA the hclust. vector, hclustvar and diana methods. The study group was 100000 databases, the type of sampling was simple random with a sample size of 382 categorical databases (up to 10 categories) which were randomly generated. It was demonstrated that there is no significant difference in memory space between the five methods, with respect to execution time it was determined that the methods that take the least time are callHierarchyTree and callSimilarityTree followed by hclustvar and finally the methods that took the most time were hclust, vector and diana. These results presented will serve to use a more efficient clustering method in execution time and memory space when analyzing data, thus allowing to opt for optimal algorithms from the point of view of algorithmic complexity.
Resumen : En un mundo cada vez más digitalizado el análisis de datos ha ido ganando relevancia día a día ya que su estudio se ha convertido en un aspecto fundamental e imprescindible al momento de brindar soluciones estratégicas para la toma de decisiones, por tal motivo al no utilizar las técnicas adecuadas para el tratamiento de esta información se vienen a crear procesos repetitivos y en ciertos casos hasta irresolubles, ocasionando lentitud en los cálculos y el no aprovechamiento de recursos como tiempo de ejecución y espacio de memoria. Dada esta problemática esta investigación propuso realizar un análisis comparativo del tiempo de ejecución y espacio de memoria utilizado entre los métodos clúster similares al Análisis Estadístico Implicativo (ASI) y Learning Analytics (LA). Para ello se utilizó un diseño preexperimental con variables modales considerando para ASI los métodos callHierarchyTree y callSimilarityTree y para LA los métodos hclust.vector, hclustvar y diana. El grupo de estudio fue de 100000 bases de datos, el tipo de muestreo fue aleatorio simple con un tamaño de muestra de 382 bases de datos categóricas (de hasta 10 categorías) las cuales fueron generadas aleatoriamente. Se demostró que no existe diferencia significativa en espacio de memoria entre los cinco métodos, con respecto al tiempo de ejecución se determinó que los métodos que ocupan menor tiempo son callHierarchyTree y callSimilarityTree seguido por hclustvar y finalmente los métodos que ocuparon más tiempo fueron hclust.vector y diana. Estos resultados presentados servirán para utilizar un método clúster más eficiente en tiempo de ejecución y espacio de memoria al analizar datos, permitiendo así optar por algoritmos óptimos desde el punto de vista de la complejidad algorítmica.
URI : http://dspace.espoch.edu.ec/handle/123456789/21717
Aparece en las colecciones: Ingeniero en Estadística Informática; Ingeniero/a Estadístico/a

Ficheros en este ítem:
Fichero Descripción Tamaño Formato  
226T0153.pdf1,79 MBAdobe PDFVista previa
Visualizar/Abrir


Este ítem está sujeto a una licencia Creative Commons Licencia Creative Commons Creative Commons