Normalización en desempeño de k-means sobre datos climáticos

El análisis de clúster sobre datos climatológicos es usado en diversas investigaciones dado que permite obtener resultados interesantes para cada enfoque propuesto. Por tanto, en este trabajo se presenta la evaluación de desempeño del algoritmo de agrupamiento K-Means a partir del uso de normalizaci...

Full description

Bibliographic Details
Main Authors: Juan Sebastián Ramírez Gómez, Néstor Dario Duque Méndez, Jorge Julián Vélez Upegui
Format: Article
Language:English
Published: Universidad Distrital Francisco José de Caldas 2019-06-01
Series:Revista Vínculos
Subjects:
Online Access:https://revistas.udistrital.edu.co/index.php/vinculos/article/view/15550
id doaj-1f622fa65561468b9ac0f74f03c4d5eb
record_format Article
spelling doaj-1f622fa65561468b9ac0f74f03c4d5eb2020-11-25T01:57:15ZengUniversidad Distrital Francisco José de CaldasRevista Vínculos1794-211X2322-939X2019-06-01161577210.14483/2322939X.1555015550Normalización en desempeño de k-means sobre datos climáticosJuan Sebastián Ramírez Gómez0Néstor Dario Duque Méndez1Jorge Julián Vélez Upegui2Universidad Nacional de Colombia, Sede ManizalesUniversidad Nacional de Colombia, Sede ManizalesUniversidad Nacional de Colombia, Sede ManizalesEl análisis de clúster sobre datos climatológicos es usado en diversas investigaciones dado que permite obtener resultados interesantes para cada enfoque propuesto. Por tanto, en este trabajo se presenta la evaluación de desempeño del algoritmo de agrupamiento K-Means a partir del uso de normalización aplicada a un conjunto de datos con cuatro variables climatológicas (temperatura, precipitación, humedad relativa y radiación solar) para una estación ubicada en la ciudad de Manizales, Colombia. Esto con el fin de determinar el efecto de aplicar, o no, la normalización en la calidad de los clústeres y evaluar el costo computacional del algoritmo según las características establecidas. Para ello se definen seis escenarios de ejecución para 2, 3 y 5 clústeres con diferente cantidad y agrupación de variables utilizando distancia euclidiana como medida de alejamiento, Davies-Bouldin como método evaluación de calidad de los clústeres y la aplicación de normalización con Z-transformation y Range transformation. Se concluye que, a través de una comparación con k-medoides y aplicación STFT (Transformada de Fourier de Tiempo Reducido), la normalización mejora los resultados y con Z-transformation se obtienen los mejores desempeños de agrupamiento según el índice de Davis-Bouldin.https://revistas.udistrital.edu.co/index.php/vinculos/article/view/15550clusteringk-meansmachine learningnormalizacióntransformada de fourier a corto plazo
collection DOAJ
language English
format Article
sources DOAJ
author Juan Sebastián Ramírez Gómez
Néstor Dario Duque Méndez
Jorge Julián Vélez Upegui
spellingShingle Juan Sebastián Ramírez Gómez
Néstor Dario Duque Méndez
Jorge Julián Vélez Upegui
Normalización en desempeño de k-means sobre datos climáticos
Revista Vínculos
clustering
k-means
machine learning
normalización
transformada de fourier a corto plazo
author_facet Juan Sebastián Ramírez Gómez
Néstor Dario Duque Méndez
Jorge Julián Vélez Upegui
author_sort Juan Sebastián Ramírez Gómez
title Normalización en desempeño de k-means sobre datos climáticos
title_short Normalización en desempeño de k-means sobre datos climáticos
title_full Normalización en desempeño de k-means sobre datos climáticos
title_fullStr Normalización en desempeño de k-means sobre datos climáticos
title_full_unstemmed Normalización en desempeño de k-means sobre datos climáticos
title_sort normalización en desempeño de k-means sobre datos climáticos
publisher Universidad Distrital Francisco José de Caldas
series Revista Vínculos
issn 1794-211X
2322-939X
publishDate 2019-06-01
description El análisis de clúster sobre datos climatológicos es usado en diversas investigaciones dado que permite obtener resultados interesantes para cada enfoque propuesto. Por tanto, en este trabajo se presenta la evaluación de desempeño del algoritmo de agrupamiento K-Means a partir del uso de normalización aplicada a un conjunto de datos con cuatro variables climatológicas (temperatura, precipitación, humedad relativa y radiación solar) para una estación ubicada en la ciudad de Manizales, Colombia. Esto con el fin de determinar el efecto de aplicar, o no, la normalización en la calidad de los clústeres y evaluar el costo computacional del algoritmo según las características establecidas. Para ello se definen seis escenarios de ejecución para 2, 3 y 5 clústeres con diferente cantidad y agrupación de variables utilizando distancia euclidiana como medida de alejamiento, Davies-Bouldin como método evaluación de calidad de los clústeres y la aplicación de normalización con Z-transformation y Range transformation. Se concluye que, a través de una comparación con k-medoides y aplicación STFT (Transformada de Fourier de Tiempo Reducido), la normalización mejora los resultados y con Z-transformation se obtienen los mejores desempeños de agrupamiento según el índice de Davis-Bouldin.
topic clustering
k-means
machine learning
normalización
transformada de fourier a corto plazo
url https://revistas.udistrital.edu.co/index.php/vinculos/article/view/15550
work_keys_str_mv AT juansebastianramirezgomez normalizacionendesempenodekmeanssobredatosclimaticos
AT nestordarioduquemendez normalizacionendesempenodekmeanssobredatosclimaticos
AT jorgejulianvelezupegui normalizacionendesempenodekmeanssobredatosclimaticos
_version_ 1724975257641549824