Normalización en desempeño de k-means sobre datos climáticos
El análisis de clúster sobre datos climatológicos es usado en diversas investigaciones dado que permite obtener resultados interesantes para cada enfoque propuesto. Por tanto, en este trabajo se presenta la evaluación de desempeño del algoritmo de agrupamiento K-Means a partir del uso de normalizaci...
Main Authors: | , , |
---|---|
Format: | Article |
Language: | English |
Published: |
Universidad Distrital Francisco José de Caldas
2019-06-01
|
Series: | Revista Vínculos |
Subjects: | |
Online Access: | https://revistas.udistrital.edu.co/index.php/vinculos/article/view/15550 |
id |
doaj-1f622fa65561468b9ac0f74f03c4d5eb |
---|---|
record_format |
Article |
spelling |
doaj-1f622fa65561468b9ac0f74f03c4d5eb2020-11-25T01:57:15ZengUniversidad Distrital Francisco José de CaldasRevista Vínculos1794-211X2322-939X2019-06-01161577210.14483/2322939X.1555015550Normalización en desempeño de k-means sobre datos climáticosJuan Sebastián Ramírez Gómez0Néstor Dario Duque Méndez1Jorge Julián Vélez Upegui2Universidad Nacional de Colombia, Sede ManizalesUniversidad Nacional de Colombia, Sede ManizalesUniversidad Nacional de Colombia, Sede ManizalesEl análisis de clúster sobre datos climatológicos es usado en diversas investigaciones dado que permite obtener resultados interesantes para cada enfoque propuesto. Por tanto, en este trabajo se presenta la evaluación de desempeño del algoritmo de agrupamiento K-Means a partir del uso de normalización aplicada a un conjunto de datos con cuatro variables climatológicas (temperatura, precipitación, humedad relativa y radiación solar) para una estación ubicada en la ciudad de Manizales, Colombia. Esto con el fin de determinar el efecto de aplicar, o no, la normalización en la calidad de los clústeres y evaluar el costo computacional del algoritmo según las características establecidas. Para ello se definen seis escenarios de ejecución para 2, 3 y 5 clústeres con diferente cantidad y agrupación de variables utilizando distancia euclidiana como medida de alejamiento, Davies-Bouldin como método evaluación de calidad de los clústeres y la aplicación de normalización con Z-transformation y Range transformation. Se concluye que, a través de una comparación con k-medoides y aplicación STFT (Transformada de Fourier de Tiempo Reducido), la normalización mejora los resultados y con Z-transformation se obtienen los mejores desempeños de agrupamiento según el índice de Davis-Bouldin.https://revistas.udistrital.edu.co/index.php/vinculos/article/view/15550clusteringk-meansmachine learningnormalizacióntransformada de fourier a corto plazo |
collection |
DOAJ |
language |
English |
format |
Article |
sources |
DOAJ |
author |
Juan Sebastián Ramírez Gómez Néstor Dario Duque Méndez Jorge Julián Vélez Upegui |
spellingShingle |
Juan Sebastián Ramírez Gómez Néstor Dario Duque Méndez Jorge Julián Vélez Upegui Normalización en desempeño de k-means sobre datos climáticos Revista Vínculos clustering k-means machine learning normalización transformada de fourier a corto plazo |
author_facet |
Juan Sebastián Ramírez Gómez Néstor Dario Duque Méndez Jorge Julián Vélez Upegui |
author_sort |
Juan Sebastián Ramírez Gómez |
title |
Normalización en desempeño de k-means sobre datos climáticos |
title_short |
Normalización en desempeño de k-means sobre datos climáticos |
title_full |
Normalización en desempeño de k-means sobre datos climáticos |
title_fullStr |
Normalización en desempeño de k-means sobre datos climáticos |
title_full_unstemmed |
Normalización en desempeño de k-means sobre datos climáticos |
title_sort |
normalización en desempeño de k-means sobre datos climáticos |
publisher |
Universidad Distrital Francisco José de Caldas |
series |
Revista Vínculos |
issn |
1794-211X 2322-939X |
publishDate |
2019-06-01 |
description |
El análisis de clúster sobre datos climatológicos es usado en diversas investigaciones dado que permite obtener resultados interesantes para cada enfoque propuesto. Por tanto, en este trabajo se presenta la evaluación de desempeño del algoritmo de agrupamiento K-Means a partir del uso de normalización aplicada a un conjunto de datos con cuatro variables climatológicas (temperatura, precipitación, humedad relativa y radiación solar) para una estación ubicada en la ciudad de Manizales, Colombia. Esto con el fin de determinar el efecto de aplicar, o no, la normalización en la calidad de los clústeres y evaluar el costo computacional del algoritmo según las características establecidas. Para ello se definen seis escenarios de ejecución para 2, 3 y 5 clústeres con diferente cantidad y agrupación de variables utilizando distancia euclidiana como medida de alejamiento, Davies-Bouldin como método evaluación de calidad de los clústeres y la aplicación de normalización con Z-transformation y Range transformation. Se concluye que, a través de una comparación con k-medoides y aplicación STFT (Transformada de Fourier de Tiempo Reducido), la normalización mejora los resultados y con Z-transformation se obtienen los mejores desempeños de agrupamiento según el índice de Davis-Bouldin. |
topic |
clustering k-means machine learning normalización transformada de fourier a corto plazo |
url |
https://revistas.udistrital.edu.co/index.php/vinculos/article/view/15550 |
work_keys_str_mv |
AT juansebastianramirezgomez normalizacionendesempenodekmeanssobredatosclimaticos AT nestordarioduquemendez normalizacionendesempenodekmeanssobredatosclimaticos AT jorgejulianvelezupegui normalizacionendesempenodekmeanssobredatosclimaticos |
_version_ |
1724975257641549824 |