Perbaikan Kinerja Clustering K-Means pada Data Ekonomi Nelayan dengan Perhitungan Sum of Square Error (SSE) dan Optimasi nilai K cluster

Clustering adalah jenismetode statistik yang dipakai untuk mengelompokan banyak data atau objek ke dalam beberapa kelompok (cluster), sehingga objek-objek yang berada dalam satu kelompok akan mempunyai kemiripan yang tinggi. Clustering K-Means merupakan metode pembentukan cluster berbasis data, dima...

Full description

Bibliographic Details
Main Authors: Leonardo Petra Refialy, Hervin Maitimu, Melgusen Soyano Pesulima
Format: Article
Language:Indonesian
Published: Universitas Dian Nuswantoro 2021-05-01
Series:Techno.Com
Subjects:
Online Access:http://publikasi.dinus.ac.id/index.php/technoc/article/view/4572
Description
Summary:Clustering adalah jenismetode statistik yang dipakai untuk mengelompokan banyak data atau objek ke dalam beberapa kelompok (cluster), sehingga objek-objek yang berada dalam satu kelompok akan mempunyai kemiripan yang tinggi. Clustering K-Means merupakan metode pembentukan cluster berbasis data, dimana objek secara acak dalam cluster pertama yang terbentuk dijadikan sebagai titik tengah/titik pusat (centroid). K-means merupakan jenis cluster yang memiliki tingkat ketelitian dan efisiensi yang baik. Kelemahan dalam algoritma k-Means yaitu dalam menganalisa dan menentukan Nilai K dalam mengklaster data pada suatu dataset yang tidak optimal akan menghasilkan cluster yang buruk. Sum of Square Error (SSE) merupakan hasil penjumlahan dari seluruh jarak masing-masing data dengan titik pusat clusternya. Semakin kecil nilai SSE yang didapat, semakin seragam data yang ada didalam masing-masing cluster, semakin baik cluster yang dihasilkan. Penelitian ini melakukan  analisis cluster dengan K-means untuk menghasilkan kelompok cluster serta perhitungan nilai Sum of Square Error untuk setiap data dengan nilai K yang berbeda. Proses perhitungan nilai K dalam mencari nilai SSE yang minimum sehingga dapat dilakukan perhitungan selisih nilai SSE dari setiap nilai K cluster. Hasil perhitungan selisih tersebut sebagai penentu jumlah K cluster yang optimal dengan tingkat akurasi yang lebih baik.   Kata kunci: Clustering, K-Means, Sum of Square Error.
ISSN:2356-2579
2356-2579