Prapemrosesan klasifikasi algoritme kNN menggunakan K-means dan matriks jarak untuk dataset hasil studi mahasiswa

Keberadaan outlier pada dataset dapat menyebabkan rendahnya hasil akurasi pada proses klasifikasi. Outlier pada dataset dapat dihilangkan pada tahapan prapemrosesan algoritme klasifikasi. Clustering dapat digunakan sebagai metode pendeteksi outlier. Kajian ini bertujuan menerapkan K-means dan matrik...

Full description

Bibliographic Details
Main Authors: Sugriyono Sugriyono, Maria Ulfah Siregar
Format: Article
Language:English
Published: Diponegoro University 2020-10-01
Series:Jurnal Teknologi dan Sistem Komputer
Subjects:
knn
Online Access:https://jtsiskom.undip.ac.id/index.php/jtsiskom/article/view/13874
id doaj-3aaf3d45bd3b4d2bbaeec637a678d375
record_format Article
spelling doaj-3aaf3d45bd3b4d2bbaeec637a678d3752021-10-02T15:30:37ZengDiponegoro UniversityJurnal Teknologi dan Sistem Komputer2338-04032020-10-018431131610.14710/jtsiskom.2020.1387412843Prapemrosesan klasifikasi algoritme kNN menggunakan K-means dan matriks jarak untuk dataset hasil studi mahasiswaSugriyono Sugriyono0Maria Ulfah Siregar1https://orcid.org/0000-0001-7983-1007Master of Informatics Department, Sunan Kalijaga Islamic State University, IndonesiaMaster of Informatics Department, Sunan Kalijaga Islamic State University, IndonesiaKeberadaan outlier pada dataset dapat menyebabkan rendahnya hasil akurasi pada proses klasifikasi. Outlier pada dataset dapat dihilangkan pada tahapan prapemrosesan algoritme klasifikasi. Clustering dapat digunakan sebagai metode pendeteksi outlier. Kajian ini bertujuan menerapkan K-means dan matriks jarak untuk mendeteksi outlier dan menghapusnya dari dataset yang sudah memiliki kelas label. Penelitian ini menggunakan dataset hasil studi mahasiswa berjumlah 6847 instance, dengan 18 atribut dan tiga kelas. Prapemrosesan menerapkan metode K-means untuk mendapatkan pusat klaster pada tiap class, matriks jarak digunakan untuk mengevaluasi jarak instance dengan pusat klaster. Outlier, kelas baru yang berbeda dengan kelas awal, yang ditemukan akan dihilangkan. Prapemrosesan ini meningkatkan hasil akurasi klasifikasi algoritme kNN. Data tanpa prapemrosesan menghasilkan akurasi sebesar 72,28 %, data hasil prapemrosesan menggunakan metode K-means dan Euclidean menghasilkan akurasi hasil klasifikasi sebesar 98,42 % (meningkat 26,14 %), sedangkan metode K-means dan Manhattan menghasilkan akurasi sebesar 97,76 % (meningkat 25,48 %).https://jtsiskom.undip.ac.id/index.php/jtsiskom/article/view/13874preprocessingk-meansknndistance matrixmanhattaneuclidean
collection DOAJ
language English
format Article
sources DOAJ
author Sugriyono Sugriyono
Maria Ulfah Siregar
spellingShingle Sugriyono Sugriyono
Maria Ulfah Siregar
Prapemrosesan klasifikasi algoritme kNN menggunakan K-means dan matriks jarak untuk dataset hasil studi mahasiswa
Jurnal Teknologi dan Sistem Komputer
preprocessing
k-means
knn
distance matrix
manhattan
euclidean
author_facet Sugriyono Sugriyono
Maria Ulfah Siregar
author_sort Sugriyono Sugriyono
title Prapemrosesan klasifikasi algoritme kNN menggunakan K-means dan matriks jarak untuk dataset hasil studi mahasiswa
title_short Prapemrosesan klasifikasi algoritme kNN menggunakan K-means dan matriks jarak untuk dataset hasil studi mahasiswa
title_full Prapemrosesan klasifikasi algoritme kNN menggunakan K-means dan matriks jarak untuk dataset hasil studi mahasiswa
title_fullStr Prapemrosesan klasifikasi algoritme kNN menggunakan K-means dan matriks jarak untuk dataset hasil studi mahasiswa
title_full_unstemmed Prapemrosesan klasifikasi algoritme kNN menggunakan K-means dan matriks jarak untuk dataset hasil studi mahasiswa
title_sort prapemrosesan klasifikasi algoritme knn menggunakan k-means dan matriks jarak untuk dataset hasil studi mahasiswa
publisher Diponegoro University
series Jurnal Teknologi dan Sistem Komputer
issn 2338-0403
publishDate 2020-10-01
description Keberadaan outlier pada dataset dapat menyebabkan rendahnya hasil akurasi pada proses klasifikasi. Outlier pada dataset dapat dihilangkan pada tahapan prapemrosesan algoritme klasifikasi. Clustering dapat digunakan sebagai metode pendeteksi outlier. Kajian ini bertujuan menerapkan K-means dan matriks jarak untuk mendeteksi outlier dan menghapusnya dari dataset yang sudah memiliki kelas label. Penelitian ini menggunakan dataset hasil studi mahasiswa berjumlah 6847 instance, dengan 18 atribut dan tiga kelas. Prapemrosesan menerapkan metode K-means untuk mendapatkan pusat klaster pada tiap class, matriks jarak digunakan untuk mengevaluasi jarak instance dengan pusat klaster. Outlier, kelas baru yang berbeda dengan kelas awal, yang ditemukan akan dihilangkan. Prapemrosesan ini meningkatkan hasil akurasi klasifikasi algoritme kNN. Data tanpa prapemrosesan menghasilkan akurasi sebesar 72,28 %, data hasil prapemrosesan menggunakan metode K-means dan Euclidean menghasilkan akurasi hasil klasifikasi sebesar 98,42 % (meningkat 26,14 %), sedangkan metode K-means dan Manhattan menghasilkan akurasi sebesar 97,76 % (meningkat 25,48 %).
topic preprocessing
k-means
knn
distance matrix
manhattan
euclidean
url https://jtsiskom.undip.ac.id/index.php/jtsiskom/article/view/13874
work_keys_str_mv AT sugriyonosugriyono prapemrosesanklasifikasialgoritmeknnmenggunakankmeansdanmatriksjarakuntukdatasethasilstudimahasiswa
AT mariaulfahsiregar prapemrosesanklasifikasialgoritmeknnmenggunakankmeansdanmatriksjarakuntukdatasethasilstudimahasiswa
_version_ 1716853848957517824