IEEE Transactions on Computers | 2021

Perbaikan Kinerja Clustering K-Means pada Data Ekonomi Nelayan dengan Perhitungan Sum of Square Error (SSE) dan Optimasi nilai K cluster

 
 
 

Abstract


Clustering adalah jenis metode statistik yang dipakai untuk mengelompokan banyak data atau objek ke dalam beberapa kelompok ( cluster ), sehingga objek-objek yang berada dalam satu kelompok akan mempunyai kemiripan yang tinggi. Clustering K-Means merupakan metode pembentukan cluster berbasis data, dimana objek secara acak dalam cluster pertama yang terbentuk dijadikan sebagai titik tengah/titik pusat (centroid). K-means merupakan jenis cluster yang memiliki tingkat ketelitian dan efisiensi yang baik. Kelemahan dalam algoritma k-Means yaitu dalam menganalisa dan menentukan Nilai K dalam mengklaster data pada suatu dataset yang tidak optimal akan menghasilkan cluster yang buruk. Sum of Square Error (SSE) merupakan hasil penjumlahan dari seluruh jarak masing-masing data dengan titik pusat clusternya. Semakin kecil nilai SSE yang didapat, semakin seragam data yang ada didalam masing-masing cluster, semakin baik cluster yang dihasilkan. Penelitian ini melakukan\xa0\xa0analisis cluster dengan K-means untuk menghasilkan kelompok cluster serta perhitungan nilai Sum of Square Error untuk setiap data dengan nilai K yang berbeda. Proses perhitungan nilai K dalam mencari nilai SSE yang minimum sehingga dapat dilakukan perhitungan selisih nilai SSE dari setiap nilai K cluster. Hasil perhitungan selisih tersebut sebagai penentu jumlah K cluster yang optimal dengan tingkat akurasi yang lebih baik. Kata kunci:\xa0 Clustering, K-Means, Sum of Square Error.

Volume 20
Pages 321-329
DOI 10.33633/TC.V20I2.4572
Language English
Journal IEEE Transactions on Computers

Full Text