IEEE Transactions on Computers | 2021

Penentuan Centroid Awal Pada Algoritma K-Means Dengan Dynamic Artificial Chromosomes Genetic Algorithm Untuk Tuberculosis Dataset

 
 
 

Abstract


Data merupakan hal penting diera sekarang begitu\xa0 juga dengan metode data mining yang dapat mengekstraksi data menghasilkan informasi. Klastering\xa0 1 dari 5 peran data mining yang berfungsi untuk mengelompokkan data berdasarkan tingkat kemiripan dan jarak minimum. Algoritma K-Means\xa0 termasuk algoritma yang populer banyak digunakan diberbagai bidang seperti bidang pendidikan, kesehatan, sosial, biologi, ilmu komputer. Seringkali metode K-Means dikombinasikan dengan metode optimasi seperti algoritma genetika untuk mengatasi permasalah pada K-Means yaitu sensitif dalam penentuan centroid awal .Namun metode algoritma genetika memiliki kekurangan yaitu mengalamai konvergen prematur sehingga hasil dari algorima genetika terjebak pada optimum lokal. Penelitian ini mengkombinasikan dynamic artificial cromosomes genetic algorithm dengan K-Means dalam menentukan nilai centroid awal pada k-means. Hasil eksperimen menunjukkan bahwa metode DAC GA + K-Means lebih unggul dibandingkan dengan K-Means dan GA + K-Means pada 2 dataset yang diuji dengan optimal nilai klaster sebanyak 2 dan 1 dataset sebanyak 3 klaster. Metode tersebut perolehan nilai DBI sebesar 0.138, 0.279 serta 0.382, nilai Sum Square Error sebesar 92.56, 332,39 dan 1280.68 serta nilai fitness yang tebentuk adalah 7.12, 3.57 dan 2.13.

Volume 20
Pages 97-108
DOI 10.33633/TC.V20I1.4230
Language English
Journal IEEE Transactions on Computers

Full Text