Abstract:
Clustering merupakan bagian dari data mining yang bertujuan untuk memperoleh suatu informasi dari pengelompokkan data berdasarkan nilai kemiripannya kedalam beberapa kelas. Namun clustering hanya dapat mengelompokkan data tanpa dapat mengetahui hasil nilai K optimal berasal dari proses cluster berapa. Pada penelitian ini dilakukan perbandingan antara metode ellbow dan silhoutte coefficient untuk menentukan nilai K optimal dari hasil clustering menggunakan metode k-means++. Hasil perbandingan nilai K optimal yang diperoleh akan diuji kembali menggunakan metode Davies Bouldin Index (DBI) untuk mengetahui metode terbaik dalam memperoleh nilai K optimal. Pada penelitian ini menggunakan lima jenis dataset dengan masing-masing karakteristik yang berbeda. Hasil pengujian metode ellbow pada dataset kualitas air sungai memperoleh nilai DBI yang lebih rendah dari metode silhoutte coefficient sehingga untuk dataset kualitas air sungai metode ellbow lebih baik daripada metode sillhoutte coefficient, sedangkan untuk empat dataset lainnya metode silhoutte coefficient mampu menghasilkan nilai K optimal lebih baik dari metode ellbow.
Kata kunci: Ellbow, Silhoutte Coefficient, K-Means++.