Metode Fuzzy C-Means Clustering pertama kali dikenalkan oleh Jim Bezdek pada tahun 1981 (Jain dkk, 1999). Fuzzy C-Means adalah salah satu teknik pengelompokkan data yang mana keberadaan tiap titik data dalam suatu kelompok (cluster)ditentukan oleh derajat keanggotan. Metode Fuzzy C-Means termasuk metode supervised clustering dimana jumlah pusat cluster ditentukan di dalam proses clustering. Algoritma dari fuzzy c-means adalah sebagai berikut (Yan, 1994) :
Input Data
Input data yang akan dikelompokkan, yaituX, berupa matrix berukuran n x m (n=jumlah sampel data, m=atribut setiap data). Xij data sampel ke-i (i=1,2,…n), atribut ke-j (j=1,2,..m).
Tentukan Jumlah Cluster
Tentukan jumlah cluster (c), pangkat untuk matriks partisi (w), maksimum iterasi (MaxIter), error terkecil yang diharapkan (ξ), fungsi objektif awal (Po=0), dan iterasi awal (t=1).
Bangkitkan Nilai Random
Bangkitkan bilangan random ηik, i=1,2,…n; k=1,2,…c sebagai elemen matrik partisi awal U.
Hitung Pusat Cluster ke-k
Hitung pusat cluster ke-k: , dengan k=1,2,…,c; dan j=1,2,…,m, menggunakan persamaan berikut (Yan, 1994) :dengan :
Vkj = pusat cluster ke-k untuk atribut ke-j
ηik = derajat keanggotaan untuk data sampel ke-i pada cluster ke-k
xij = data ke-i, atribut ke-j
Hitung Fungsi Objektif
Hitung fungsi objektif pada iterasi ke-t menggunakan persamaan berikut (Yan, 1994) :
dengan:
Vkj = pusat cluster ke-k untuk atribut ke-j
ηik = derajat keanggotaan untuk data sampel ke-i pada cluster ke-k
xij = data ke-i, atribut ke-j
Pt = fungsi objektif pada iterasi ke-t
Hitung Perubahan Matriks
Hitung perubahan matriks partisi menggunakan persamaan berikut (Yan, 1994) :
Dengan I = 1,2,…,n; dan k=1,2,…c.
Dimana :
Vkj = pusat cluster ke-k untuk atribut ke-j
ηik = derajat keanggotaan untuk data sampel ke-i pada cluster ke-k
xij = data ke-i, atribut ke-j
Cek Kondisi berhenti
Jika :
ATAU
maka berhenti. Jika tidak: t=t+1, ulangi langkah ke-4.