Variance Within Cluster
1. Masalah: Hitung varians dalam klaster ($v_w$) dari dataset titik-titik (1,1), (3,1), (1,3), (3,3), (7,7), dan (9,9).
2. Langkah pertama adalah menetapkan klaster dan jumlah data total ($N$). Misalnya, kelompokkan data menjadi dua klaster: Klaster 1 = {(1,1), (3,1), (1,3), (3,3)} dan Klaster 2 = {(7,7), (9,9)}. Jadi, $N=6$, $k=2$.
3. Hitung rata-rata (mean) tiap klaster:
- Mean Klaster 1: $$\bar{x_1} = \left(\frac{1+3+1+3}{4}, \frac{1+1+3+3}{4}\right) = (2, 2)$$
- Mean Klaster 2: $$\bar{x_2} = \left(\frac{7+9}{2}, \frac{7+9}{2}\right) = (8, 8)$$
4. Hitung varians antar dimensi untuk tiap klaster:
- Varians klaster 1 dihitung melalui varians pada masing-masing dimensi dan rata-ratakan jika diperlukan, disini kita hitung total varians sebagai jumlah variansi dimensi x dan y:
$$v_1^2 = \frac{(1-2)^2+(3-2)^2+(1-2)^2+(3-2)^2}{4} + \frac{(1-2)^2+(1-2)^2+(3-2)^2+(3-2)^2}{4} = \frac{1+1+1+1}{4} + \frac{1+1+1+1}{4} = 2$$
- Varians klaster 2:
$$v_2^2 = \frac{(7-8)^2+(9-8)^2}{2} + \frac{(7-8)^2+(9-8)^2}{2} = \frac{1+1}{2} + \frac{1+1}{2} = 2$$
5. Hitung varians dalam klaster menggunakan rumus:
$$v_w = \frac{1}{N-k} \sum_{i=1}^k (n_i - 1) v_i^2 = \frac{1}{6-2} ((4-1)\times 2 + (2-1)\times 2) = \frac{1}{4} (3\times 2 + 1\times 2) = \frac{1}{4} (6 + 2) = 2$$
6. Jadi, nilai varians dalam klaster ($v_w$) adalah 2.