Algoritma k-NN (k-Nearest Neighbors)


Algoritma k-NN (k-Nearest Neighbors) adalah salah satu algoritma yang digunakan untuk klasifikasi atau pengelompokan data. Tetapi bisa juga digunakan untuk pencarian jalur. Contoh yang dibahas kali ini adalah menentukan kelompok hasil jual tipe sepeda motor baru berdasarkan kelompok data yang sudah ada



Diasumsikan ada 4 tipe motor yang sudah diketahui datanya, yaitu Motor A,B,C,D
Masing-masing tipe motor memiliki kriteria, yaitu harga, jarak tempuh per liter, cc, dan memiliki hasil jual yaitu Laris / Tidak Laris
Diasumsikan data dari 4 tipe motor tersebut adalah sebagai berikut:

Motor Harga Jarak tempuh per liter cc hasil jual
Motor A 10.000.000 35 110 Laris
Motor B 12.000.000 45 125 Laris
Motor C 11.000.000 40 150 Tidak Laris
Motor D 14.000.000 37.5 125 Tidak Laris

Selanjutnya ada 4 buah motor lagi, yaitu E,F,G,H, yang baru akan diluncurkan, sehingga tidak diketahui hasil jualnya
Maka tentukan data-data ini nantinya akan termasuk dalam kelompok hasil jual Laris / Tidak Laris
Diasumsikan data awalnya adalah sebagai berikut:

Motor Harga Jarak tempuh per liter cc
Motor E 13.000.000 45 125
Motor G 12.000.000 47 110
Motor F 10.500.000 43 110
Motor H 13.500.000 35 125



Langkah pertama adalah memasukkan data-data yang digunakan.
Contoh data awal adalah sebagai berikut:
Untuk kriteria hasil jual:
Nilai Laris dilambangkan dengan angka 1
Nilai Tidak Laris dilambangkan dengan angka 2


Langkah-langkah penggunaan algoritma ini adalah

1. Tentukan normalisasi data untuk data contoh dan data yang baru.

2. Tentukan parameter K, yaitu banyak jumlah titik tetangga yang diperhitungkan
Karena ada 4 data pada contoh awal, maka nilai K adalah 1 / 2 / 3 / 4
Diasumsikan dalam kasus ini, nilai K adalah 3, brarti hanya 3 titik tetangga terdekat yang diperhitungkan dalam setiap perhitungan

3. Tentukan fungsi untuk menghitung jarak titik pada matriks normalisasi terhadap tiap-tiap titik pada matriks contohdata
Dalam contoh kasus ini, Ada 3 fungsi yang dapat digunakan, yaitu Euclidean, Chebyshev, dan Manhattan
Sebetulnya masih banyak fungsi pengukuran jarak yang lain seperti Spearman dan Pearson, tetapi fungsi-fungsi tersebut tidak dibahas dalam contoh ini.

4. Lakukan perhitungan jarak dengan fungsi yang telah ditentukan antara titik baru dengan semua titik data contoh
Karena ada 4 data contoh, maka lakukan 4 kali perhitungan untuk setiap titik baru

* Gunakan fungsi ini untuk menghitung jarak Euclidean antara 2 titik

* Gunakan fungsi ini untuk menghitung jarak Chebyshev antara 2 titik

* Gunakan fungsi ini untuk menghitung jarak Manhattan antara 2 titik

5. Lakukan pengurutan data berdasarkan jarak terendah

6. Untuk k data teratas, yaitu 3, hitung jumlah data untuk hasil jual Laris dan Tidak Laris
Ambil kesimpulan berdasarkan jumlah data Laris / Tidak Laris yang lebih banyak


Hasil akhir adalah: (klik untuk perbesar gambar)

untuk perhitungan dengan fungsi Euclidean:
cmd22d
untuk perhitungan dengan fungsi Chebyshev:
cmd22e
untuk perhitungan dengan fungsi Manhattan:
cmd22f


Contoh modul / source code dalam bahasa VB (Visual Basic) dapat didownload disini:



Jika membutuhkan jasa kami dalam pembuatan program, keterangan selanjutnya dapat dilihat di Fasilitas dan Harga
Jika ada yang kurang paham dengan langkah-langkah algoritma diatas, silahkan berikan komentar Anda.
Selamat mencoba.

Tinggalkan sebuah komentar

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *