Algoritma Fuzzy Bitap


Algoritma Fuzzy Bitap adalah salah satu algoritma yang dapat digunakan untuk mencari dimana sebuah string (dalam kasus ini dinamakan sebagai pola) apakah ditemukan di dalam kumpulan string lain dengan ukuran yang lebih besar. Contoh yang dibahas kali ini adalah mengenai pencarian kata dari sebuah input teks.
Bitap akan memberitahu apakah data input memliki pola yang “kira-kira sama dengan” pola yang sedang dicari, dimana perkiraan ditentukan dengan menggunakan Levenshtein Distance. Algoritma dimulai dengan melakukan perhitungan bitmask yang mengandung 1 bit untuk setiap elemen dalam pola, kemudian pencarian akan dilakukan dengan cara operasi bitwise, dimana pencarian tersebut sangat cepat dilakukan.
Untuk melakukan pencarian Bitap menggunakan Fuzzy, maka diperlukan ekstensi bit array R menjadi beberapa dimensi. Jika sebelumnya hanya digunakan sebuah array R yang berubah seiring dengan panjang teks, maka sekarang bit array R memiliki beberapa dimensi untuk menampung perwakilan prefiks dari pola yang cocok dengan suffiks dari string yang sedang dihitung dengan error yang paling minimal. Dalam hal ini error ditentukan dari penyisipan/penghapusan/penggantian karakter, yang dapat dilakukan pada saat menghitung Levenshtein Distance.


Langkah-langkah penggunaan algoritma ini adalah

1. Tentukan teks yang digunakan sebagai input
Diasumsikan data input adalah sebagai berikut:
Lorem ipsum dolor sit amet, consectetur adipiscing elit, sed do eiusmod tempor incididunt ut labore et dolore magna aliqua. Ut enim ad minim veniam, quis nostrud exercitation ullamco laboris nisi ut aliquip ex ea commodo consequat. Duis aute irure dolor in reprehenderit in voluptate velit esse cillum dolore eu fugiat nulla pariatur. Excepteur sint occaecat cupidatat non proident, sunt in culpa qui officia deserunt mollit anim id est laborum.

2. Tentukan pola kata kunci yang digunakan dalam pencarian
Diasumsikan pola adalah sebagai berikut
labor

3. Lakukan pencarian kata kunci menggunakan algoritma ini

* Gunakan fungsi ini untuk mencari pola pada data input


Hasil akhir adalah: (klik untuk perbesar gambar)

cmd139


Contoh modul / source code dalam bahasa VB (Visual Basic) dapat didownload disini:



Jika membutuhkan jasa kami dalam pembuatan program, keterangan selanjutnya dapat dilihat di Fasilitas dan Harga
Jika ada yang kurang paham dengan langkah-langkah algoritma diatas, silahkan berikan komentar Anda.
Selamat mencoba.

Tinggalkan sebuah komentar

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *