PEMANFAATAN SISTEM TEMU KEMBALI INFORMASI DALAM PENCARIAN DOKUMEN MENGGUNAKAN METODE VECTOR SPACE MODEL
Seiring banyaknya dokumen menyebabkan berkembangnya teknologi, penyimpanan dokumen dalam bentuk file semakin banyak digunakan. Akan tetapi, file-file tersebut akan terus bertambah setiap harinya dan untuk mencari informasi dari isi file-file tersebut akan menjadi sulit. Untuk itu dikembangkanlah metode ilmu pencarian yang dikenal dengan Information Retrieval. Information Retrieval memiliki beberapa macam pemodelan. Salah satunya bentuk pemodelannya adalah Algebratic model. Vector Space Model merupakan metode yang termasuk dalam Algebratic model yang menggunakan konsep ruang vektor.Pada metode VSM sebelum melakukan pencarian dokumen akan dilakukan indexing dengan memecah isi teks dari dokumen-dokumen tersebut menjadi index term. Index term ini yang akan digunakan untuk proses pencarian. Proses pembentukan index term dari teks yang terdapat di dalam dokumen akan melalui beberapa tahapan yaitu parsing, text preprocessing dan penghitungan bobot. Salah satu algoritma pembobotannya adalah algoritma TF•IDF yang dipengaruhi oleh frekuensi kemunculan kata pada sebuah dokumen dan frekuensi dari dokumen yang memiliki kata tersebut. Dari proses indexing dan weighting tersebut maka dapat ditemukan tingkat relevansi dokumen yang ada dengan query.
Tidak ada salinan data
Tidak tersedia versi lain