PRE-PROCESSING PENDUKUNG INFORMATION RETRIEVAL MELALUI PEMBENTUKAN KORPUS AL-QURAN TERJEMAHAN BAHASA INDONESIA
Abstract
Al Quran merupakan kitab suci umat Islam, merupakan pedoman bagi seluruh umat Islam. Al Quran sudah diterjemahkan ke berbagai bahasa salah satunya adalah bahasa Indonesia. Data set Al Quran agar layak digunakan dalam proses information retrieval perlu dilakukan preprocessing karena pada proses information retrieval proses dilakukan berdasarkan kata yang dianggap penting saja dalam suatu dokumen yang berbentuk token dan merupakan kata dasar, proses tersebut secara umum terdiri dari tokenizing, stopword removal dan stemming, dengan proses yang dilakukan tersebut hasilnya berupa korpus Al Quran terjemahan bahasa Indonesia yang layak dalam proses information retrieval Al Quran Terjemahan Bahasa Indonesia.