the image was taken from https://www.analyticsvidhya.com |
Bismillah.. setelah sekian lama belum ada artikel lagi, semoga bisa kembali produktif menulis di blog ini lagi dan terus konsisten ✌.
Pada beberapa artikel sebelumnya terkait content-based filtering di Sistem rekomendasi, saya menggunakan salah satu library untuk preprocessing text yaitu Sastrawi di Python. Ternyata beberapa mahasiswa menanyakan penggunaan library tersebut di pemrograman PHP. Inilah salah satu alasan adanya artikel ini.
php composer.phar require sastrawi/sastrawi:^1
Contohnya:
- Menghilang = hilang
- Terjangkau = jangkau
Output dari code diatas sebagai berikut:
Array ( [1] => hotel modern jangkau [2] => akomodasi modern nyaman tenang [3] => hotel bintang 3 mewah harga jangkau )
Dari output tersebut terlihat bahwa beberapa kata stop-words dan tanda koma (,) berhasil di hapus dan kata "terjangkau" diubah menjadi bentuk kata dasar "jangkau". Tahapan ini berguna untuk beberapa case berikutnya seperti: text classification, sentiment analysis atau yang akan saya bahas berikutnya yaitu menghitung pembobotan kata dengan TF-IDF untuk sistem rekomendasi berbasis content (content-based filtering).
Selamat mencoba..
Referensi
- https://adinyahya.com/cara-penerapan-stemming-dengan-menggunakan-library-sastrawi/
- https://github.com/sastrawi/sastrawi
0 comments:
Post a Comment