UMRIYA, AFINI (2016) PENERAPAN ANALISIS MORFOLOGI UNTUK PENGGUNAAN KATA BERIMBUHAN PADA POS TAGGER BAHASA INDONESIA BERBASIS STATISTIK. Skripsi,Fakultas Ilmu Komputer.
| PDF Download (3972b) | Preview |
Abstract
POS tagging (pelabelan kelas kata) merupakan salah satu proses penting pada aplikasi-aplikasi NLP. POS tagging otomatis dibutuhkan karena POS tagging manual membutuhkan waktu yang lama dan biaya mahal. Masalah utama POS tagging otomatis adalah kata ambigu dan kata Out-of-Vocabulary (OOV). Salah satu pendekatan untuk mengatasi masalah kata ambigu adalah POS tagging menggunakan pendekatan statistik dengan Hidden Markov Model (HMM). Sistem POS tagger Bahasa Indonesia yang menerapkan HMM adalah IPOSTAgger. Sedangkan penanganan kata OOV dalam penelitian ini digunakan metode pengalisis morfologi dengan sistem yang diterapkan adalah Morphind. Selain untuk penanganan kata OOV, Morphind juga digunakan untuk pemotongan klitik pada kata imbuhan berbentuk frasa. Dengan menggabungkan kedua sistem dihasilkan beberapa model POS tagging Bahasa Indonesia. Korpus yang digunakan yaitu korpus latih terdiri dari 10.000 kata yang telah diberi 31 label POS dan 3 jenis korpus uji masing-masing berisi 3000 kata. Keakuratan tertinggi sebesar 95.683~% dihasilkan oleh model HMM trigram + MA pada korpus uji 1 dengan tingkat kata OOV 10%, pada korpus 2 dengan tingkat kata OOV 20% dihasilkan oleh model HMM trigram + MA dan HMM bigram + MA dengan keakuratan yang sama yaitu 92.809~%, sedangkan pada korpus 3 dengan tingkat kata OOV 30% dihasilkan oleh model HMM bigram + MA yaitu sebesar 88.3279~%.
Item Type: | Article |
---|---|
Subjects: | T Technology > Teknik Informatika Universitas Dian Nuswantoro > Fakultas Ilmu Komputer > Teknik Informatika |
Divisions: | Fakultas Ilmu Komputer |
Depositing User: | Psi Udinus |
Date Deposited: | 22 Sep 2016 14:29 |
Last Modified: | 22 Sep 2016 14:29 |
URI: | http://eprints.dinus.ac.id/id/eprint/19528 |
Actions (login required)
View Item |