Part-of-Speech (POS) Tagging Bahasa Indonesia Menggunakan Algoritma Viterbi

Sabloak, Nitin and Agung Hardono, Bebeto and Alamsyah, Derry Part-of-Speech (POS) Tagging Bahasa Indonesia Menggunakan Algoritma Viterbi. STMIK MDP.

[img]
Preview
Text
jurnal.pdf

Download (868Kb) | Preview

Abstract

Part-of-Speech (POS) tagging, yang juga disebut sebagai pelabelan kelas kata, adalah suatu proses yang memberikan label kelas kata secara otomatis pada suatu kalimat. Pelabelan kata dapat dilakukan berbasis aturan (rule based) dan probabilitas (probability-based) dari sebuah model yang dibangun. Beberapa penelitian POS tagging pada bahasa Inggris memiliki nilai akurasi yang tinggi. Bahasa Indonesia memiliki struktur yang lebih kompleks dari bahasa Inggris. Hal ini dilandasi oleh berbagai budaya yang melatarbelakangi bangsa Indonesia. Penelitian POS tagging berbasis rule-based sudah memberikan hasil yang baik untuk bahasa Indonesia, sementara penggunaan berbasis probabilitas mengalami kendala. Sementara itu, POS tagging berbasis probabilitas untuk bahasa Inggris memiliki hasil yang baik. Penelitian ini melakukan POS tagging berbasis probabilitas dengan menggunakan algoritma Viterbi pada teks bahasa Indonesia. Data korpus yang digunakan berasal dari Dinakaramani et al (2014). Metode yang digunakan untuk mendapatkan tingkat akurasi adalah dengan menggunakan 10-fold cross validation. Hasil penelitian ini menunjukkan bahwa akurasi rata-rata POS tagging yang didapatkan sebesar 93,23018%.

Item Type: Other
Uncontrolled Keywords: Part-of-Speech (POS) Tagging, Algoritma Viterbi, 10-fold cross validation
Subjects: Q Science > QA Mathematics > QA76 Computer software
Divisions: STMIK GI MDP > Teknik Informatika
Depositing User: Usniawati Kristin
Date Deposited: 21 Jul 2016 06:31
Last Modified: 21 Jul 2016 06:31
URI: http://eprints.mdp.ac.id/id/eprint/1845

Actions (login required)

View Item View Item