UNUD Open Repository

UNUD Open Repository provides access and discovery to the University of Udayana publications and digital collections. It contains digitized and digital version of theses, dissertations, research reports, and articles produced by academic communities in this university.

Part-Of-Speech Tagging Untuk Dokumen Bahasa Bali Menggunakan Algoritma Brill Tagger.

Ni Putu Meri Sriyati, Ni Putu Meri Sriyati (2016) Part-Of-Speech Tagging Untuk Dokumen Bahasa Bali Menggunakan Algoritma Brill Tagger. Bachelor thesis, Universitas Udayana.

[img] Archive (ABSTRAK)
0f0ffa73857e1f0d34146a682a8e0e9d.pdf - Published Version

Download (564kB)
[img] Archive (BAB I)
3a35fae0e4520fbdd5f5d1836607a8cc.pdf - Published Version

Download (132kB)
[img] Archive (BAB II)
3a96b1bd18f0cb637d23468a8ff8b697.pdf - Published Version

Download (289kB)

Abstract

Setiap hari pertumbuhan data semakin meningkat, sehingga diperlukan text processing untuk mengelola data yang besar. Namun, dalam text processing sering kali muncul permasalahan ambiguitas kata. Hal ini menyebabkan perbedaan arti yang dapat mempengaruhi makna dari sebuah kalimat. Sehingga diperlukan sebuah pelabelan kelas kata atau biasa disebut Part-of-Speech Tagging. Perkembangan teknologi dapat digunakan untuk melestarikan budaya Bali. Penelitian Part-of-Speech Tagging ini digunakan untuk memberikan label pada dokumen bahasa Bali. Metode Brill Tagger menghasilkan aturan yang diperoleh berdasarkan Transformation-based Error Driven Learning sehingga membuat metode Brill Tagger menjadi sangat kompetitif dibandingkan metode stokastik. Metode ini menggunakan dua aturan pembelajaran, yaitu : aturan leksikal dan aturan kontekstual. Pembelajaran aturan leksikal menggunakan pola imbuhan dalam bahasa Bali dan aturan kontekstual menggunakan aturan frasa, pola bigram, dan trigram. Pada proses pembelajaran digunakan 70% kalimat dari dataset yaitu sebanyak 507 kalimat menghasilkan 175 aturan leksikal dan 21 aturan kontesktual. Kedua aturan ini diaplikasikan pada data testing yaitu 30% kalimat dari dataset yang terdiri dari 3413 kata menghasilkan nilai akurasi 90,16%.

Item Type: Thesis (Bachelor)
Uncontrolled Keywords: Part-of-Speech Tagging, Brill Tagger, Lexical, Contextual
Subjects: L Education > L Education (General)
Divisions: Faculty of Law, Arts and Social Sciences > School of Education
Depositing User: Mr. Repository Admin
Date Deposited: 07 Jun 2016 24:58
Last Modified: 24 Jun 2016 05:58
URI: http://erepo.unud.ac.id/id/eprint/11175

Actions (login required)

View Item View Item