Beranda > Skripsi Komputer/Informatika > Analisa Struktur Kalimat Bahasa Indonesia dengan Menggunakan Pengurai Kalimat Berbasis Linguistic String Analysis

Analisa Struktur Kalimat Bahasa Indonesia dengan Menggunakan Pengurai Kalimat Berbasis Linguistic String Analysis

Januari 4, 2010

Tujuan utama penelitian ini adalah menganalisa struktur kalimat bahasa Indonesia dengan menggunakan pengurai kalimat berbasis linguistic string analysis. Struktur sintaks kalimat ini sangat diperlukan bagi pengembangan suatu sistem pemrosesan bahasa alami khususnya untuk pemrosesan bahasa Indonesia.
Struktur sintaks yang dibangun pada penelitian ini mengacu pada aturan-aturan sintaks yang terdapat di dalam tata bahasa baku bahasa Indonesia.Untuk menguji kebenaran aturan-aturan sintaks yang telah dibuat, dibuat juga pengurai sintaks yang memuat aturan-aturan sintaks tersebut. Pembuatan pengurai sintaks kalimat bahasa Indonesia ini menggunakan alat bantu Lex-Yacc.

Bahasa adalah salah satu komponen yang paling penting dalam kehidupan manusia. Dalam bentuk tulisan, bahasa menyimpan pengetahuan dari satu generasi ke generasi lain. Sedangkan dalam bentuk lisan, bahasa berperan dalam mengarahkan tingkah laku manusia sehari-hari dalam berhubungan dengan orang lain.
Salah satu motivasi dalam penelitian bahasa alami adalah bahwa kemampuan pemrosesan bahasa alami akan mengubah cara penggunaan komputer [Alle94]. Karena kebanyakan pengetahuan manusia tersimpan dalam bentuk bahasa, komputer yang dapat mengerti bahasa alami dapat mengakses informasi ini. Selain itu, antar muka sistem komputer yang kompleks yang menggunakan bahasa alami dapat diakses oleh setiap orang. Sistem yang seperti ini akan lebih fleksibel dan intelligent dan sangat mungkin diterapkan pada teknologi komputer sekarang ini.
Penelitian dalam bidang pemrosesan bahasa alami sudah banyak dilakukan. Namun kebanyakan penelitian tersebut dilakukan terhadap bahasa Inggris. Penelitian bahasa alami yang dilakukan terhadap bahasa Indonesia masih sedikit dilakukan. Tentunya penelitian ini selayaknya dilakukan oleh orang Indonesia sendiri.
Salah satu komponen terpenting dalam pemrosesan bahasa alami adalah pengurai (parser) struktur kalimat. Pengurai sintaks kalimat ini memberi indikasi bagaimana hubungan antar kata dalam satu kalimat. Struktur ini juga mengidentifikasikan bagaimana kata-kata bersatu membentuk frase, kata-kata yang
mana yang melakukan modifikasi kata yang lain dan kata-kata yang mana yang merupakan kata-kata inti dalam satu kalimat. Dengan informasi ini, komputer dapat menginterpretasikan kalimat sehingga seolah-olah komputer dapat mengerti kalimat tersebut.

Proses penguraian kalimat pada bahasa manusia mirip dengan proses penguraian tata bahasa pemrograman dalam dunia komputer. Perbedaan yang mendasar pada keduanya adalah tata bahasa dalam dunia komputer merupakan tata bahasa yang bebas konteks (context free grammar), sedangkan tata bahasa pada bahasa Indonesia merupakan tata bahasa alami yang peka terhadap konteks (context sensitive). Pendefinisian tata bahasa yang peka terhadap konteks untuk diproses oleh komputer merupakan hal yang sangat kompleks. Oleh karena itu, salah satu alternatif penyelesaian masalah ini adalah analisa konteks terhadap suatu kalimat dalam bahasa alami dipisahkan dengan analisa sintaks [Alle94]. Walaupun analisa semantik dipisahkan dari analisa sintaks, penguraian struktur kalimat dalam bahasa alami tetap tidak sederhana. Oleh karena itu, setelah dilakukan penguraian struktur kalimat dalam bahasa alami, pengurai perlu melakukan validasi terhadap struktur hasil penguraian tersebut.

Penelitian dan pembuatan pengurai sintaks kalimat untuk bahasa Indonesia sudah dilakukan oleh Iskak Hendrawan. Namun penelitian ini hanya terbatas pada kalimat-kalimat tunggal sederhana karena fokus penelitiannya lebih mengarah kepada pengujian penggunaan suatu metode penguraian kalimat yaitu metode linguistic string analysis terhadap kalimat bahasa Indonesia. Oleh karena itu, penulis mencoba melakukan penelitian yang cukup mendalam dengan memfokuskan penelitian pada pembuatan aturan sintaks kalimat bahasa Indonesia sesuai dengan aturan tata bahasa baku. Setelah itu, penulis mencoba membuat suatu pengurai sintaks kalimat untuk bahasa Indonesia untuk menguji aturan-aturan sintaks yang sudah dibuat sebelumnya.

Beberapa masalah dalam penguraian bahasa Indonesia adalah sebagai berikut:
• Representasi kalimat.
Masalah ini bertumpu pada formalisasi yang akan digunakan untuk menspesifikasikan kalimat-kalimat yang benar dalam bahasa Indonesia. Harus ada suatu mekanisme bagaimana suatu kalimat direpresentasikan, sehingga komputer mendapatkan informasi untuk menginterpretasikan kalimat tersebut.
• Pendefinisian aturan sintaks.
Untuk mendapatkan struktur penguraian suatu kalimat, pengurai memerlukan informasi aturan-aturan sintaks kalimat dalam bahasa Indonesia. Aturan-aturan sintaks ini didefinisikan dalam suatu format tertentu yang mudah dimengerti oleh manusia. Agar dapat dipakai oleh komputer untuk melakukan penguraian kalimat-kalimat bahasa Indonesia, diperlukan alat bantu yang dapat menerjemahkan aturan-aturan sintaks tersebut ke dalam bahasa pemrograman yang dimengerti olehnya.
• Kamus kata.
Kamus kata ini diperlukan untuk informasi kelas kata dari kata yang akan diuraikan.

%d blogger menyukai ini: