TUGAS PTSC 4.1
4.1
Pemrosesan Bahasa Alami(Natural
Languange Processing /NLP)
Pengertian Bahasa Alami
Sebagaimana diketahui, bahasa dapat dibedakan menjadi bahasa buatan dan bahasa alami (natural language). Bahasa buatan adalah bahasa yang dibuat secara khusus untuk memenuhi kebutuhan tertentu, misalnya bahasa pemrograman komputer. Bahasa alami adalah bahasa yang biasa digunakan untuk berkomunikasi antar manusia, misalnya bahasa Indonesia, Sunda, Jawa, Inggris, dan Jepang. Bentuk representasi bahasa alami dapat berwujud lisan (audio) dan tulisan (teks). Komunikasi antara manusia dengan komputer menjadi perhatian khusu dalam perkembangan di bidang kecerdasan buatan. Salah satu bidang kecerdasan buatan yang mengembangkan bahasa alami manusia unruk berkomunikasi dengan komputer adalah bahasa alami.
Sistem Natural
Language Processing
Aplikasi Pengolahan Bahasa
Alami
Banyak manfaat yang dapat dicapai dari ketersediaan Aplikasi Teknologi Bahasa, khususnya untuk Bahasa Indonesia. Contohnya sebagai berikut:
Pengertian Bahasa Alami
Sebagaimana diketahui, bahasa dapat dibedakan menjadi bahasa buatan dan bahasa alami (natural language). Bahasa buatan adalah bahasa yang dibuat secara khusus untuk memenuhi kebutuhan tertentu, misalnya bahasa pemrograman komputer. Bahasa alami adalah bahasa yang biasa digunakan untuk berkomunikasi antar manusia, misalnya bahasa Indonesia, Sunda, Jawa, Inggris, dan Jepang. Bentuk representasi bahasa alami dapat berwujud lisan (audio) dan tulisan (teks). Komunikasi antara manusia dengan komputer menjadi perhatian khusu dalam perkembangan di bidang kecerdasan buatan. Salah satu bidang kecerdasan buatan yang mengembangkan bahasa alami manusia unruk berkomunikasi dengan komputer adalah bahasa alami.
Pengguna
manusia mengkomunikasikan keinginannya ke mesin melalui bahasa alami dan mesin
dapat menanggapi dengan cara serupa, sebagaimana bentuk komunikasi antar
manusia dengan manusia yang lain. Meniru jenis komunikasi alami seperti ini,
antarmuka komputer pun dirupakan dalam bentuk maujud, berupa karakter virtual
hidup (life-like virtual character).
Pemrosesan
Bahasa Alami (Natural Language Processing), yang memberi kemampuan
pengguna komputer untuk berkomunikasi dengan komputer dalam bahasa mereka
sendiri (bahasa manusia). Sehingga komunikasi dapat dilakukan dengan cara
percakapan menggunakan perintah yang biasa digunakan dalam bahasa komputer
biasa. Bidang ini dibagi menjadi 2 :
- Pemahaman bahasa alami, yang mempelajari metode
yang memungkinkan komputer mengerti perintah yang diberikan dalam bahasa
manusia biasa. Dengan kata lain, komputer dapat memahami manusia.
- Pembangkitan bahasa alami, sering disebut juga
sintesa suara, yang membuat komputer dapat membangkitkan bahasa manusia
biasa sehingga manusia dapat memahami komputer secara mudah.
Sistem Pemrosesan Bahasa AlamiSuatu sistem pemrosesan bahasa alami secara lisan dapat dibentuk dari tiga sub-sistem, yaitu sebagai berikut:
Sistem
Speech
Recognition
Sistem Speech Recognition atau sistem pengenalan ucapan adalah sistem yang
berfungsi untuk mengubah bahasa lisan menjadi bahasa tulisan. Masukan sistem
adalah ucapan manusia, selanjutnya sistem akan mengidentifikasikan kata atau
kalimat yang diucapkan dan menghasilkan teks yang sesuai dengan apa yang
diucapkan.
Pada Gambar 3.9, Sinyal ucapan (s(n))
pertama kali akan dilewatkan pada bagian Penganalisis Ucapan untuk mendapatlan
besaran-besaran atau ciri-ciri yang mudah diolah pada tahap berikutnya. Untuk
setiap ucapan yang berbeda akan dihasilkan pola ciri yang berbeda.
Gambar 4.11 Diagram Blok Sistem Pengenal Ucapan
Sistem speech recognition yang dapat mengenali seluruh kata dalam suatu bahasa
melakukan pengenalan untuk setiap unit bunyi pembentuk ucapan (fonem),
selanjutnya mencoba mencari kemungkinan kombinasi hasil ucapan yang paling
dapat diterima. Sistem yang lebih sederhana adalah sistem yang hanya dapat
mengenal sejumlah kata yang jumlahnya terbatas. Sistem ini biasanya lebih
akurat dan lebih mudah dilatih, tetapi tidak dapat mengenal kata yang berada di
luar kosa kata yang pernah diajarkan.
Sistem speech recognition biasanya dapat dioperasikan pada dua mode yang
berbeda. Pertama adalah mode belajar. Pada mode ini, sistem akan dilatih
menggunakan sejumlah kata atau kalimat yang memenuhi suatu kriteria tertentu.
Setiap contoh kata atau kalimat ajar tersebut akan menghasilkan pola tertentu
yang akan dipelajari oleh sistem dan disimpan sebagai template atau referensi.
Kedua adalah mode produksi atau
pengenalan ucapan. Pada mode ini, setiap kalimat yang ingin dikenali akan dianalisis polanya. Berdasarkan hasil
perbandingan dengan template atau
referensi, modul klasifikasi pola serta pengambil keputusan akan
mengidentifikasikan kata atau kalimat yang diucapkan tersebut. Pada prinsipnya,
teknik-teknik atau algoritma yang digunakan pada sistem Pengenal Ucapan tidak
bersifat sensitif terhadap bahasa. Artinya, sistem yang sama dapat digunakan untuk
bahasa apapun. Namun demikian, kemampuan sistem untuk mengenali ucapan pada
bahasa tertentu sangat tergantung dari template
atau referensi yang diperoleh melalui proses belajar di dalam sistemnya itu
sendiri.
Sistem
Text to
Speech
TTS adalah suatu sistem yang dapat
mengubah text menjadi ucapan. Suatu
sistem pensintesa ucapan atau Text to Speech pada prinsipnya terdiri
atas dua sub sistem, yaitu:
1)
bagian
Konverter Teks ke Fonem (Text to Phoneme), serta
2)
bagian
Konverter Fonem ke Ucapan (Phoneme to Speech).
Gambar 4.12 Diagram Blok Sistem Text to Speech (Bahasa Indonesia)
Gambar 4.13 Urutan Proses Konversi Teks Menjadi Ucapan (Text to Speech)
Bagian Konverter Teks ke Fonem berfungsi
untuk mengolah kalimat masukan dalam suatu bahasa tertentu yang berbentuk teks
menjadi urutan kode-kode bunyi yang direpresentasikan dengan kode fonem, durasi
serta pitch-nya. Kode-kode fonem
adalah kode yang merepresentasikan unit bunyi yang ingin diucapkan. Pengucapan
kata atau kalimat pada prinsipnya adalah urutan bunyi atau secara simbolik
adalah urutan kode fonem. Setiap fonem harus dilengkapi dengan informasi
durasi dan pitch. Informasi durasi
diperlukan untuk menentukan berapa lama suatu fonem diucapkan, sedangkan
informasi pitch diperlukan untuk
menentukan tinggi rendahnya nada pengucapan suatu fonem. Durasi dan pitch bersama-sama akan membentuk
intonasi suatu ucapan. Kedua informasi ini dalam suatu sistem TTS biasanya
dibangkitkan oleh modul pembangkit/model intonasi. Bagian Konverter Fonem ke
Ucapan akan menerima masukan kode-kode fonem serta pitch dan durasi yang telah dihasilkan oleh bagian sebelumnya.
Berdasarkan kode-kode tersebut, bagian ini akan menghasilkan bunyi atau sinyal
ucapan yang sesuai dengan kalimat yang ingin diucapkan.
Sistem Natural
Language Processing
Teknologi Natural Language Processing
(NLP) atau pemrosesan bahasa alami adalah teknologi yang memungkinkan untuk
melakukan berbagai macam pemrosesan terhadap bahasa alami yang biasa digunakan
oleh manusia. Beberapa di antara berbagai kategori aplikasi NLP adalah sebagai berikut:
1. Natural Language Translator, yaitu translator dari satu bahasa alami ke bahasa alami lainnya, misalnya
translator bahasa Inggris ke bahasa
Indonesia, Bahasa Indonesia ke Bahasa Jawa dan sebagainya. Translator bahasa alami bukan hanya kamus yang menerjemahkan kata
per kata, tetapi harus juga mentranslasikan sintaks dari bahasa asal ke bahasa tujuannya.
2. Translator bahasa alami ke bahasa buatan, yaitu
translator yang mengubah perintah-perintah dalam bahasa alami menjadi bahasa
buatan yang dapat dieksekusi oleh mesin atau komputer. Sebagai contoh, translator yang memungkinkan kita
memberikan perintah bahasa alami kepada komputer. Dengan sistem seperti ini,
pengguna sistem dapat memberikan perintah dengan bahasa sehari- hari, misalnya,
untuk menghapus semua file, pengguna
cukup memberikan perintah ”komputer, tolong hapus semua file!” Translator akan
mentranslasikan perintah bahasa alami tersebut menjadi perintah bahasa formal
yang dipahami oleh komputer, yaitu “dir *.*”.
3. Text Summarization, yaitu suatu sistem yang dapat
”membuat ringkasan” hal-hal yang penting dari suatu wacana yang diberikan.
Aplikasi Pengolahan Bahasa
Alami
Jenis Aplikasi yang dapat dibuat pada
bidang Natural Processing Language adalah:
a.
Text-based application
b.
Dialogue-based application (speech-based application).
Text-based
application mencakup
segala macam aplikasi yang melakukan proses terhadap teks. Contoh penggunaan text- based application adalah:
·
Mencari
topik tertentu dari buku di perpustakaan
·
Mencari
isi dari email
·
Menterjemahkan
dokumen dari suatu bahasa ke bahasa lain
Dialogue-based
application adalah aplikasi yang melibatkan bahasa
lisan atau pengenalan suara, tetapi bidang ini juga memasukkan interaksi dengan
cara memasukkan teks pertanyaan melalui keyboard.
Contoh aplikasinya adalah:
· Sistem
tanya jawab, di mana Natural Language digunakan
dalam mendapatkan informasi dalam suatu database.
· Sistem
otomatis pelayanan dalam telepon.
· Control
suara pada peralatan elektronik
· Sistem
problem-solving (pemecah masalah) yang membantu untuk melakukan
penyelesaian masalah yang umum dihadapi dalam suatu pekerjaan.
· Aplikasi
peningkatan kemampuan berbahasa.
Banyak manfaat yang dapat dicapai dari ketersediaan Aplikasi Teknologi Bahasa, khususnya untuk Bahasa Indonesia. Contohnya sebagai berikut:
·
Alat bantu membaca untuk
tunanetra
·
Alat bantu bicara untuk
tunawicara
·
Online translator
·
Talking email atau
aplikasi lainnya
Referensi :
http://repository.uinjkt.ac.id/dspace/bitstream/123456789/44538/2/naskah%20kecerdasan%20buatan.pdf
https://teknikinformatikasahid.wordpress.com/2016/02/09/mata-kuliah-bahasa-alami/
Komentar
Posting Komentar