TUGAS PTSC 4.1

4.1 Pemrosesan Bahasa Alami(Natural  Languange Processing /NLP)


Pengertian Bahasa Alami

Sebagaimana diketahui, bahasa dapat dibedakan menjadi bahasa buatan dan bahasa alami (natural language). Bahasa buatan adalah bahasa yang dibuat secara khusus untuk memenuhi kebutuhan tertentu, misalnya bahasa pemrograman komputer. Bahasa alami adalah bahasa yang biasa digunakan untuk berkomunikasi antar manusia, misalnya bahasa Indonesia, Sunda, Jawa, Inggris, dan Jepang. Bentuk representasi bahasa alami dapat berwujud lisan (audio) dan tulisan (teks). Komunikasi antara manusia dengan komputer menjadi perhatian khusu dalam perkembangan di bidang kecerdasan buatan. Salah satu bidang kecerdasan buatan yang mengembangkan bahasa alami manusia unruk berkomunikasi dengan komputer adalah bahasa alami.
Pengguna manusia mengkomunikasikan keinginannya ke mesin melalui bahasa alami dan mesin dapat menanggapi dengan cara serupa, sebagaimana bentuk komunikasi antar manusia dengan manusia yang lain. Meniru jenis komunikasi alami seperti ini, antarmuka komputer pun dirupakan dalam bentuk maujud, berupa karakter virtual hidup (life-like virtual character).
Pemrosesan Bahasa Alami (Natural Language Processing), yang memberi kemampuan pengguna komputer untuk berkomunikasi dengan komputer dalam bahasa mereka sendiri (bahasa manusia). Sehingga komunikasi dapat dilakukan dengan cara percakapan menggunakan perintah yang biasa digunakan dalam bahasa komputer biasa. Bidang ini dibagi menjadi 2 :

  1. Pemahaman bahasa alami, yang mempelajari metode yang memungkinkan komputer mengerti perintah yang diberikan dalam bahasa manusia biasa. Dengan kata lain, komputer dapat memahami manusia.
  2. Pembangkitan bahasa alami, sering disebut juga sintesa suara, yang membuat komputer dapat membangkitkan bahasa manusia biasa sehingga manusia dapat memahami komputer secara mudah.

    Sistem Pemrosesan Bahasa
    Alami
       Suatu sistem pemrosesan bahasa alami secara lisan dapat dibentuk dari tiga sub-sistem, yaitu sebagai berikut:

  Sistem Speech Recognition
Sistem Speech Recognition atau sistem pengenalan ucapan adalah sistem yang berfungsi untuk mengubah bahasa lisan menjadi bahasa tulisan. Masukan sistem adalah ucapan manusia, selanjutnya sistem akan mengidentifikasikan kata atau kalimat yang diucapkan dan menghasilkan teks yang sesuai dengan apa yang diucapkan.
Pada Gambar 3.9, Sinyal ucapan (s(n)) pertama kali akan dilewatkan pada bagian Penganalisis Ucapan untuk mendapatlan besaran-besaran atau ciri-ciri yang mudah diolah pada tahap berikutnya. Untuk setiap ucapan yang berbeda akan dihasilkan pola ciri yang berbeda.


                                          Gambar 4.11 Diagram Blok Sistem Pengenal Ucapan

Sistem speech recognition yang dapat mengenali seluruh kata dalam suatu bahasa melakukan pengenalan untuk setiap unit bunyi pembentuk ucapan (fonem), selanjutnya mencoba mencari kemungkinan kombinasi hasil ucapan yang paling dapat diterima. Sistem yang lebih sederhana adalah sistem yang hanya dapat mengenal sejumlah kata yang jumlahnya terbatas. Sistem ini biasanya lebih akurat dan lebih mudah dilatih, tetapi tidak dapat mengenal kata yang berada di luar kosa kata yang pernah diajarkan.
Sistem speech recognition biasanya dapat dioperasikan pada dua mode yang berbeda. Pertama adalah mode belajar. Pada mode ini, sistem akan dilatih menggunakan sejumlah kata atau kalimat yang memenuhi suatu kriteria tertentu. Setiap contoh kata atau kalimat ajar tersebut akan menghasilkan pola tertentu yang akan dipelajari oleh sistem dan disimpan sebagai template atau referensi.
Kedua adalah mode produksi atau pengenalan ucapan. Pada mode ini, setiap kalimat yang ingin dikenali akan dianalisis polanya. Berdasarkan hasil perbandingan dengan template atau referensi, modul klasifikasi pola serta pengambil keputusan akan mengidentifikasikan kata atau kalimat yang diucapkan tersebut. Pada prinsipnya, teknik-teknik atau algoritma yang digunakan pada sistem Pengenal Ucapan tidak bersifat sensitif terhadap bahasa. Artinya, sistem yang sama dapat digunakan untuk bahasa apapun. Namun demikian, kemampuan sistem untuk mengenali ucapan pada bahasa tertentu sangat tergantung dari template atau referensi yang diperoleh melalui proses belajar di dalam sistemnya itu sendiri.

  Sistem Text to Speech
TTS adalah suatu sistem yang dapat mengubah text menjadi ucapan. Suatu sistem pensintesa ucapan atau Text to Speech pada prinsipnya terdiri atas dua sub sistem, yaitu:
1)       bagian Konverter Teks ke Fonem (Text to Phoneme), serta
2)       bagian Konverter Fonem ke Ucapan (Phoneme to Speech).



                          Gambar 4.12 Diagram Blok Sistem Text to Speech (Bahasa Indonesia)


                                      Gambar 4.13 Urutan Proses Konversi Teks Menjadi Ucapan (Text to Speech)

Bagian Konverter Teks ke Fonem berfungsi untuk mengolah kalimat masukan dalam suatu bahasa tertentu yang berbentuk teks menjadi urutan kode-kode bunyi yang direpresentasikan dengan kode fonem, durasi serta pitch-nya. Kode-kode fonem adalah kode yang merepresentasikan unit bunyi yang ingin diucapkan. Pengucapan kata atau kalimat pada prinsipnya adalah urutan bunyi atau secara simbolik adalah urutan kode fonem. Setiap fonem harus dilengkapi dengan informasi durasi dan pitch. Informasi durasi diperlukan untuk menentukan berapa lama suatu fonem diucapkan, sedangkan informasi pitch diperlukan untuk menentukan tinggi rendahnya nada pengucapan suatu fonem. Durasi dan pitch bersama-sama akan membentuk intonasi suatu ucapan. Kedua informasi ini dalam suatu sistem TTS biasanya dibangkitkan oleh modul pembangkit/model intonasi. Bagian Konverter Fonem ke Ucapan akan menerima masukan kode-kode fonem serta pitch dan durasi yang telah dihasilkan oleh bagian sebelumnya. Berdasarkan kode-kode tersebut, bagian ini akan menghasilkan bunyi atau sinyal ucapan yang sesuai dengan kalimat yang ingin diucapkan.

  Sistem Natural Language Processing

Teknologi Natural Language Processing (NLP) atau pemrosesan bahasa alami adalah teknologi yang memungkinkan untuk melakukan berbagai macam pemrosesan terhadap bahasa alami yang biasa digunakan oleh manusia. Beberapa di antara berbagai kategori aplikasi NLP adalah sebagai berikut:
1.  Natural Language Translator, yaitu translator dari satu bahasa alami ke bahasa alami lainnya, misalnya translator bahasa Inggris ke bahasa Indonesia, Bahasa Indonesia ke Bahasa Jawa dan sebagainya. Translator bahasa alami bukan hanya kamus yang menerjemahkan kata per kata, tetapi harus juga mentranslasikan sintaks dari bahasa asal ke bahasa tujuannya.
2.    Translator bahasa alami ke bahasa buatan, yaitu translator yang mengubah perintah-perintah dalam bahasa alami menjadi bahasa buatan yang dapat dieksekusi oleh mesin atau komputer. Sebagai contoh, translator yang memungkinkan kita memberikan perintah bahasa alami kepada komputer. Dengan sistem seperti ini, pengguna sistem dapat memberikan perintah dengan bahasa sehari- hari, misalnya, untuk menghapus semua file, pengguna cukup memberikan perintah ”komputer, tolong hapus semua file!” Translator akan mentranslasikan perintah bahasa alami tersebut menjadi perintah bahasa formal yang dipahami oleh komputer, yaitu “dir *.*”.

3.  Text Summarization, yaitu suatu sistem yang dapat ”membuat ringkasan” hal-hal yang penting dari suatu wacana yang diberikan.

        Aplikasi Pengolahan Bahasa Alami

Jenis Aplikasi yang dapat dibuat pada bidang Natural Processing Language adalah:
a.        Text-based application
b.        Dialogue-based application (speech-based application).
Text-based application mencakup segala macam aplikasi yang melakukan proses terhadap teks. Contoh penggunaan text- based application adalah:
·         Mencari topik tertentu dari buku di perpustakaan
·         Mencari isi dari email
·         Menterjemahkan dokumen dari suatu bahasa ke bahasa lain

Dialogue-based application adalah aplikasi yang melibatkan bahasa lisan atau pengenalan suara, tetapi bidang ini juga memasukkan interaksi dengan cara memasukkan teks pertanyaan melalui keyboard. Contoh aplikasinya adalah:
·   Sistem tanya jawab, di mana Natural Language digunakan dalam mendapatkan informasi dalam suatu database.
·        Sistem otomatis pelayanan dalam telepon.
·        Control suara pada peralatan elektronik
·   Sistem problem-solving (pemecah masalah) yang membantu untuk melakukan penyelesaian masalah yang umum dihadapi dalam suatu pekerjaan.
·       Aplikasi peningkatan kemampuan berbahasa.

Banyak manfaat yang dapat dicapai dari ketersediaan Aplikasi Teknologi Bahasa, khususnya untuk Bahasa Indonesia. Contohnya sebagai berikut:
·         Alat bantu membaca untuk tunanetra
·         Alat bantu bicara untuk tunawicara
·         Online translator
·         Talking email atau aplikasi lainnya




Referensi :
http://repository.uinjkt.ac.id/dspace/bitstream/123456789/44538/2/naskah%20kecerdasan%20buatan.pdf
https://teknikinformatikasahid.wordpress.com/2016/02/09/mata-kuliah-bahasa-alami/

Komentar

Postingan populer dari blog ini

TUGAS PEMROGRAMAN BERORIENTASI OBJEK KE - 2

TUGAS MANAJEMEN LAYANAN SI 2.1

TUGAS ISD 10 : PRASANGKA, DISKRIMINASI & ETNOSENTRISME