TUGAS PTSC 2.4

2.4  Natural Language Processing (NLP) 




Natural Language Processing biasa disebut dengan Pemrosesan Bahasa Alami adalah Bidang Artificial Intelligence yang berurusan dengan pemahaman bahasa (alami) manusia (bahasa inggris, jerman, Indonesia dan lain-lain). Bahasa alami atau yang disebut dengan natural language adalah suatu bahasa yang diucapkan, ditulis, disyaratkan oleh manusia untuk berkomunikasi umum. Jadi bahasa alami/ natural language yaitu bahasa yang dimengerti oleh manusia. Bahasa alami pada prinsipnya adalah suatu bentuk representasi dari suatu pesan yang akan dikomunikasikan antar manusia. Representasinya dapat berupa ucapan/ suara  (spoken language), namun juga bisa dinyatakan berupa tulisan.

Natural Language Processing adalah komponen penting dalam text mining dan subbidang dalam kecerdasan buatan (artificial intelligence/AI) dan komputasi linguistic. Dia mempelajari tentang bagaimana ‘memahami’  bahasa manusia alami, dengan cara mengubah gambaran bahasa manusia (seperti dokumen teks) menjadi penyajian yang lebih formal (dalam bentuk data numeric dan sombolik) yang lebih mudah untuk dimanupulasi oleh program computer. Tujuan NLP adalah untuk melangkah melebihi manipulasi teks berbasis sintaks (yang sering kali disebut dengan ‘word counting’) ke pemahaman yang benar dan memproses bahasa alami yang mempertimbangkan berbagai batasan semantik dan gramatikal dan juga konteks.
Kajian NLP (natural language processing) antara lain mencakup :

1. Segmentasi Tuturan (speech segmentation) : proses identifikasi batas antara kata, suku kata, atau fonem  pada bahasa alami lisan. Istilah ini digunakan baik bagi proses mental yang dilakukan oleh manusia, maupun proses buatan oleh pemrosesan bahasa alami.
2. Segmentasi Teks (text segmentation) : proses pemisahan teks tertulis menjadi unit makna seperti kata, kalimat, atau topik. 

3. Penandaan Kelas Kata (part-of-speech tagging) : proses penandaan kata pada suatu teks dalam kaitannya dengan suatu kelas kata tertentu berdasarkan definisi dan maknanya hubungannya dengan kata yang mendampingi atau yang terkait dengannya pada suatu frasa, kalimat, atau paragraf.
 
4. Pengawataksaan Makna (word sense disambiguation) : masalah terbuka pemrosesan bahasa alami berupa proses identifikasi makna kata polisemi yang digunakan pada suatu kalimat.

Meskipun kajiannya dapat mencakup teks dan tuturan, pemerosesan tuturan (speech processing) telah berkembang menjadi suatu bidang kajian terpisah.

Kategori Aplikasi Bahasa Alami
Beberapa diantara berbagai kategori aplikasi NLP adalah sebagai berikut: 

1. 
Natural Language Translator, yaitu translator dari satu bahasa alami ke bahasa alami lainnya, misalnya translator bahasa Inggris ke bahasa Indonesia, dsb.

2. Translator bahasa alami ke bahasa buatan, yaitu translator yang mengubah perintah-perintah dalam bahasa alami menjadi bahasa buatan yang dapat dieksekusi oleh mesin atau komputer. Contohnya untuk menghapus semua file, pengguna cukup memberikan perintah ”komputer, tolong hapus semua file !” Translator akan mentranslasikan perintah bahasa alami tersebut menjadi perintah bahasa formal yang dipahami oleh komputer, yaitu ”dir *.* ”.

3. 
Text Summarization, yaitu suatu sistem yang dapat ”membuat ringkasan” hal-hal yang penting dari suatu wacana yang diberikan.


Aplikasi Pengolahan Bahasa Alami
 
1. Text-based application adalah segala macam aplikasi yang melakukan proses terhadap teks tertulis seperti misalnya dokumen, e-mail, buku dan sebagainya. Contoh jenis aplikasi NLP yang berbasis teks :

Machine Translation 
Program yang mampu mentranslasi kalimat baik berupa teks maupun suara dari satu bahasa alami ke bahasa lainnya. Contoh : Google Translate.



2. Dialogue-based application idealnya melibatkan bahasa lisan atau pengenalan suara, akan tetapi bisa juga memasukan interaksi dialog dengan mengetikkan teks pertanyaan melalui keyboard.
 Contoh : 

Chatbot

Chatbot adalah program komputer yang didesain untuk mensimulasikan sebuah percakapan cerdas dengan satu atau lebih pengguna manusia melalui inputan suara atau teks, utamanya digunakan untuk percakapan kecil. Contoh : Cleverbot, SimSimi, dan begobet.




Definisi dan scope dari kata ‘memahami’ adalah salah satu topic utama dalam diskusi tentang NLP. Dengan mempertimbangkan bahwa bahasa alami manusia adalah kabur dan bahwa pemahaman yang benar terhadap suatu arti memerlukan pengetahuan yang luas terhadap suatu topic (jauh berada diluar kata, kalimat, dan paragraph), akankah komputer mampu memahami bahasa alami dengan cara yang sama dan akurasi yang sama dengan manusia? Barangkali tidak! NLP telah ada lama sejak era ‘word counting’ yang sederhana, namun dia masih perlu lebih lama lahi untuk menuju ke benar-benar mampu memahami bahasa alami manusia.  Berikut adalah beberapa tantangan yang biasanya dikaitkan dengan implementasi NLP:
      ·   Part-of-speech tagging. Sangatlah sulit untuk menandai istilah-istilah dalam suatu teks yang terkait dengan bagian tertentu dari suatu naskah (misalnya kata benda, kata kerja, kata sifat, kata keterangan, dst), karena bagian dari naskah tidak hanya bergantung pada definisi istilah tetapi juga pada konteks dimana teks digunakan.
      · Text segmentation. Beberapa bahasa tulisan, seperti bahasa mandarin, jepang, dan thai, tidak memiliki batasan kata. Dalam contoh ini, tugas text-parsing memerlukan idetifikasi terhadap batasan kata, yang seringkali merupakan tugas yang sangat sulit. Tantangan serupa dalam segmentasi naskah muncul ketika menganalisa bahasa verbal, karena suara menyajikan rangkaian huruf dan kata yang bercampur satu sama lain.
      ·   Word sense disambiguation.  Banyak kata yang memiliki lebih dari satu arti. Memilih arti yang paling masuk akan hanya bisa dicapai dengan mempertimbangkan konteks di mana kata digunakan.









Referensi:
https://www.temukanpengertian.com/2013/08/pengertian-natural-language-processing.html
https://socs.binus.ac.id/2013/06/22/natural-language-processing/

Komentar

Postingan populer dari blog ini

TUGAS INOVASI SI 3.3

TUGAS PTSC 1.3