Perancangan Dan Analisis Sistem Speech Processing Untuk Tunarungu Menggunakan Metode Hidden Markov Model Dan Mel-frequency Cepstral Coefficients (pdf)

Article PDF cannot be displayed. You can download it here:

https://openlibrarypublications.telkomuniversity.ac.id/index.php/engineering/article/download/8916/8779

Perancangan Dan Analisis Sistem Speech Processing Untuk Tunarungu Menggunakan Metode Hidden Markov Model Dan Mel-frequency Cepstral Coefficients

ISSN : 2355-9365 e-Proceeding of Engineering : Vol.6, No.1 April 2019 | Page 972 PERANCANGAN DAN ANALISIS SISTEM SPEECH PROCESSING UNTUK TUNARUNGU MENGGUNAKAN METODE HIDDEN MARKOV MODEL DAN MELFREQUENCY CEPSTRAL COEFFICIENT DESIGN AND ANALYSIS OF SPEECH PROCESSING SYSTEM FOR A DEAF PERSON USING HIDDEN MARKOV MODEL METHOD AND MEL-FREQUENCY CEPSTRAL COEFFICIENT Bagus Robbiyanto1, RaditianaPatmasari2, Rita Magdalena3 123 Prodi S1 Teknik Telekomunikasi, Fakultas Teknik Elektro, Universitas Telkom, Bandung , , 1 Abstrak Mendengar merupakan salah satu cara untuk saling berkomunikasi, mendengar sangat dibutuhkan oleh manuasia untuk mengerti maksud satu sama lain. Namun hal ini membatasi untuk orang normal berkomunikasi dengan tunarungu, karena tidak semua orang mengerti gerakan Bahasa isyarat. Pada Tugas Akhir ini membuat dibuat suatu alat untuk membantu orang normal untuk berkomunikasi dengan orang yang menderita tunarungu. Alat ini mengolah sinyal suara input menjadi suatu text menggunakan metode Mel Frequency Cepstral Coefficient untuk mengekstrasi sinyal suara input dan diklasifikasi menggunakan metode Hidden Markov Model untuk melihat kemiripan antara sinyal suara yang sudah diekstrasi ciri dengan yang di database. Jika terdapat suatu kemiripan maka menghasilkan suatu text, kemudian text tersebut diolah menjadi suatu input baru yang menampilkan video Bahasa Isyarat Indonesia. Hasil pengujian menunjukkan bahwa kombinasi metode mel frequency cepstral coefficient dan Hidden Markov Model mampu mengenali sinyal suara berupa kata dengan akurasi tertinggi mencapai 87%. Kata Kunci: Bahasa Isyarat indonesia, Tunarungu, MFFC, HMM. Abstract Hearing is one way to communicate with each other, hearing is needed by manuasia to understand each other's intentions. But this limits the normal person communicating with the deaf, because not everyone understands Sign Language. In this Final Project, a tool is created to help normal people communicate with people who are deaf. This tool processes the input sound signal into a text using the Mel Frequency Cepstral Coefficient method to extract input sound signals and is classified using the Hidden Markov Model method to see the similarity between the sound signals that have been extracted and those in the database. If there is a similarity then it produces a text, then the text is processed into a new input that displays Indonesian Sign Language videos. The test results showed that the combination of the mel frequency cepstral coefficient method and the Hidden Markov Model were able to recognize sound signals in the form of words with the highest accuracy reaching 87%. Keywords: Indonesian Sign Language, Deaf Person, speech processing, MFCC, HMM. 1. Pendahuluan 1.1 Latar Belakang Masalah Tunarungu (a deaf sperson) adalah orang yang mengalami ketidakmampuan mendengar, sehingga mengalami hambatan dalam memproses informasi bahasa melalui pendengarannya dengan atau tanpa menggunakan alat bantu dengar (hearing aid) [1]. Komunikasi dibagi menjadi 2 jenis yaitu komunikasi verbal dan non verbal. Komunikasi verbal yaitu komunikasi yang disampaikan secara tertulis atau berbicara dan komunikasi non verbal yaitu komunikasi yang tidak menggunakan kata-kata [2]. Bahasa isyarat unik dalam jenisnya di setiap negara. Bahasa isyarat bisa saja berbeda di negara-negara yang berbahasa sama. Untuk Indonesia, sistem yang sekarang umum digunakan adalah Sistem Isyarat Bahasa Indonesia (BISINDO) yang sama dengan bahasa isyarat America (ASL -American Sign Language). Sistem Isyarat Bahasa Indonesia (BISINDO) yang baku merupakan salah satu media bantu tuna wicara dalam bermasyarakat. Wujudnya adalah tatanan sistematis tentang seperangkat isyarat jari, tangan, dan berbagai gerak yang melambangkan kosakata Bahasa Indonesia [3]. Pada penelitian sebelumnya [4] sudah dilakukan penelitian yang berjudul “Design Implementasi Voice Command” menggunakan metode MFCC dan HMM dengan akurasi yang didapatkan 93,89% pada lingkungan ISSN : 2355-9365 e-Proceeding of Engineering : Vol.6, No.1 April 2019 | Page 973 tanpa noise dan 58,1% pada lingkungan noise. Namun pada penelitian sebelumnya hanya dilakukan pengolahan suara yang di proses lalu menghasilkan kata. Pada penelitian ini akan dibuat sebuah sistem yang akan membantu orang normal agar bisa berkomunikasi dengan tunarungu melalui sebuah video gerakan bahasa isyarat. Input dari sistem ini berupa sinyal suara yang di proses menggunakan metode Hidden Markov Model dan ekstrasi ciri Mel-Frequency Cepstral Coefficient Sehingga menghasilkan kata selanjutnya kata tersebut dijadikan input untuk memanggil output video gerakan bahasa isyarat. 2. Dasar Teori 2.1 Bahasa Isyarat Indonesia (BISINDO) Bahasa isyarat pada dasarnya sama dengan bahasa lisan akan tetapi cara penyampaiannya yang tidak sama, bahasa isyarat menggunakan tangan dan bahasa lisan menggunakan mulut. Sebelumnya bahasa isyarat tidak mendapat tempat dimasyarakat pengguna Bahasa Indonesia, sehingga bahasa isyarat menjadi tidak jelas dan tidak menentu. Bahasa Isyarat Indonesia adalah isyarat-isyarat kata yang pada mulanya diambil dari isyarat-isyarat yang disampaikan anak tunarungu yang bisa diterima sebagai kata atau kosakata dalam Bahasa Indonesia termasuk America Sign Language (ASL) atau Bahasa Isyarat Amerika yang diubah menjadi Bahasa Indonesia[5]. 2.2 Sinyal Ucapan Manusia Proses pembentukan ucapan manusia disebabkan oleh suatu produksi yang dilakukan oleh organ tubuh manusia. Proses tersebut membutuhkan kerja sama organ tubuh manusia sehingga dapat mengeluarkan sinyal ucapan. Dimulai dengan memberikan pesan kepada otak pembicara, lalu pesan tersebut diubah menjadi perintah yang dikirimkan kepada masing masing organ tubuh manusia. Jika diamati sinyal ucapan manusia dapat berubah terhadap waktu. Tetapi karakterisktik sinyal bersifat tetap pada selang waktu (5 sampai 100 mili detik) untuk mengetahui karaterisktik sinyal berubah-ubah dibutuhkan selang waktu lebih panjang [7]. 2.3 Automatic Speech Recognition (ASR) Speech Recognition System atau disingkat ASR adalah suatu sistem yang berfungsi menerjemah suatu bahasa lisan menjadi bentuk data komputer. Sistem ini menggunakan mikrofon untuk menerima informasi lalu membandingkan dengan database yang tersedia. Secara konsepsual sistem ini bekerja dengan mengubah kata-kata menjadi angka-angka yang berbentuk tulisan lalu membandingkan dengan kode yang terdapat pada database untuk melakukan perintah suatu pekerjaan [8]. Pada tugas akhir ini akan dirancang sebuah sistem untuk mengidentifikasi sinyal suara berupa huruf alphabet menggunakan ekstraksi ciri mel frequency cepstral coefficient dan klasifikasi menggunakan Hidden Markov Model. Adapun diagram alir yang akan dirancang dapat dilihat pada Gambar 2.6. Gambar 2.6 Diagram alir sistem ISSN : 2355-9365 e-Proceeding of Engineering : Vol.6, No.1 April 2019 | Page 974 2.4 Mel Frequency Cepstral Coefficient MFCC merupakan cara yang paling sering digunakan pada berbagai bidang ar (...truncated)