Perancangan Dan Analisis Sistem Speech Processing Untuk Tunarungu Menggunakan Metode Hidden Markov Model Dan Mel-frequency Cepstral Coefficients
ISSN : 2355-9365
e-Proceeding of Engineering : Vol.6, No.1 April 2019 | Page 972
PERANCANGAN DAN ANALISIS SISTEM SPEECH PROCESSING UNTUK
TUNARUNGU MENGGUNAKAN METODE HIDDEN MARKOV MODEL DAN MELFREQUENCY CEPSTRAL COEFFICIENT
DESIGN AND ANALYSIS OF SPEECH PROCESSING SYSTEM FOR A DEAF
PERSON USING HIDDEN MARKOV MODEL METHOD AND MEL-FREQUENCY
CEPSTRAL COEFFICIENT
Bagus Robbiyanto1, RaditianaPatmasari2, Rita Magdalena3
123
Prodi S1 Teknik Telekomunikasi, Fakultas Teknik Elektro, Universitas Telkom, Bandung
, ,
1
Abstrak
Mendengar merupakan salah satu cara untuk saling berkomunikasi, mendengar sangat dibutuhkan oleh
manuasia untuk mengerti maksud satu sama lain. Namun hal ini membatasi untuk orang normal berkomunikasi
dengan tunarungu, karena tidak semua orang mengerti gerakan Bahasa isyarat.
Pada Tugas Akhir ini membuat dibuat suatu alat untuk membantu orang normal untuk berkomunikasi
dengan orang yang menderita tunarungu. Alat ini mengolah sinyal suara input menjadi suatu text menggunakan
metode Mel Frequency Cepstral Coefficient untuk mengekstrasi sinyal suara input dan diklasifikasi menggunakan
metode Hidden Markov Model untuk melihat kemiripan antara sinyal suara yang sudah diekstrasi ciri dengan yang
di database. Jika terdapat suatu kemiripan maka menghasilkan suatu text, kemudian text tersebut diolah menjadi
suatu input baru yang menampilkan video Bahasa Isyarat Indonesia.
Hasil pengujian menunjukkan bahwa kombinasi metode mel frequency cepstral coefficient dan Hidden
Markov Model mampu mengenali sinyal suara berupa kata dengan akurasi tertinggi mencapai 87%.
Kata Kunci: Bahasa Isyarat indonesia, Tunarungu, MFFC, HMM.
Abstract
Hearing is one way to communicate with each other, hearing is needed by manuasia to understand each
other's intentions. But this limits the normal person communicating with the deaf, because not everyone
understands Sign Language.
In this Final Project, a tool is created to help normal people communicate with people who are deaf.
This tool processes the input sound signal into a text using the Mel Frequency Cepstral Coefficient method to
extract input sound signals and is classified using the Hidden Markov Model method to see the similarity between
the sound signals that have been extracted and those in the database. If there is a similarity then it produces a text,
then the text is processed into a new input that displays Indonesian Sign Language videos.
The test results showed that the combination of the mel frequency cepstral coefficient method and the
Hidden Markov Model were able to recognize sound signals in the form of words with the highest accuracy
reaching 87%.
Keywords: Indonesian Sign Language, Deaf Person, speech processing, MFCC, HMM.
1. Pendahuluan
1.1 Latar Belakang Masalah
Tunarungu (a deaf sperson) adalah orang yang mengalami ketidakmampuan mendengar, sehingga
mengalami hambatan dalam memproses informasi bahasa melalui pendengarannya dengan atau tanpa
menggunakan alat bantu dengar (hearing aid) [1].
Komunikasi dibagi menjadi 2 jenis yaitu komunikasi verbal dan non verbal. Komunikasi verbal yaitu
komunikasi yang disampaikan secara tertulis atau berbicara dan komunikasi non verbal yaitu komunikasi yang
tidak menggunakan kata-kata [2].
Bahasa isyarat unik dalam jenisnya di setiap negara. Bahasa isyarat bisa saja berbeda di negara-negara yang
berbahasa sama. Untuk Indonesia, sistem yang sekarang umum digunakan adalah Sistem Isyarat Bahasa Indonesia
(BISINDO) yang sama dengan bahasa isyarat America (ASL -American Sign Language). Sistem Isyarat Bahasa
Indonesia (BISINDO) yang baku merupakan salah satu media bantu tuna wicara dalam bermasyarakat. Wujudnya
adalah tatanan sistematis tentang seperangkat isyarat jari, tangan, dan berbagai gerak yang melambangkan kosakata
Bahasa Indonesia [3].
Pada penelitian sebelumnya [4] sudah dilakukan penelitian yang berjudul “Design Implementasi Voice
Command” menggunakan metode MFCC dan HMM dengan akurasi yang didapatkan 93,89% pada lingkungan
ISSN : 2355-9365
e-Proceeding of Engineering : Vol.6, No.1 April 2019 | Page 973
tanpa noise dan 58,1% pada lingkungan noise. Namun pada penelitian sebelumnya hanya dilakukan pengolahan
suara yang di proses lalu menghasilkan kata.
Pada penelitian ini akan dibuat sebuah sistem yang akan membantu orang normal agar bisa berkomunikasi
dengan tunarungu melalui sebuah video gerakan bahasa isyarat. Input dari sistem ini berupa sinyal suara yang di
proses menggunakan metode Hidden Markov Model dan ekstrasi ciri Mel-Frequency Cepstral Coefficient Sehingga
menghasilkan kata selanjutnya kata tersebut dijadikan input untuk memanggil output video gerakan bahasa isyarat.
2. Dasar Teori
2.1 Bahasa Isyarat Indonesia (BISINDO)
Bahasa isyarat pada dasarnya sama dengan bahasa lisan akan tetapi cara penyampaiannya yang tidak sama,
bahasa isyarat menggunakan tangan dan bahasa lisan menggunakan mulut. Sebelumnya bahasa isyarat tidak
mendapat tempat dimasyarakat pengguna Bahasa Indonesia, sehingga bahasa isyarat menjadi tidak jelas dan tidak
menentu.
Bahasa Isyarat Indonesia adalah isyarat-isyarat kata yang pada mulanya diambil dari isyarat-isyarat yang
disampaikan anak tunarungu yang bisa diterima sebagai kata atau kosakata dalam Bahasa Indonesia termasuk
America Sign Language (ASL) atau Bahasa Isyarat Amerika yang diubah menjadi Bahasa Indonesia[5].
2.2 Sinyal Ucapan Manusia
Proses pembentukan ucapan manusia disebabkan oleh suatu produksi yang dilakukan oleh organ tubuh
manusia. Proses tersebut membutuhkan kerja sama organ tubuh manusia sehingga dapat mengeluarkan sinyal
ucapan. Dimulai dengan memberikan pesan kepada otak pembicara, lalu pesan tersebut diubah menjadi perintah
yang dikirimkan kepada masing masing organ tubuh manusia. Jika diamati sinyal ucapan manusia dapat berubah
terhadap waktu. Tetapi karakterisktik sinyal bersifat tetap pada selang waktu (5 sampai 100 mili detik) untuk
mengetahui karaterisktik sinyal berubah-ubah dibutuhkan selang waktu lebih panjang [7].
2.3 Automatic Speech Recognition (ASR)
Speech Recognition System atau disingkat ASR adalah suatu sistem yang berfungsi menerjemah suatu
bahasa lisan menjadi bentuk data komputer. Sistem ini menggunakan mikrofon untuk menerima informasi lalu
membandingkan dengan database yang tersedia.
Secara konsepsual sistem ini bekerja dengan mengubah kata-kata menjadi angka-angka yang berbentuk
tulisan lalu membandingkan dengan kode yang terdapat pada database untuk melakukan perintah suatu pekerjaan
[8].
Pada tugas akhir ini akan dirancang sebuah sistem untuk mengidentifikasi sinyal suara berupa huruf
alphabet menggunakan ekstraksi ciri mel frequency cepstral coefficient dan klasifikasi menggunakan Hidden
Markov Model. Adapun diagram alir yang akan dirancang dapat dilihat pada Gambar 2.6.
Gambar 2.6 Diagram alir sistem
ISSN : 2355-9365
e-Proceeding of Engineering : Vol.6, No.1 April 2019 | Page 974
2.4 Mel Frequency Cepstral Coefficient
MFCC merupakan cara yang paling sering digunakan pada berbagai bidang ar (...truncated)