Pengertian Speech Recognition, Sejarah, Kelebihan, Jenis, Proses Kerja dan Penerapannya

Berikut adalah pengertian speech recognition, sejarah, kelebihan, jenis, proses kerja dan penerapannya

A. PENGERTIAN
Speech Recognition atau yang biasa dikenal dengan automatic speech recognition (ASR) adalah teknik dan sistem yang memungkinkan komputer menerima informasi dalam bentuk kata-kata yang diucapkan.

B. SEJARAH DAN PERKEMBANGAN SPEECH RECOGNITION
Sejarah perkembangan speech recognition dimulai pada tahun 1952 dengan ditemukannya Audrey (automatic digit recognizer) oleh Bell Laboratories, yang dapat mengenali suara angka. Namun pada tahun 1962 teknologi shoebox dikembangkan, dimana teknologi tersebut dapat memahami 16 kata,9 konsonan dan 4 vokal dalam bahasa Inggris. 

Kemudian, pada tahun 1970-an, Departemen Pertahanan AS memberikan kontribusi yang signifikan terhadap pengembangan speech recognition dengan program DARPA SUR (Speech Comprehension Research), yang menghasilkan sistem yang dapat memahami 1011 kata dan frasa logis dalam bahasa Inggris.

Terobosan lain pada 1980-an adalah pengembangan Model Hidden Markov, yang menggunakan statistik untuk menentukan probabilitas bahwa sebuah kata akan berasal dari suara yang tidak diketahui. Sistem itu dibawa ke dalam boneka untuk anak-anak bernama Julie. Boneka dilatih dalam kemampuan merespon bahasa, tetapi masih ada kelemahan yang menghentikan kata yang diucapkan.

Kemudian, pada 1990-an, perusahaan bernama DRAGON merilis speech recognition software pertama di dunia yang disebut Dragon Naturally Speaking, yang memungkinkan kita berbicara 100 kata dalam 1 menit. 

Sedangkan pada tahun 2000-an hingga saat ini, perkembangan speech recognition dengan dukungan teknologi canggih terus berlanjut. Salah satu aplikasi speech recognition yang dikenal saat ini adalah munculnya aplikasi pencarian suara Google yang diluncurkan oleh Google.

C. KELEBIHAN SPEECH RECOGNITION
Beberapa kelebihan teknologi Speech Recognition, diantaranya:
  1. Memungkinkan perangkat untuk mengenali dan memahami kata-kata yang diucapkan dengan mendigitalkan kata-kata dan mencocokkan sinyal digital dengan pola tertentu yang tersimpan dalam perangkat
  2. Mengubah kata yang diucapkan menjadi sinyal digital dengan mengubah gelombang suara menjadi serangkaian angka, yang kemudian diberi kode khusus untuk mengidentifikasi kata-kata tersebut
  3. Hasil identifikasi kata-kata yang diucapkan dapat ditampilkan dalam bentuk tulisan atau dibaca oleh perangkat teknis sebagai perintah untuk menyelesaikan suatu tugas, misalnya menekan tombol pada ponsel, yang dilakukan secara otomatis dengan perintah suara.

D. JENIS-JENIS SPEECH RECOGNITION
Ada 5 jenis pengenalan kata berdasarkan kemampuan dalam mengenal kata yang diucapkan, yaitu:
  1. Kata-kata yang terisolasi: Proses mengidentifikasi kata-kata yang hanya dapat mengenali kata yang diucapkan ketika kata tersebut memiliki jarak waktu antar kata.
  2. Kata-kata yang berhubungan: Proses pengidentifikasian kata yang mirip dengan kata-kata terisolasi, namun membutuhkan jeda waktu pengucapan antar kata yang lebih singkat
  3. Kata-kata yang berkelanjutan: Proses pengidentifikasian kata yang sudah lebih maju karena dapat mengenali kata-kata yang diucapkan terus menerus dengan sedikit atau tanpa jeda. Proses pengenalan ucapan ini sangat rumit karena memerlukan metode khusus untuk membedakan kata-kata yang diucapkan tanpa jeda waktu. Pengguna perangkat ini dapat mengucapkan kata-kata secara natural
  4. Kata-kata spontan: Proses pengidentifikasian kata yang dapat mengenal kata-kata yang diucapkan secara spontan tanpa jeda waktu antar kata
  5. Verifikasi atau identifikasi suara: Proses pengidentifikasian kata yang tidak hanya mampu mengenal kata, namun juga mengidentifikasi siapa yang berbicara.

E. PROSES KERJA ALAT SPEECH RECOGNITION
Dalam proses kerjanya, alat Speech Recognition atau alat pengenal ucapan memiliki empat tahapan, yaitu:
  1. Tahap penerimaan masukan, yakni sumber suara diterima melalui media perantara.
  2. Tahap ekstraksi, yakni penyimpanaan masukan yang berupa suara dan sekaligus pembuatan basis data sebagai pola.
  3. Tahap pembandingan, yakni pencocokan data baru dengan data suara (pencocokan tata bahasa) pada pola. Tahap ini dimulai dengan proses konversi sinyal suara digital hasil dari proses ekstraksi ke dalam bentuk spektrum suara yang akan dianalisa dengan membandingkannya dengan pola suara pada basis data.
  4. Tahap validasi identitas pengguna, yakni sistem verifikasi/identifikasi suara akan melakukan identifikasi orang yang berbicara berdasarkan kata yang diucapkan setelah menerjemahkan suara tersebut menjadi tulisan atau komando.

F. PENERAPAN SPEECH RECOGNITION
1. Bidang komunikasi
  • Komando Suara, suatu program pada komputer yang melakukan perintah berdasarkan komando suara dari pengguna. Contohnya pada aplikasi Microsoft Voice yang berbasis bahasa Inggris. Ketika pengguna mengatakan “Mulai kalkulator” dengan intonasi dan tata bahasa yang sesuai, komputer akan segera membuka aplikasi kalkulator. Jika komando suara yang diberikan sesuai dengan daftar perintah yang tersedia, aplikasi akan memastikan komando suara dengan menampilkan tulisan “Apakah Anda meminta saya untuk ‘mulai kalkulator’?”. Untuk melakukan verifikasi, pengguna cukup mengatakan “Lakukan” dan komputer akan langsung beroperasi.
  • Pendiktean, sebuah proses mendikte yang sekarang ini banyak dimanfaatkan dalam pembuatan laporan atau penelitian. Contohnya pada aplikasi Microsoft Dictation yang merupakan aplikasi yang dapat menuliskan apa yang diucapkan oleh pengguna secara otomatis.
2. Bidang kesehatan
Alat pengenal ucapan banyak digunakan dalam bidang kesehatan untuk membantu para penyandang cacat dalam beraktivitas. Contohnya pada aplikasi Antarmuka Suara Pengguna atau Voice User Interface (VUI) yang menggunakan teknologi pengenal ucapan dimana pengendalian saklar lampu misalnya, tidak perlu dilakukan secara manual dengan menggerakkan saklar tetapi cukup dengan mengeluarkan perintah dalam bentuk ucapan sebagai saklarnya.

Metode ini membantu manusia yang secara fisik tidak dapat menggerakkan saklar karena cacat pada tangan misalnya. Penerapan VUI ini tidak hanya untuk lampu saja tapi bisa juga untuk aplikasi-aplikasi kontrol yang lain.

3. Bidang militer
Pelatihan Penerbangan, Aplikasi alat pengenal ucapan dalam bidang militer adalah pada pengatur lalulintas udara atau yang dikenal dengan Air Traffic Controllers (ATC) yang dipakai radar, cuaca, dan navigasi. Alat pengenal ucapan digunakan sebagai pengganti operator yang memberikan informasi kepada pilot dengan cara berdialog.

Komentar