eSpeak

Daripada Wikipedia, ensiklopedia bebas.
Lompat ke: pandu arah, cari
eSpeak
Pembangun Jonathan Duddington
Keluaran pertama Februari 2006
Keluaran stabil 1.47.11 / Mei 4, 2013; 18 bulan yang lalu (2013-05-04)
Ditulis dalam C
Sistem pengendalian Linux
Windows
Mac OS X
RISC OS
FreeBSD
Windows Mobile
Saiz ~1600 kbyte
Jenis Pensintesis pertuturan
Lesen GNU GPL v3+
Tapak web http://espeak.sourceforge.net/

eSpeak ialah sebuah perisian pensintesis pertuturan sumber terbuka padat untuk platform-platform Linux, Windows, dan platform-platform lain.[1] eSpeak menggunakan kaedah sintesis forman, dan dapat membekalkan banyak bahasa dalam saiz perisian yang kecil. Banyak pengatircaraan bahsa-bahasa eSpeak berlandaskan maklumat yang terkandung dalam Wikipedia, serta maklum balas daripada penutur asli.[2] Projek-projek yang menggunakan eSpeak termasuk NVDA, Ubuntu dan OLPC; ia juga digunakan oleh Google Translate.

Sejarah[sunting | sunting sumber]

eSpeak diperoleh daripada pensintesis pertuturan "Speak" untuk bahasa Inggeris British buat komputer-komputer Acorn RISC OS, dan asalnya ditulis pada tahun 1995 oleh Jonathan Duddington.

Sebuah versi yang ditulis semula untuk Linux muncul pada Februari 2006 dan versi Windows SAPI 5 pula muncul pada Januari 2007. Pembangunan seterusnya telah memperbaiki sokongan buat bahasa-bahasa tambahan.

Mutu suara bagi bahasa-bahasa tidak sama. Sebilangan bahasa telah dihasilkan dengan bantuan penutur asli berbanding yang lain. Kebanyakan orang yang membantu memperbaiki bahasa-bahasa eSpeak terdiri daripada pengguna cacat kelihatan yang menggunakan perisian "teks-ke-pertuturan" atau TTS.

Kaedah sintesis[sunting | sunting sumber]

Sampel output eSpeak dalam bahasa Melayu

eSpeak menyediakan dua kaedah sintesis: pensintesis eSpeak asal dan pensintesis Klatt.[3] Tambahan, eSpeak dapat digunakan sebagai perisian bahagian depan yang menyediakan terjemahan teks ke fonem dan prosodi untuk suara difon MBROLA.

Pensintesis eSpeak dan Klatt menggunakan sintesis forman yang berbeza.

Pensintesis eSpeak menjana bunyi suara pertuturan seperti vokal dan konsonan bergema dengan menambah gelombang sinus bagi menghasilkan puncak-puncak forman. Konsonan-konsonan yang tidak bersuara (seperti /s/) dibuat dengan memainkan bunyi yang terakam. Konsonan bersuara seperti /z/ dibuat dengan mencampurkan bunyi suara sintesis dengan bunyi tak bersuara terakam.

Pensintesis Klatt kebanyakannya menggunakan data forman yang sama dengan pensintesis eSpeak. Ia menghasilkan bunyi bersuara dengan bermula dengan bentuk gelombang yang kaya dengan harmonik (meniru getaran pita suara) dan kemudiannya mengenakan penapis digital bagi menghasilkan bunyi-bunyi pertuturan.

Ciri-ciri[sunting | sunting sumber]

eSpeak dapat digunakan sebagai perisian baris perintah, ataupun sebagai pustaka (perisian).

eSpeak menyokong bahasa penanda Speech Synthesis Markup Language (SSML).

Suara-suara bahasa dikenali dengan kod ISO 639-1 bahasa. Ini dapat diubah dengan "varian suara". Ini pula ialah fail-fail teks yang dapat mengubah ciri seperti julat pic, menambah kesan seperti gema, bisikan dan suara serak, ataupun membuat pengubahan sistematik terhadap bunyi suara. Sebagai contoh, "af" ialah suara bahasa Afrikaans. "af+f2" pula ialah suara Afrikaans yang diubah dengan varian atau kelainan suara "f2" yang mengubah forman dan julat pic bagi menghasilkan suara perempuan.

eSpeak menggunakan perwakilan ASCII buat nama-nama fonem yang secara longgarnya berlandaskan sistem Kirshenbaum.

Perwakilan fonetik boleh disertakan dalam input teks dengan meletakkannya dalam dua tanda kurung siku. Contoh (untuk kegunaan baris perintah): espeak "Hello [[dUniV]]" akan menyuarakan "Hello dunia" dalam Bahasa Melayu.

Rujukan[sunting | sunting sumber]

  1. http://espeak.sourceforge.net/download.html mempunyai dedua-dedua buat Mac OS X dan RISC OS, dan sumber memuatkan panduan bagi pengkompilan untuk DOS, Unix generik dan Windows Mobile.]
  2. http://espeak.sourceforge.net/add_language.html
  3. Dennis H. Klatt (1979). "Software for a cascade/parallel formant synthesizer". J. Acoustical Society of America, 67(3) March 1980. 

Pautan luar[sunting | sunting sumber]