Terjemahan mesin

Terjemahan Mesin (Machine translation) (MT) adalah proses mengalihbahasa atau terjemahan automatik daripada satu bahasa kepada bahasa lain yang dilakukan oleh komputer. Proses terjemahan automatik daripada satu bahasa kepada bahasa lain merupakan salah satu matlamat terawal dalam Sains Komputer. Bagaimanapun, terjemahan mesin terbukti sebagai satu matlamat yang sukar dicapai. Pada hari ini terdapat beberapa sistem terjemahan mesin yang mampu menghasilkan hasil terjemahan yang mana, sungguhpun tidak sempurna, tetapi adalah cukup berkualiti untuk digunakan dalam beberapa dari bidang, dan sebagai alat untuk membantu penterjemah manusia.

Pengenalan[sunting | sunting sumber]

Penterjemahan adalah lebih sukar daripada apa yang disangkakan. Penterjemahan bukan sekadar menggantikan perkataan dengan perkataan yang lain, tetapi mampu untuk mengetahui "semua perkataan" dalam satu ayat diberi atau rangkai kata dan bagaimana setiap satunya akan mempengaruhi yang lain. Bahasa manusia terdiri dari morfologi (bagaimana ayat di bina daripada makna perkataan), sintaksis (struktur ayat), dan semantik (erti perkataan). Ayat yang mudahpun boleh dipenuhi dengan kekaburan.

Pendekatan lingustik[sunting | sunting sumber]

Ia sering dipertikaikan bahawa masalah mengenai terjemahan menggunakan mesin memerlukan masalah kefahaman bahasa semulajadi diselesaikan dahulu. Bagaimanapun, beberapa kaedah {heuristik} dari terjemahan mesin menghasilkan keputusan yang agak baik, termasuk :-

Kaedah rujuk leksikon
Kaedah asas nahu/tatabahasa
Kaedah asas Semantik, (Terjemahan Mesin berasaskan pengetahuan)
Kaedah Statistik
Kaedah berasaskan contoh

Secara umumnya, kaedah berasaskan peraturan (cara tiga yang pertama) akan memproses teks, dan biasanya membentuk wakil perantaraan simbolik, dari yang mana ia akan menghasilkan teks di dalam bahasa sasaran. Pendekatan ini memerlukan leksikon menyeluruh dengan morphologi, maklumat sintatik, dan semantik, dan set peraturan yang besar.

Kaedah berasaskan statistik (dua yang akhir) meninggalkan pembinaan leksikon secara manual dan menulis peraturan dan sebaliknya cuba untuk menjanakan penterjemahan berdasarkan kepada Dwibahasa korpus teks, seperti korpus Hansard Kanada, rekod bahasa Inggeris & Perancis mengenai parlimen Kanada. Apabila terdapat korpora sebegitu, keputusan menakjubkan dicapai oleh penterjemahan teks yang serupa, tetapi korpora sebegitu amat jarang.

Dengan maklumat mencukupi, kebanyakan perisian Terjemahan Mesin cukup baik untuk mereka yang bertutur dalam bahasa yang berlainan untuk mengagak apakah yang dikatakan oleh pihak yang sebaliknya. Kesulitannya adalah mendapat cukup maklumat daripada bentuk yang bersesuaian untuk menyokong kaedah khusus. Comtohnya, korpus besar maklumat pelbagai bahasa diperlukan untuk fungsi kaedah statistik tetapi tidak diperlukan untuk kaedah berasaskan nahu (grammar). Tetapi, kaedah nahu memerlukan pakar bahasa yang mahir untuk mereka dengan berhati-hati, bentuk nahu yang mereka guna.

Pengguna[sunting | sunting sumber]

Di sebalik keupayaan mereka yang terhad, perisian Terjemahan Mesin pada masa ini digunakan oleh pelbagai pertubuhan seluruh dunia. Barangkali institusi pengguna terbesar adalah Komision Eropah, yang menggunakan versi Terjemahan Mesin SYSTRAN yang diubah suai untuk menangani terjemahan automatik secara besar-besaran draf dokumen untuk kegunaan dalaman.