Unicode: Perbezaan antara semakan

Daripada Wikipedia, ensiklopedia bebas.
Kandungan dihapus Kandungan ditambah
Tiada ringkasan suntingan
Teg-teg: Dibalikkan Suntingan mudah alih Suntingan web mudah alih
Tiada ringkasan suntingan
Teg-teg: Dibalikkan Suntingan mudah alih Suntingan web mudah alih
Baris 1: Baris 1:
== Asal-usul dan pembangunan ==

Unicode jelasnya bertujuan mencecah had-had [[pengekodan aksara]] tradisional, seperti yang didefinasikan dalam piawaian [[ISO 8859]] yang didapati luas penggunaannya di pelbagai negaa di dunia tetapi masih amat tidak serasi dengan satu sama lain. Kebanyakan pengekodan aksara tradisional berkongsi satu masalah utama yang mana pemprosesan komputer dwibahasa dibenarkan (lazimnya menggunakan [[huruf rumi]] dan bahasa tempatan) tetapi tidak pula pemprosesan komputer berbilang bahasa (pemprosesan komputer sembarangan bahasa yang dicampur aduk dengan satu sama lain).

Unicode diniatkan untuk mengekod [[aksara]] asasnya — [[grafem]] dan unit seakan-akan grafem — dan bukannya pelbagai [[glif]] (pengemukaan) bagi aksara sedemikian. Mengenai [[aksara Cina]], kadang-kadang ini menyebabkan kontroversi mengenai membezakan aksara asas dari pelbagai glifnya (lihat [[penyatuan Han]]).

Dalam pemprosesan teks, Unicode memainkan peranan membekalkan '''titik kod''' (''code point'') yang unik — nombor, bukan glif — bagi setiap satu aksara. dalam erti kata lain, Unicode melambangkan sesuatu aksara secara abstrak lalu menyerahkan pengemukaan visual (saiz, bentuk, [[fon]] atau gaya) kepada perisian lain, seperti [[pelayar web]] atau [[pemproses kata]]. Namun begitu, sasaran mudah ini bertambah rumit akibat konsesi yang dilakukan oleh pereka-pereka Unicode dengan harapan mempercepatkan pengambilan Unicode.

256 titik kod yang pertama dijadikan seiras kepada kandungan [[ISO 8859-1]] agar menjadikannya tidak penting untuk menukarkan teks Barat yang sedia ada. Banyak aksara yang seiras secara pokoknya telah dikodkan banyak kali di titik kod berbeza untuk mengekalkan pembezaan yang dipakai oleh pengekodan terdahulu, maka membenarkan penukaran dari pengekodan tersebut ke Unicode secara ulang alik tanpa keciciran apa-apa maklumat. Contohnya, seksyen titik kod "[[bentuk lebar penuh]]" merangkumi abjad rumi penuh yang berasingan daripada seksyen abjad rumi utama. Dalam fon bahasa Cina, Jepun dan Korea ([[CJK]]), aksara-aksara ini dikemukakan pada lebar yang sama seperti [[ideograf]] CJK dan bukannya separuh lebar. Bagi contoh lain, lihat [[Aksara pendua di Unicode]].

Selain itu, sementara membolehkan [[penggabungan aksara]] Unicode juga mengandungi versi [[aksara pragubah|pragubah]] bagi kebanyakan kombinasi huruf/diakritik dalam kegunaan seharian. ini memudahkan lagi penukaran ulang alik dari pengekodan terdahulu serta membolehkan aplikasi untuk menggunakan Unicode sebagai format teks dalaman tanpa perlu melaksanakan aksara gabungan. Contohnya ''é'' boleh diwakili di Unicode sebagai U+0065 (''Latin small letter e'') diikuti U+0301 (''combining acute'') tetapi boleh juga diwakili dengan aksara pragubah U+00E9 (''Latin small letter e with acute'').

Piawaian Unicode juga merangkumi sebilangan butiran berkaitan, seperti ciri-ciri aksara, penyeragaman bentuk teks dan susunan paparan dwiarah (bagi pemaparan sempurna bagi teks yang mengandungi kedua-dua skrip kanan-ke-kiri, seperti [[bahasa Arab]] atau [[bahasa Ibrani|Ibrani]], serta skrip kiri-ke-kanan).

== Skrip-skrip yang diliputi ==
== Skrip-skrip yang diliputi ==



Semakan pada 18:44, 10 September 2021

Skrip-skrip yang diliputi

Unicode meliputi hampir kesemua (sistem tulisan) yang dipakai pada zaman sekarang, termasuk:

Unicode telah menambah skrip-skrip selanjutnya dan akan meliputi banyak lagi, termasuk skrip-skrip bersejarah yang kurang diamalkan pada masa sekarang1 serta juga bahasa pupus bagi kegunaan akademik:

Rujukan

Pautan luar