Metadata

Daripada Wikipedia, ensiklopedia bebas.
Lompat ke: pandu arah, cari

Metadata (meta data atau juga dikenali sebagai metainformasi) merupakan "data berkaitan data", dalam semua jenis media. Sebuah butiran metadata mungkin menerangkan suatu data tunggal (datum), atau butiran kandungan, mahupun satu koleksi data termasuklah pelbagai butiran kandungan, sebagai contoh sebuah skema pangkalan data.


Istilah metadata merupakan istilah kabur yang digunakan bagi dua asas konsep yang berbeza (jenis). Sungguhpun gambaran "data mengenai data" sering digunakan, ia tidak boleh digunakan pada keduanya dalam cara yang sama. Metadata struktur, reka bentuk dan spesifikasi bagi struktur data, tidak boleh mengenai data, kerana ketika masa reka bentuk applikasi tidak memiliki data. Dalam kes ini gambaran tepat adalah mengenai "data mengenai bekas data". Metadata gambaran, sebaliknya, adalah mengenai individual data applikasi, kandungan data. Dalam kes ini, gambaran berguna (menghasilkan neologism kabur) adala "data mengenai kandungan data" atau "kandunganmengenai kandungan" dengan itu Rangka Kerja Kandungan Meta ("Meta Content Framework"). Gambaran, Panduan dan konsep Organisasi Piwaian Maklumat Kebangsaan ("National Information Standards Organization") bagi pentakbiran metadata adalah kesemua jenis kecil "metacontent" ("kandungan meta").

Metadata ("kandungan meta") secara tradisi dijumpai dalam katalog kad perpustakaan. Ketika maklumat menjadi semakin digital, metadata turut digunakan bagi menggambarkan data digital dengan menggunakan piwaian metadata khusus kepada bidang tertentu. Dengan menggambarkan kandungan dan konteks bagi fail komputer, kualiti data/fail asal dipertingkatkan dengan banyaknya. Sebagai contoh, tapak web mungkin termasuk metadata menyatakan bahasa apa yang digunakan bagi menulisnya, peralatan apa yang digunakan bagi menciptanya, dan di mana perlu pergi bagi lebih perincian mengenai subjek, membenarkan pelayar secara automatik meningkatkan pengalaman pengguna.

Takrifan[sunting | sunting sumber]

Metadata (metacontent) ditakrifkan sebagai data membekalkan maklumat mengenai satu atau lebih aspek mengenai data, seperti:

  • Cara penciptaan data
  • Tujuan data
  • Mada dan tarikah penciptaan data
  • Pencipta atau pengarang data
  • Tempat pada Rangkaian komputer di mana data dicipta
  • Piwaian teknikal digunakan
  • Maklumat asas mengenai sesuatu muzik

Sebagai contoh. gambar digital mungkin termasuk metadata yang menggambarkan bera[a besar gambar itu, kedalaman warna, resolusi gambar, bila gambar dicipta, dan data lain. Dokumen teks metadata mungkin mengandungi maklumat mengenai berapa panjang dokumen itu, siapa penulisnya, bila ia ditulis, dan ringkasan mengenai dokumen.

Metadata adalah data. Oleh itu, metadata boleh disimpan dan diurus dalam pangkalan data, sering kali dikenali sebagai daftar atau repositori.[1] Bagaimanapun, adalah mustahil bagi mengenal pasti metadata hanya sekadar melihatnya kerana pengguna tidak tahu bila data adalah metadata atau hanya sebagai data.[2]

Perpustakaan[sunting | sunting sumber]

Metadata telah digunakan dalam pelbagai bentuk sebagai cara mengkatalog maklumat arkib. Sistem Perduaan Dewey yang digunakan oleh perpustakaan bagi pengelasan bahan perpustakaan merupakan kegunaan metadata terawal. Katalog perpustakaan menggunakan kad index 3x5 inci bagi memaparkan judul buku, pengarang, subject matter, an ringkasan plot ringkas bersama sistem pengenalan ringkasan alphanumerik yang menunjukan lokasi fizikla buku di rak perpustakaan.

Data sebegitu membantu pengelasan, pembahagian, mengenalpasti, dan lokasi buku tertentu. Satu lagi bentuk himpunan metadata lebih tua digunakan oleh Bureau Census Amerika Syarikat dalam apa yang dikenali sebagai "Borang Panjang." Borang Panjang mengandungi soalan yang digunakan bagi mencipta data demografik bagi mencipta pola dan mengenal pasti pola taburan. [3] Istilah ini dicipta pada tahun 1968 oleh Philip Bagley, sala seorang perintis bagi capaian maklumat berkomputer.[4][5] Sejak itu bidang pengurusan maklumat, sains maklumat, teknologi maklumat, perpustakawan dan GIS telah menerima istilah itu secara meluas. Dalam bidang ini, perkataan metadata ditakrifkan sebagai "data mengenai data".[6] Sungguhpun ini merupakan takrifan yang diterima umum, pelbagai bidang telah mengambil penjelasan lebih khusus mereka sendiri dan pengunaan istilah mereka sendiri.

Bagi tujuan rencana ini, "objek" merujuk kepada sebarang yang berikut:

  • Barangan fizikal seperti buku, CD, DVD, peta, kerusi, bunga, pasu bunga, dll.
  • Fail eletronik seperti gambar digital, foto digital, dokumen, fail aturcara, jadual pangkalan data, dll.

Foto[sunting | sunting sumber]

Metadata boleh dimasukkan kedalam fail foto digital yang akan mengenal pasti pemiliknya, maklumat hakcipta dan perhubungan, kamera yang mencipta fail, bersama maklumat dedahan dan maklumat gambaran seperti kata kunci mengenai foto, membolehkan fail dicari di komputer dan/atau di Internet. Sesetengah metadata ditulis oleh kamera dan sesetengah dimasukkan oleh jurufoto dan/atau perisian selepas muat turun ke komputer.

Photographic Metadata Standards ditadbir oleh organisasi yang mengembangkan piwaian berikut. Ia termasuk, tetapi tidak terhad kepada:

  • IPTC Information Interchange Model IIM (International Press Telecommunications Council),
  • Skema teras IPTC (“IPTC Core Schema” bagi XMP
  • XMP – Extensible Metadata Platform (an Adobe standard)
  • Exif – Exchangeable image file format, Maintained by CIPA (Camera & Imaging Products Association) and published by JEITA (Japan Electronics and Information Technology Industries Association)
  • Dublin Core (Dublin Core Metadata Initiative – DCMI)
  • PLUS (Picture Licensing Universal System).

Video[sunting | sunting sumber]

Metadata amat berguna bagi video,di mana maklumat mengenai kandungannya (seperti transkrip perbualan, dan gambaran teks kandungannya) tidak difahami secara langsung oleh komputer, tetapi di mana carian berkesan diingini.

Laman Web[sunting | sunting sumber]

Laman Web sering kali memasukkan metadata dalam bentuk tag unsur Meta. Gambaran dan tag kata kunci biasanya digunakan bagi menggambarkan kandungan laman Web. Kebanyakan enjin gelintar menggunakan data ini apabila menambah laman pada indek gelintar mereka.

Penciptaan metadata[sunting | sunting sumber]

Metadata boleh dicipta samaada secara pemprosesan maklumat secara automatik atau melalui kerja manual. Unsur metadata dimasukkan kedalam komputer boleh termasuk maklumat mengenai bila fail dicipta, siapa penciptanya, bila ia dikemas kini, saiz fail dan sambungan fail.

Jenis Metadata[sunting | sunting sumber]

Applikasi metadata merupakan bidang yang luas merangkumi jumlah besar bidang aplikasi yang tiada apa khusus dan model yang diterima ramai bagi jenis khusus metadata. Bretheron & Singley (1994) membezakan antara dua kelas berbeza: metadata struktur/kawal dan metadata panduan.[7] Metadata struktur digunakan bagi menggambarkan struktur sistem komputer seperti meja, lajur dan index. Metadata panduan digunakan bagi membantu manusia menjumpai barangan khusus dan biasanya digambarkan sebagai satu set katakunci dalam bahasa semulajadi. Menurut Ralph Kimball, metadata boleh dibahagi kepada 2 kategori yang sama —Metadata teknikal dan metadata niaga. Metadata teknikal bersamaan dengan metadata dalaman, Metadata niaga bagi metadata luaran. Kimball menambah kategori ketiga iaitu Metadata procses. Disebaliknya, NISO membezakan antara tiga jenis metadata gambaran, struktur dan pentadbir.[6] Metadata gambaran adalah maklumat yang digunakan bagi mencari dan menjumpai objek seperti judul, pengarang, subjek, katakunci, penerbit; “Metadata struktur” memberikan gambaran bagaimana komponen maklumat diatur; dan Metadata pentadbir merujuk kepada maklumat teknikal termasuk jenis fail. Dua jenis-kecil (”sub-type”) metadata pentadbir adalah metadata pengurusan hak dan metadata pengekalan.

Struktur Metadata[sunting | sunting sumber]

Metadata (metacontent), atau lebih tepat lagi, perbendaharaan kata yang digunakan bagi menghimpun kenyataan metadata (metacontent), biasanya distruktur menurut konsep piwaian menggunakan skim metadata yang ditetapkan dengan baik, termasuk: piawaian metadata dan model metadata. Peralatan seperti perbendaharaan terkawal, Taksonomi, thesauri, Kamus Data dan Daftar Metadata boleh digunakan bagi menggunakan piwaian lanjut pada metadata.

Sintak Metadata[sunting | sunting sumber]

Sintak Metadata (metacontent) merujuk kepada aturan yang dicipta bagi membina medan atau unsur metadata (metacontent).[8] Skema metadata tunggal boleh digambarkan menggunakan sejumlah bahasa pengaturcaraan atau markup, setiap satu memerlukan sintek berlainan. Sebagai contoh, Teras Dublin (“Dublin Core”) boleh digambarkan dalam teks biasa, HTML, XML dan RDF.[9]

Contoh biasa metacontent (panduan) adalah pengelasan bibliografik, subjek, Dewey Decimal class number. Sentiasa terdapat bayangan pernyataan dalam sebarang "pengelasan" objek tertentu. Untuk mengelaskan sesuatu objek, sebagai contoh, nombor kelas Dewey 514 (Topologi) (contoh. Sebuah buku mempunyai nombor ini pada belakangnya) bayangan pernyataan adalah: "<buku><judul subjek ><514>. Ini merupakan tiga subjek-predicate-objek, atau lebih penting, a class-attribute- value triple. Dua unsur pertama bagi bertiga (“triple”) (kelas, atribute) adalah serpihan struktur metadata yang memiliki takrifan sematik. Unsur ketiga adalah nilai, seeloknya dari kosakata terkawal, sesetengah rujukan data (utama). Gabungan unsur data metadata dan utama menhasilkan pernyataan iaitu pernyataan metacontent contoh.. "metacontent = data metadata + data utama". Kesemua unsur ini boleh dianggap sebagai "kosa kata". Kedua-dua metadata dan data utama merupakan kosa kata yang boleh dipasang membentuk kenyataan metacontent. Terdapat banyak sumber bagi kosa kata ini, kedua-dua data meta dan utama: UML, EDIFACT, XSD, Dewey/UDC/LoC, SKOS, ISO-25964, Pantone, Linnaean Binomial Nomenclature etc. Using controlled vocabularies for the components of metacontent statements, whether for indexing or finding, is endorsed by ISO-25964: "Jika kedua-dua pengindex dan pencari dipandu pada istilah yang sama bagi konsep yang sama, dokumen yang berkait akan diambil." Ini adalah berguna apabila dinilai keluasan internet, Google, sekadar mengindex rantaian teks, tidak terdapat kecerdasan atau "rumusan" terjadi.


Hierarki, linear dan skhemata satah[sunting | sunting sumber]

Skim Metadata boleh bertingkat Hierarki secara semulajadi di mana hubungan wujud antara unsur metadata dan unsur yang bersarang agar hubungan bapa-anak wujud antara unsur. Unsur skima metadata Hierarki adalah metadata objek belajar ("IEEE LOM") di mana unsur metadata mungkin milik unsur metadata bapa. Skim Metadata juga boleh diensi tunggal, atau linear, di mana setiap unsur diskrit sepenuhnya unsur lain dan pengelasan menurut satu dimensi sahaja. Satu contoh skim metadata linear adalah skim Dublin Core yang merupakan satu dimensi. Skim Metadata sering kali antara dua dimensi, atau satah, di mana setiap unsur adalah diskrit sepenuhnya dari unsur lain tetapi dikelaskan menurut dimensi dua orthogonal.[10]

Hiperpeta Metadata[sunting | sunting sumber]

Dalam semua kes di mana schemata metadata melampaui gambaran planar, sebahagian jenis hiperpeta diperlukan bagi membolehkan gambaran dan melihat metadata menurut aspek dipilih dan berkhidmat pandangan khas. Hiperpeta sering digunakan bagi melapis maklumat lapisan geografik dan geologi.[11]

Granulariti[sunting | sunting sumber]

Granulariti merupakan istilah yang digunakan pada data dan juga metadata. Tahap mana metadata distruktur dirujuk sebagai granulariti. Metadata dengan granulariti yang tinggi membenarkan bagi maklumat berstruktur lebih dalam dan membolehkan lebih tahap manipulasi teknikal bagaimanapun, tahap granulariti lebih rendah bererti bererti metadata boileh dicipta dengan kos jauh lebih rendah tetapi tanpa maklumat terperinci. Kesan utama granulariti bukan hanya bagi penciptaan dan kemasukan, tetapi lebih lagi bagi kemas kini. Sebaik sahaja struktur metadata menjadi lapuk, capaian kepada data dirujuk akan menjadi lapuk. Dengan itu granulariti akan mengambil kira usaha bagi mencipta dan juga usaha bagi kemas kini.

Metadata Piwaian[sunting | sunting sumber]

Piwaian antarabangsa digunakan bagi metadata. Banyak kerja dicapai dalam masyarakat piwaian kebangsaan dan antarabangsa, terutamanya ANSI (American National Standards Institute) dan ISO (International Organization for Standardization) bagi mencapai persetujuan bagi piwaian metadata dan register.

Piwaian teras adalah ISO/IEC ("International Electrotechnical Commission") 11179-1:2004 [12] dan piwaian berikutnya (lihat ISO/IEC 11179). Semua register belum diterbitkan menurut penutup piwaian ini hanya takrifan metadata dan tidak digunakan bagi penstrukturan penstoran atau pencapaian metadata salah satu dari piwaian pentadbiran. Adalah penting bagi menyedari bahawa piawian ini merujuk kepada metadata sebagai data mengenai bekas data dan bukannya sebagai metadata (metacontent) sebagai data mengenai kandungan data. Ia patut disedari bahawa piwaian ini mengambarkan dirinya pada asalnya sebagai register "unsur data", menggambarkan unsur data terasing, dan secara jelas menafikan keupayaan menyimpan struktur rumit. Denbgan itu istilah asal "unsur data" lebih terpakai berbanding kata popular "metadata" yang digunakan.

Kegunaan Metadata[sunting | sunting sumber]

Data Virtualisasi ("Virtualization Data")[sunting | sunting sumber]

Data Virtualisasi ("Virtualization Data") telah muncul sebagai perisian teknologi baru untuk menyelesaikan timbunan virtualisasi dalam perusahaan itu. Metadata yang digunakan dalam pelayan Data Virtualisasi yang merupakan komponen infrastruktur perusahaan, di sepanjang sisi dengan pangkalan data dan pelayan permohonan. Rencana dalam-pelayan disimpan sebagai repositori berterusan dan menerangkan objek perniagaan dalam sistem aplikasi perusahaan dan pelbagai.

Metadata semakan keluar SVN ("SVN Checkout")[sunting | sunting sumber]

Fail tersembunyi .SVN dicipta pada folder umbi sesawang yang mampu mendedahkan maklumat penting mengenai repisitori kod di umbi.

Khidmat statistik dan sensus[sunting | sunting sumber]

Kerja piwaian memiliki kesan besar pada usaha untuk membina sistem metadata dalam masyarakat statistik. Beberapa metadata piwaian dibincangkan, dan kepentingannya pada agensi statistik dibincangkan. Penggunaan piwaian di Biro Sensus, Agensi Perlindungan Alam Sekitar, Biro Statistik Buruh, Statistik Kanada, dan banyak lagi digambarkan. Penekanan adalah pada kesan metadata daftar yang terdapat di agensi statistik.

Sains Perpustakaan dan maklumat[sunting | sunting sumber]

Perpustakaan menggunakan metadata dalam katalog perpustakaan, paling biasa sebagai sebahagian dari Sistem Pengurusan Perpustakaan Bersepadu. Metadata diperolehi oleh sumber katalog seperti buku, makalah, DVD, laman web, atau imej digital. Data ini disimpan dalam sistem pengurusan perpustakaan bersepadu, ILMS, using the MARC metadata standard. The purpose is to direct patrons to the physical or electronic location of items or areas they seek as well as to provide a description of the item/s in question.

Tambahan lagi, terdapat persoalan mengenai format data: menyimpan metadata dalam format bacaan manusia seperti XML adalah berguna kerana pengguna dapat memahami dan menyuntingnya tanpa peralatan khusus. Sebaliknya, format ini tidak dioptima bagi keupayaan penyimpanan; sebaliknya ia mungkin berguna bagi menyimpan metadata dalam format binari, tidak boleh di baca manusia bagi mempercepatkan pemindahan dan menjimatkan ingatan.

Pengurusan pangkalan data[sunting | sunting sumber]

Setiap sistem pangkalan data hubungan memiliki mekanismanya sendiri bagi menyimpan metadata. Contoh metadata pangkalan data -hubungan termasuk:

  • Jadual bagi semua jadual dalam pangkalan data, nama, saiz dan bilangan baris bagi setiap jadual.
  • Jadual lajur setiap pangkalan data, jadual yang digunakan, dan jenis data disimpan dalam setiap lajur.

Dalam terminologi pangkalan data, set metadata ini dirujuk sebagai katalog pangkalan data. Piwaian SQL menetapkan cara yang sama bagi mencapai katalog, menggelarnya skema maklumat, tetapi bukan semua pangkalan data melaksanakannya, sungguhpun mereka melaksanakan aspek lain bagi piwaian SQL. Sebagi contoh kaedah capaian metadata khusus pangkalan data, lihat metadata Oracle. Capaian program pada metadata adalah mungkin dengan menggunakan API seperti JDBC, atau SchemaCrawler.[13]

Rujukan[sunting | sunting sumber]

  1. Hüner, K.; Otto, B.; Österle, H.: Collaborative management of business metadata, in: International Journal of Information Management, 2011
  2. METADATA STANDARDS AND METADATA REGISTRIES: AN OVERVIEW
  3. National Archives of Australia (2002). "AGLS Metadata Element Set - Part 2: Usage Guide - A non-technical guide to using AGLS metadata for describing resources". http://www.naa.gov.au/records-management/publications/agls-element.aspx. Capaian 17 March 2010. 
  4. Bagley, Philip (Nov 1968), Extension of programming language concepts, Philadelphia: University City Science Center 
  5. "The notion of "metadata" introduced by Bagley". Solntseff, N+1; Yezerski, A (1974), A survey of extensible programming languages, Annual Review in Automatic Programming, 7, Elsevier Science Ltd, pp. 267–307, doi:10.1016/0066-4138(74)90001-9 
  6. 6.0 6.1 NISO. Understanding Metadata. NISO Press. ISBN 1-880124-62-9. http://www.niso.org/publications/press/UnderstandingMetadata.pdf. Capaian 5 January 2010. 
  7. Bretherton, F. P.; Singley, P.T. (1994). "Metadata: A User's View, Proceedings of the International Conference on Very Large Data Bases (VLDB)". pp. 1091–1094. 
  8. Cathro, Warwick (1997). "Metadata: an overview". http://www.nla.gov.au/nla/staffpaper/cathro3.html. Capaian 6 January 2010. 
  9. DCMI (5 Oct 2009). "Semantic Recommendations". http://dublincore.org/specifications/. Capaian 6 January 2010. 
  10. "Types of Metadata". University of Melbourne. 15 August 2006. http://www.infodiv.unimelb.edu.au/metadata/add_info.html. Capaian 6 January 2010. [pautan putus]
  11. [www.isprs.org/proceedings/XXXII/part4/www.ifp.uni.../kuebler51.pdf THE DESIGN AND DEVELOPMENT OF A GEOLOGIC HYPERMAP PROTOTYPE]
  12. ISO/IEC 11179-1:2004 Information technology - Metadata registries (MDR) - Part 1: Framework
  13. Sualeh Fatehi. "SchemaCrawler". SourceForge. http://schemacrawler.sourceforge.net/. 

Pautan luar[sunting | sunting sumber]

Wiktionary-logo.svg
Carilah metadata dalam Wiktionary, kamus bebas.