Sains data

Daripada Wikipedia, ensiklopedia bebas.
Jump to navigation Jump to search

Sains data ialah sebuah cabang disiplin yang menggunakan kaedah saintifik, proses, algoritma dan sistem untuk mendapatkan pengetahuan dan pandangan dari data dalam berbagai bentuk, kedua-dua tersusun dan keselesaan,[1][2] sama dengan perlombongan data.

Sains data adalah "konsep untuk menyatukan statistik, analisis data, pembelajaran mesin dan kaedah yang berkaitan" untuk "memahami dan menganalisis fenomena sebenar" dengan data. Ia menggunakan teknik dan teori yang diambil dari banyak bidang dalam konteks matematik, statistik, sains maklumat, dan sains komputer.

Pemenang penganugerahan Turing Jim Gray membayangkan sains data sebagai "paradigma keempat" sains (empirikal, teoritis, pengkomputeran dan kini didorong oleh data) dan menegaskan bahawa "segala sesuatu tentang sains berubah kerana kesan teknologi maklumat" dan banjir data.[3][4]

Rujukan[sunting | sunting sumber]

  1. ^ Dhar, V. (2013). "Data science and prediction". Communications of the ACM. 56 (12): 64. doi:10.1145/2500499. 
  2. ^ Jeff Leek (2013-12-12). "The key word in "Data Science" is not Data, it is Science". Simply Statistics. 
  3. ^ Stewart Tansley; Kristin Michele Tolle (2009). The Fourth Paradigm: Data-intensive Scientific Discovery. Microsoft Research. ISBN 978-0-9825442-0-4. 
  4. ^ Bell, G.; Hey, T.; Szalay, A. (2009). "COMPUTER SCIENCE: Beyond the Data Deluge". Science. 323 (5919): 1297–1298. doi:10.1126/science.1170411. ISSN 0036-8075.