Sisihan piawai

Daripada Wikipedia, ensiklopedia bebas.
Lompat ke: pandu arah, cari

Dalam kebarangkalian dan statistik, sisihan piawai bagi satu-satu taburan kebarangkalian, pembolehubah rawak atau populasi atau banyak set nilai adalah ukuran serakan nilainya. Ia sering diwakili dengan huruf σ (huruf kecil sigma). Ia ditakrifkan sebagai punca kuasa dua varians.

Untuk memahami sisihan piawai, harus diingat bahawa varians adalah purata bagi kuasa dua kepada beza titik data dengan min. Sisihan piawai, yang merupakan punca kuasa dua kuantiti tersebut, lalu mengukur serakan data pada min, yang diukur dengan unit yang sama dengan data.

Lebih rasmi lagi, sisihan piawai ialah sisihan punca min kuasa dua (pmkd) bagi nilai dari min aritmetik mereka.

Sebagai contoh, dalam populasi {4, 8}, min adalah 6 dan sisihan dari min ialah {−2, 2}. Sisihan tersebut dikuasa duakan lalu menjadi {4, 4}, puratanya (varians) adalah 4. Maka, sisihan piawai ialah 2. Dalam kes ini, 100% nilai dalam populasi adalah pada satu sisihan piawai min.

Sisihan piawai adalah pengukuran yang biasa bagi serakan statistik, mengukur betapa lebarnya nilai dalam set data. Jika kebanyakan titik data hampir dengan min, maka sisihan piawai adalah kecil; jika banyak titik data jauh dari min, maka, sisihan piawai adalah besar. Jika semua data adalah sama, maka sisihan piawai adalah sifar.

Bagi satu populasi, sisihan piawai boleh dianggar oleh sisihan piawai yang diubah (s) bagi sampel. Formula adalah diberi di bawah.

Diberi pemboleh ubah rawak (biru), sisihan piawai \sigma adalah ukuran serakan nilai pemboleh ubah rawak dari min \mu.

Takrifan dan pengiraan[sunting | sunting sumber]

Contoh mudah[sunting | sunting sumber]

Katakan kita ingin mencari sisihan piawai bagi set nombor 4 dan 8.

Langkah 1: cari min aritmetik (atau purata) bagi 4 dan 8,

(4+8)/2=6.

Langkah 2: cari perbezaan antara setiap nombor dengan min,

4 - 6  = -2
 8 - 6 = 2.

Langkah 3: kuasa duakan kedua-dua perbezaan

(-2)^2=4
2^2=4.

Langkah 4: jumlahkan kedua-duanya,

4+4=8.

Langkah 5: bahagikan jumlah dengan bilangan nombor (sini, kita ada dua nombor),

8/2 = 4.

Langkah 6: ambil punca kuasa yang bukan negatif,

\sqrt{4}=2.

Maka, sisihan piawainya ialah 2.

Ciri-ciri sisihan piawai[sunting | sunting sumber]

1. Semakin data tersebar, semakin besar julat, varians, dan sisihan piawai.

2.

Sisihan piawai bagi pemboleh ubah rawak[sunting | sunting sumber]

Sisihan piawai bagi pemboleh ubah rawak X ditakrifkan sebagai:

\begin{array}{lcl}
\sigma & = &\sqrt{\operatorname{E}((X \operatorname{E}(X))^2)} =  \sqrt{\operatorname{E}(X^2) - (\operatorname{E}(X))^2}  \\
 & = & \sqrt{\operatorname{Var}(X)}
\end{array}

iaitu E(X) adalah nilai jangkaan bagi X, dan Var(X) ialah Varians X.

Tidak semua pemboleh ubah rawak mempunyai sisihan piawai, memandangkan nilai jangkaan ini tidak wujud. Sebagai contoh, sisihan piawai bagi pemboleh ubah rawak yang mengikut taburan Cauchy adalah tak tertakrif kerana E(X) tidak tertakrif.

Jika pemboleh ubah rawak X mengambil nilai \scriptstyle x_1,\dots,x_N (iaitu nombor nyata) dengan kebarangkalian sama, maka sishan piawainya boleh dihitung seperti berikut: Pertama, min X, \overline{x}, ditakrifkan sebagai jumlah:

\overline{x} = \frac{1}{N}\sum_{i=1}^N x_i = \frac{x_1+x_2+\cdots+x_N}{N}

iaitu N adalah bilangan sampel yang diambil. Kemudian, sisihan piawai dimudahkan kepada

\sigma = \sqrt{\frac{1}{N} \sum_{i=1}^N (x_i - \overline{x})^2}.

Dalam kata lain, sisihan piawai bagi pemboleh ubah rawak X yang diskret dan seragam boleh dikira seperti berikut:

  1. Bagi setiap nilai x_i hitung beza \scriptstyle x_i - \overline{x} between xi dan purata nilai \scriptstyle\overline{x}.
  2. Kirakan kuasa dua bagi beza tersebut.
  3. Cari purata beza yang telah dikuasa duakan. Kuantiti ini adalah varians σ2.
  4. Punca kuasa duakan varians itu.

Pernyataan di atas boleh digantikan dengan

\sigma = \sqrt{\frac{1}{N} \left(\sum_{i=1}^N x_i^2 - N\overline{x}^2\right)}.

Kesamaan kedua-dua pernyataan boleh ditunjukkan dengan sedikit algebra:

\begin{align}
\sum_{i=1}^N (x_i - \overline{x})^2 & = {} \sum_{i=1}^N (x_i^2 - 2 x_i\overline{x} + \overline{x}^2) \\
& {} = \left(\sum_{i=1}^N x_i^2\right) - \left(2 \overline{x} \sum_{i=1}^N x_i\right) + N\overline{x}^2 \\
& {} = \left(\sum_{i=1}^N x_i^2\right) - 2 \overline{x} (N\overline{x}) + N\overline{x}^2 \\
& {} = \left(\sum_{i=1}^N x_i^2\right) - N\overline{x}^2.
\end{align}

Menganggar sisihan piawai populasi dari sisihan piawai sampel[sunting | sunting sumber]

Dalam dunia nyata, mencari sisihan piawai bagi keseluruhan populasi adalah tidak realistik kecuali dalam kes tertentu, seperti pengujian terpiawai, iaitu setiap ahli populasi disampelkan. Dalam kebanyakan kes, sisihan piawai dianggar dengan memeriksa sampel rawak yang diambil dari populasi. Ukuran yang paling biasa digunakan ialah sisihan piawal sampel, yang ditakrifkan oleh


s = \sqrt{\frac{1}{N-1} \sum_{i=1}^N (x_i - \overline{x})^2}\,,

iaitu \scriptstyle\{x_1,\,x_2,\,\ldots,\,x_N\} merupakan sampel dan \scriptstyle\overline{x} adalah min sampel. Pembawah N − 1 adalah darjah kebebasan dalam vektor \scriptstyle(x_1-\overline{x},\,\dots,\,x_N-\overline{x}).

Sebab bagi takrifan itu ialah s2 merupakan penganggar tak pincang bagi varians σ2 untuk populasi asal, jika varians wujud dan nilai sampel yang diambil tidak bergantung kepada gantinya. Walau bagaimanapun, s bukanlah bukan penganggar tak pincang bagi sisihan piawai σ; ia cenderung untuk tidak memgendahkan sisihan piawai populasi. Walaupun penganggar tak pincang bagi σ diketahui apabibla pemboleh ubah rawak adalah ditabur secara normal, rumus adalah rumit dan memerlukan beberapa pembetulan. Tambahan pula, ketidak pincangan, dana kata ini, tidaklah selalu diinginkan.

Penganggar lain yang kadang-kala digunakan adlalah pernyataan yang serupa


 \sqrt{\frac{1}{N} \sum_{i=1}^N (x_i - \overline{x})^2}\,\,.

Bentuk ini mempunyai ralat kuasa dua min yang seragam dan lebih kecil berbanding penganggar tidak pincang, dan mengganggar hampir maksimum apabila populasi ditaburkan secara normal.

Sisihan piawai bagi pemboleh ubah selanjar[sunting | sunting sumber]

Taburan selanjar sering memberi rumus bagi mengira sisihan piawai sebagai fungsi parameter taburan. Secara umum, sisihan piawai bagi pemboleh ubah rawak selanjar X dengan fungsi ketumpatan kebarangkalian p(x) adalah

\sigma = \sqrt{\int (x-\mu)^2 \, p(x) \, dx}

Iaitu

\mu = \int x \, p(x) \, dx

Contoh[sunting | sunting sumber]

Kita akan menunjukkan bagaimana mengira sisihan piawai bagi satu populasi. Contoh kita akan menggunakan umur empat kanak-kanak: { 5, 6, 8, 9 }.

Langkah 1. Kira min aritmetik, \overline{x}:

\overline{x}=\frac{1}{N}\sum_{i=1}^N x_i

Kita mempunyai N = 4 kerana terdapat empat titik data:

x_1 = 5\,\!
x_2 = 6\,\!
x_3 = 8\,\!
x_4 = 9\,\!
\overline{x}=\frac{1}{4}\sum_{i=1}^4 x_i       Menggantikan N dengan 4
\overline{x}=\frac{1}{4} \left ( x_1 + x_2 + x_3 +x_4 \right )
\overline{x}=\frac{1}{4} \left ( 5 + 6 + 8 + 9 \right )
\overline{x}= 7   Ini ialah min.

Langkah 2. Hitung sisihan piawai, \sigma\,\!. (Memandangkan empat nilai mewakili keseluruhan populasi, kita tidak menggunakan rumus bagi anggaran sisihan piawai dalam kes ini):

\sigma = \sqrt{\frac{1}{N} \sum_{i=1}^N (x_i - \overline{x})^2}
\sigma = \sqrt{\frac{1}{4} \sum_{i=1}^4 (x_i - \overline{x})^2}       Mengganti N dengan 4
\sigma = \sqrt{\frac{1}{4} \sum_{i=1}^4 (x_i - 7)^2}       Mengganti \overline{x} dengan 7
\sigma = \sqrt{\frac{1}{4} \left [ (x_1 - 7)^2 + (x_2 - 7)^2 + (x_3 - 7)^2 + (x_4 - 7)^2 \right ] }
\sigma = \sqrt{\frac{1}{4} \left [ (5 - 7)^2 + (6 - 7)^2 + (8 - 7)^2 + (9 - 7)^2 \right ] }
\sigma = \sqrt{\frac{1}{4} \left ( (-2)^2 + (-1)^2 + 1^2 + 2^2 \right ) }
\sigma = \sqrt{\frac{1}{4} \left ( 4 + 1 + 1 + 4 \right ) }
\sigma = \sqrt{\frac{10}{4}}
\sigma = \sqrt{2.5} \approx 1.58

Maka, sisihan piawai bagi umur empat kanak-kanak dalah punca kuasa 2.5, atau lebih kurang 1.58.

Jika set ini merupakan sampel yang diambil dari populasi besar kanak-kanak, dan soalan adalah untuk menganggar sisihan piawai populasi, konvensyen akan menggantikan pembawah N (or 4) dalam Langkah 2 dengan N−1 (or 3).

Tafsiran dan kegunaan[sunting | sunting sumber]

Sisihan piawai yang besar menunjukkann titik data adalah jauh dari min dah sebaliknya. Sebagai contoh, setiap set data {0, 0, 14, 14}, {0, 6, 8, 14} dan {6, 6, 8, 8} mempunyai min 7. Sisihan piawainya ialah 7, 5, dan 1, masing-masing, Set ketiga mempunyai sisihan piawai terkecil kerana nilainya berhampiran dengan 7. Maka, sisihan piawai memberitahu kita betapa jauh titik data boleh berada. Ia turut mempunyai unit yang sama dengan data, Sebagai contoh, set data {0, 6, 8, 14} mewakili umur empat adik beradik dalam tahun, maka sisihan piawainya ialah 5 tahun.

Contoh lain, data set {1000, 1006, 1008, 1014} mungkin mewakili jarak yang dilalui oleh 4 orang atlet dalam 3 minit, dan diukur dalam meter. Minnya ialah 1007 meter, dan sisihan piawainya ialah 5 meter.

Sisihan piawai boleh digunakan sebagai pengukuran ralat. Dalam sains fizik contohnya, sisihan piawai yang dilaporkan bagi sekumpulan pengukuran berulang patut memberikan kepersisian pengukuran. Apabila ingin menentukan sama ada pengukuran bersetuju dengan ramalan teori, sisihan piawai bagi pengukuran tersebut adalah penting: jika min terlalu jauh dari ramalan, maka kita menganggap pengukuran bercanggah dengan ramalan. Hal ini adalah masuk akal kerana mereka telah berada di luar julat nilai yang patut.

Contoh sebenar[sunting | sunting sumber]

Cuaca[sunting | sunting sumber]

Sebagai contoh mudah, kita mengambil kira suhu purata dua buah bandar. Sementara dua bandar mempunyai suhu purata 60 °F, adalah amat membantu untuk memahami julat bagi bandar berhampiran pantai lebih kecil berbanding di kawasan pedalamanm yang menunjukkan, sementara puratanya sama, perubahan adalah besar di kawasan pedalaman berbanding di pantai.

Maka, purata 60 berlaku pada satu bandar dengan suhu tinggi 80 °F dan rendah 40 °F, dan juga bagi bandar bersuhu tinggi 65 dan rendah 55. Sisihan piawai membolehkan kita mengenal pasti purata yang masa mempunyai perubahan yang besar, lalu mempunyai sisihan piawai yang besar.

Tafsiran geometri[sunting | sunting sumber]

Untuk mendapatkan pandangan geometri, kita akan mula dengan sebuah populasi yang mempunyai tiga nilai, x1, x2, x3. Ini menakrifkan titik P = (x1, x2, x3) dalam R3. Katakan garis L = {(r, r, r) : r dalam R}. Ini adalah "pepenjuru utam" melalui titik asalan. Jika tiga nilai diberi semuanya sama, maka sisihan piawai adallah sifar dan P akan berada pada L. maka tidak mustahil untuk menganggap sisihan piawai berkaitan dengan jarak P kepadaL. Dan itulah kesnya. Bergerak secara ortogon dari P ke garis L, satu bersilang pada satu titik:

R = (\overline{x},\overline{x},\overline{x})

yang koordinatnya adalah min kepada nilai yang kita mulakan tadi. Sedikit algebra menunjukkan bahawa jarak antara P dan R (yang sama dengan jarak antara P dan garis L) diberi oleh σ√3. Rumus analogi (dengan 3 digantikan oleh N) juga sah untuk populasi bernilai N; kita kemudian perlu melalukan kerja untuk RN.

Peraturan bagi data bertaburan normal[sunting | sunting sumber]

biru gelap adalah kurang satu sisihan piawai dari min. Bagi taburan norma, ini ialah 68.27 % set; sementara dua sisihan piawai dari min (biru gelap dan sederhana) meliputi 95.45 %; dan tiga sisihan piawai (biru gelap, sederhana dan cerah) meliputi 99.73 %.

Seseorang sering menganggap yang data adalah dari populasi yang agak bertaburan normal. Ini sering diwajarkan oleh teori had tengah klasik, yang mengatakan bahawa jumlah bagi pemboleh ubah rawak yang ditabur secara bebas dan sama akan cenderung kepada taburan normal sebagai had. Jika anggapan ini wajar, maka lebih kurang 68 % nilai dalam 1 sisihan piawai min, lebih kurang 95 % nilai dari dua sisihan piawai dan lebih kurang 99.7 % dari 3 sisihan piawai. Ini dikenali sebagai peraturan 68-95-99.7, atau peraturan empirik

sela keyakinan adalah seperti berikut:

σ 68.26894921371%
95.44997361036%
99.73002039367%
99.99366575163%
99.99994266969%
99.99999980268%
99.99999999974%

Bagi taburan normal, dua titik lengkungan iaitu satu sisihan piawai dari min adalah juga titik lengkok balas.

Ketaksamaan Chebyshev[sunting | sunting sumber]

Ketaksamaan Chebyshev membuktikan bagi sebarang set data, hampir semua nilai berada hampir dengan nilai min, dengan maksud "hampir" itu adalah ditentukan oleh sisihan piawai. Ketaksamaan Chebyshev sesuai untuk (hampir) semua taburan rawak, buukan sahaja untuk normal, dan berikut merupakan kaitannya:

Sekurang-kurangnya 50% nilai adalah dalam 1.41 sisihan piawai dari min.
Sekurang-kurangnya 75% nilai adalah dalam 2 sisihan piawai dari min.
Sekurang-kurangnya 89% nilai adalah dalam 3 sisihan piawai dari min.
Sekurang-kurangnya 94% nilai adalah dalam 4 sisihan piawai dari min.
Sekurang-kurangnya 96% nilai adalah dalam 5 sisihan piawai dari min.
Sekurang-kurangnya 97% nilai adalah dalam 6 sisihan piawai dari min.
Sekurang-kurangnya 98% nilai adalah dalam 7 sisihan piawai dari min.

Dan secara amnya:

Sekurang-kurangnya (1 − 1/k2) × 100% nilai adalah dalam k sisihan piawai dari min.

Hubungan antara sisihan piawai dan min[sunting | sunting sumber]

Min dan sisihan piawai bagi satu set data sering dilapotkan bersama. Dalam kes tertentu, sisihan piawai merupakan ukuran "semula jadi" bagi serakan statistik jika pusat data itu diukur pada min. Ini disebabkan sisihan piawai dari min adalah lebih kecil dari mana-mana titik. Pernyataan tepat adalah berikut: katakan x1, ..., xn dalah nombor nyata dan takrifkan fungsi:

\sigma(r) = \sqrt{\frac{1}{N-1} \sum_{i=1}^N (x_i - r)^2}

menggunakan kalkulus, atau hanya penyelesaian kuasa dua, adalah mungkin untuk menunjukkan yang σ(r) mempunyai minimum unik pada min:

r = \overline{x}.\,

(Ini juga boleh dilakukan dengan hanya algebra, memandangkan σ2(r) disamakan dengan polinomial kuadratik).

Pekali perubahan bagi sampel adalah nisbah sisihan piawai kepada min. ia adlaah nombor tak berdimensi yang boleh digunakan untuk membandingkan varians antara populasi dengan min berbeza.

Kaedah pengiraan pantas[sunting | sunting sumber]

Cara yang lebih cepat untuk mengira sisihan piawai adalah dengan rumus berikut (walaupun pertimbangan harus dibuat untuk syarat ralat pembundaran, limpahan aritmetik, dan limpah bawahnya):


\sigma\ = \sqrt{\left(\frac{1}{N}\sum_{i=1}^N{{x_i}^2}\right) - \overline{x}^2} = \sqrt{\left(\frac{1}{N}\sum_{i=1}^N{{x_i}^2}\right) - \left(\frac{1}{N}\sum_{i=1}^N{{x_i}}\right)^2} = \frac{1}{N}\sqrt{N\left(\sum_{i=1}^N{{x_i}^2}\right) - \left(\sum_{i=1}^N{{x_i}}\right)^2}

atau

\sigma= \frac{1}{s_0}\sqrt{s_0s_2-s_1^2}

iaitu kuasa jumlah s0, s1, s2 ditakrifkan olehh

\ s_j=\sum_{k=1}^N{x_k^j}.

Serupa untuk sisihan piawai sampel:


s = \sqrt{\frac{\sum_{i=1}^N{{x_i}^2} - N\overline{x}^2}{N-1}\ }.

atau bagi jumlah:


s = \sqrt{\frac{N\sum_{i=1}^N{{x_i}^2} - \left(\sum_{i=1}^N{x_i}\right)^2}{N(N-1)}}.

Lihat juga[sunting | sunting sumber]

Pautan luar[sunting | sunting sumber]