Mga Calculator sa Estadistika
Standard Deviation Calculator


Standard Deviation Calculator

Libreng standard deviation calculator na may step-by-step na solusyon. Mabilisang hanapin ang mean, variance, at standard deviation ng sample o population data sets.

Sampol Populasyon
Karaniwang Paglihis σ = 5.3385 s = 4.9937
Baryans σ2 = 28.5 s2 = 24.9375
Bilang n = 8 n = 8
Mean μ = 18.25 x̄ = 18.25
Kabuuan ng mga Parisukat SS = 199.5 SS = 199.5

Nagkaroon ng error sa iyong kalkulasyon.

Talaan ng mga Nilalaman

  1. Ang Standard Deviation
  2. Ang Population Standard Deviation
    1. Halimbawa ng pag-calculate ng standard deviation ng isang pangkalahatang populasyon
  3. Ang Sample Standard Deviation
  4. Margin of Error
  5. Ang Confidence Interval
    1. Halimbawa ng pag-calculate ng confidence interval

Standard Deviation Calculator

Ang aming standard deviation calculator ay isang makapangyarihan at madaling gamiting tool na ginawa para hanapin ang standard deviation ng anumang data set. Bukod sa pag-compute ng standard deviation, agad din itong nagbibigay ng mahahalagang statistical insight, kabilang ang mean, variance, at isang detalyadong frequency distribution table. Bukod pa rito, kinakalkula din ng tool na ito ang confidence interval ng iyong dataset sa iba't ibang confidence levels.

Para magsimula, ilagay lamang ang iyong mga data point na pinaghihiwalay ng mga kuwit (comma). Susunod, piliin kung ang iyong mga numero ay kumakatawan sa isang buong populasyon (full population) o isang sample, at i-click ang "Calculate" upang makita ang iyong mga komprehensibong resulta.

Ang Standard Deviation

Ang standard deviation ay isang pangunahing sukat sa estadistika (statistical measure) na nagpapakita ng antas ng pagkakalat, o variability, sa loob ng isang ibinigay na dataset. Kinakatawan nito ang average na layo ng iyong mga data point mula sa mean ng dataset. Ang mas mababang standard deviation ay nangangahulugang ang mga data point ay malapit na nagkumpol sa paligid ng mean, samantalang ang mas mataas na standard deviation ay nagpapahiwatig na ang data ay malawak na nakakalat. Sa matematika, ang standard deviation ay ang square root ng variance—isa pang mahalagang sukat ng pagkakalat ng data (data dispersion).

Kung paano mo kakalkulahin ang standard deviation ay nakadepende nang buo sa iyong dataset. Kung kasama sa iyong data ang bawat miyembro ng grupong iyong pinag-aaralan, ang iyong kakalkulahin ay ang population standard deviation. Gayunpaman, kung ang iyong data ay bahagi lamang (subset) ng isang mas malaking grupo, ang iyong kakalkulahin ay ang sample standard deviation.

Ang Population Standard Deviation

Dapat mong kalkulahin ang population standard deviation kapag kasama sa iyong dataset ang bawat posibleng obserbasyon sa loob ng iyong grupong pinag-aaralan. Sa estadistika, ang population standard deviation ay tinutukoy ng simbolong σ.

Ang σ (binibigkas na "sigma") ay isang maliit na titik Griyego (lowercase Greek letter). Ang formula para sa population standard deviation ay ang sumusunod:

$$\sigma=\sqrt{\frac{\sum_{i=1}^{N}{(x_i-\mu)^2}}{N}}$$

Kung saan:

  • Ang Σ ay ang malaking titik Griyego na Sigma, na nagpapahiwatig ng pagdaragdag (summation) sa matematika;
  • Kinakatawan ng xᵢ ang bawat indibidwal na data point (obserbasyon) sa dataset, simula sa unang halaga hanggang sa ika-N (huling) halaga;
  • Kinakatawan ng μ ang population mean;
  • Ang N ay ang kabuuang sukat ng populasyon (total population size).

Halimbawa ng pag-calculate ng standard deviation ng isang pangkalahatang populasyon

Ipinapakita ng sumusunod na halimbawa kung paano hanapin ang standard deviation ng datos ng populasyon.

Madalas na itinuturing ng mga investor ang stocks bilang mga mapanganib na asset dahil sa mataas na volatility ng presyo ng mga ito kumpara sa ibang uri ng investment. Ipagpalagay natin na gusto ng isang investment manager na suriin ang volatility ng mga partikular na stock sa nakaraang buwan. Nagpasya siya na hindi siya magrerekomenda ng anumang stock sa kanyang mga kliyente kung ang standard deviation nito ay mas mataas o katumbas ng mean nito, kung saan uuriin niya ang ganitong mga asset bilang "masyadong mapanganib" (too risky).

Nasa ibaba ang lahat ng pang-araw-araw na closing price (sa USD) para sa isang partikular na stock sa nakaraang buwan. Kalkulahin natin ang standard deviation upang matukoy kung ituturing ng manager na masyadong mapanganib ang stock na ito:

1.31, 1.30, 1.36, 1.40, 1.40, 1.41, 1.27, 1.19, 1.15, 1.12, 0.99, 1.00, 0.97, 0.94, 0.88, 0.90, 0.86, 0.88, 0.80, 0.81

Dahil ang manager ay interesado lamang sa mga presyo ng stock noong nakaraang buwan, at mayroon tayong lahat ng naitalang presyo para sa partikular na panahong iyon, tinutukoy natin ang buong populasyon. Samakatuwid, gagamitin natin ang formula ng population standard deviation.

Para mahanap ang standard deviation, kailangan muna nating kalkulahin ang mean (μ). Tandaan, hinahanap ang mean sa pamamagitan ng paghahati (dividing) ng kabuuang kabuuan (total sum) ng mga numero sa kabuuang bilang (total count) ng mga numero.

$$\mu=\frac{1.31+1.30+1.36+1.40+1.40+1.41+1.27+1.19+1.15+1.12+0.99+1.00+0.97+0.94+0.88+0.90+0.86+0.88+0.80+0.81}{20}=1.097$$

Susunod, ibawas ang mean mula sa bawat indibidwal na data point at i-square ang difference. I-add ang lahat ng squared difference na ito, at i-divide ang resulta sa kabuuang bilang. Ang resultang ito ay ang variance (σ²).

$$\sigma^2=\frac{\left(1.31-1.097\right)^2+\left(1.30-1.097\right)^2+\left(1.36-1.097\right)^2+\left(1.40-1.097\right)^2+\ldots+\left(0.81-1.097\right)^2}{20}=0.045031$$

Sa huli, kunin ang square root ng variance para matukoy ang population standard deviation.

$$\sigma=\sqrt{0.045031}\approx0.21$$

Tulad ng makikita mo, ang standard deviation ng mga presyo ng stock na ito para sa nakaraang buwan (0.21) ay mas mababa kaysa sa mean (1.097). Samakatuwid, hindi ituturing ng manager na "masyadong mapanganib" ang stock na ito.

Ang Sample Standard Deviation

Dapat mong kalkulahin ang sample standard deviation kapag ang iyong dataset ay isa lamang sample (isang mas maliit na subset) na kinuha mula sa isang mas malaking populasyon na gusto mong pag-aralan. Ang sample standard deviation ay tinutukoy ng letrang s at kinakalkula gamit ang sumusunod na formula:

$$s=\sqrt{\frac{\sum_{i=1}^{n}\left(x_i-\bar{x}\right)^2}{n-1}}$$

Kung saan:

  • Ang Σ ay nagpapahiwatig ng pagdaragdag (summation);
  • Kinakatawan ng xᵢ ang bawat indibidwal na data point;
  • Kinakatawan ng ang sample mean;
  • Ang n ay ang sample size.

Ilustrahan natin kung paano mahanap ang sample standard deviation gamit ang isang baryasyon (variation) ng nakaraang halimbawa. Ipagpalagay natin na nais ng investment manager na suriin ang parehong stock, ngunit sa pagkakataong ito, wala siyang access sa mga closing price para sa bawat araw ng kalakalan sa nakaraang buwan. Sa halip, ang mayroon lamang siya ay ang mga closing price para sa isang random sample na 5 araw. Kakailanganin niyang tantyahin (estimate) ang standard deviation ng stock gamit ang limitadong sample data na ito.

Ipagpalagay natin na ang 5 naitalang closing price ay:

1.31, 1.40, 0.86, 0.88, 1.40

Kahit na ang tunay na interes ng manager ay nakasalalay sa buong nakaraang buwan, 5-araw na subset lamang ang hawak niya. Dahil sample ang ginagamit natin at hindi ang buong populasyon, dapat nating kalkulahin ang standard deviation gamit ang formula ng sample standard deviation.

Una, kalkulahin ang sample mean ().

$$\bar{x}=\frac{1.31+1.40+0.86+0.88+1.40}{5}=1.17$$

Susunod, kalkulahin ang sample variance ().

$$s^2=\frac{\left(1.31-1.17\right)^2+\left(1.40-1.17\right)^2+\left(0.86-1.17\right)^2+\left(0.88-1.17\right)^2+\left(1.40-1.17\right)^2}{5-1}=0.0764$$

Sa huli, kunin ang square root ng variance para makuha ang sample standard deviation.

$$s=\sqrt{0.0764}\approx 0.28$$

Margin of Error

Isa sa pinakamahalagang aplikasyon ng standard deviation ay ang pagkalkula ng "katanggap-tanggap" (acceptable) na saklaw ng mga halaga, na gumaganap ng mahalagang papel sa predictive analytics at industrial statistical quality assurance. Kung ang nakapailalim na data ay sumusunod sa isang normal distribution, ang saklaw na ito ay kilala bilang ang confidence interval (detalyado sa susunod na seksyon). Ang mga interval na ito ay kinakalkula sa iba't ibang confidence level, na kadalasang ipinapakita bilang mga porsyento.

Ang margin of error ay isang pangunahing bahagi ng confidence interval na nagdidikta ng kabuuang lapad nito. Sa pangkalahatan, itinatatag ng margin of error ang pinakamataas (maximum) at pinakamababang (minimum) na mga katanggap-tanggap na halaga para sa panukat (metric) na iyong sinusuri.

Ang margin of error ay kinakalkula gamit ang formula na ito:

$$Margin\ of\ error\ = z_{\alpha/2}\left(\dfrac{\sigma}{\sqrt{n}}\right)$$

Inilalapat natin ang formula na ito kapag alam ang population standard deviation (σ), sa kondisyon na sapat ang laki ng sample size (kadalasan ay n > 30).

Kapag hindi alam ang population standard deviation at maliit lamang ang sample (kadalasan ay n ≤ 30), ang sumusunod na formula ang ating ginagamit sa halip:

$$Margin\ of\ error\ = t_{n-1,\alpha/2}\left(\frac{s}{\sqrt{n}}\right)$$

Sa sitwasyong ito, papalitan natin ang population standard deviation (σ) ng sample standard deviation (s).

Ang mga bahaging \$z_{\alpha/2}\$ at \$t_{n-1, \alpha/2}\$ ay kilala bilang mga critical value. Natutukoy ang mga ito gamit ang z-statistics at t-statistics, ayon sa pagkakasunod-sunod, at nagsisilbing mga constant na nakatali sa iyong napiling confidence level.

Ang mga pinakakaraniwang confidence level na ginagamit sa statistical analysis ay 90%, 95%, at 99%. Ang kanilang mga kaukulang \$z_{\alpha/2}\$ na critical value ay 1.645 (para sa 90%), 1.96 (para sa 95%), at 2.575 (para sa 99%).

Ang mga bahaging \$\frac{\sigma}{\sqrt n}\$ at \$\frac{s}{\sqrt n}\$ ay kumakatawan sa standard error.

  • Ginagamit ang \$\frac{\sigma}{\sqrt n}\$ kapag alam natin ang population standard deviation (σ) at mayroon tayong malaking sample size (kadalasan ay n > 30).
  • Ginagamit ang \$\frac{s}{\sqrt n}\$ kapag hindi natin alam ang population standard deviation at gumagamit tayo ng maliit na sample size (kadalasan ay n ≤ 30). Dahil hindi alam ang σ, kailangan nating umasa sa standard deviation ng ating available na sample (s).

Ang Confidence Interval

Gaya ng nabanggit sa itaas, ang confidence interval ay isang statistical na saklaw ng mga halaga kung saan inaasahang mahuhulog ang isang ibinigay na population parameter, batay sa isang partikular na confidence level.

Halimbawa, maaaring sabihin ng isang statistician na ang average na taas ng mga 13-taong gulang na batang babae ay nasa pagitan ng 59 pulgada at 66 pulgada sa 90% confidence level. Nangangahulugan ito na kung kukuha tayo ng maraming random sample ng mga 13-taong gulang na batang babae, halos 90% ng mga pagkakataon, ang kanilang average na taas ay mapapaloob sa pagitan ng dalawang hangganan na iyon.

Kapag alam ang population standard deviation, ang confidence interval ay kinakalkula gamit ang sumusunod na formula:

$$\bar{x}± z_{\alpha/2}\left(\frac{\sigma}{\sqrt{n}}\right)$$

  • Ang ay ang sample mean,
  • Ang \$z_{\alpha/2}\$ ay ang critical value,
  • Ang σ ay ang population standard deviation,
  • Ang n ay ang bilang ng mga obserbasyon.

Kung hindi natin alam ang population standard deviation (σ) at dapat nating gamitin ang sample standard deviation (s) sa halip, ginagamit natin itong alternatibong formula:

$$\bar{x}± t_{n-1,\alpha/2}\left(\frac{s}{\sqrt{n}}\right)$$

  • Ang ay ang sample mean,
  • Ang \$t_{n-1,\alpha/2}\$ ay ang critical value,
  • Ang s ay ang sample standard deviation,
  • Ang n ay ang bilang ng mga obserbasyon.

Gaya ng idinetalye sa nakaraang seksyon, ang mga ekspresyong \$z_{\alpha/2}\left(\frac{\sigma}{\sqrt{n}}\right)\$ at \$t_{n-1,\alpha/2}\left(\frac{s}{\sqrt{n}}\right)\$ ay kumakatawan sa mga margin of error.

Halimbawa ng pag-calculate ng confidence interval

Ipagpalagay natin na alam nating ang sinusuri nating mga pang-araw-araw na presyo ng stock ay sumusunod sa isang normal distribution. Mayroon tayong sumusunod na sample ng 10 presyo ng stock na maaaring gamitin:

1.31, 1.36, 1.40, 1.27, 1.15, 0.99, 0.97, 0.88, 0.86, 0.80

Gusto nating kalkulahin ang saklaw kung saan magbabago-bago (fluctuate) ang tunay na average na presyo ng stock, na may 95% level of confidence.

Dahil ito ay isang maliit na sample at hindi alam ang population standard deviation, gagamitin natin ang sample standard deviation at ang kaukulang formula ng t-statistic:

$$\bar{x}± t_{n-1,\alpha/2}\left(\frac{s}{\sqrt{n}}\right)$$

  • Ang ay ang sample mean: 1.10
  • Ang \$t_{n-1,\alpha/2}\$ ay ang critical value: \$t_{9, 0.025}\$ = 2.26 (ang mga critical value para sa isang ibinigay na sample size at confidence level ay karaniwang hinahanap gamit ang karaniwang t-table o z-table)
  • Ang s ay ang sample standard deviation: 0.23
  • Ang n ay ang bilang ng mga obserbasyon: 10
  • Ang \$\frac{s}{\sqrt n}\$ ay ang standard error: \$\frac{0.23}{\sqrt{10}}=0.07\$

Ngayon, ilalagay natin ang mga numerong ito sa ating formula ng confidence interval:

$$\bar{x}± t_{n-1,\alpha/2}\left(\frac{s}{\sqrt{n}}\right)$$

Pagkatapos kalkulahin ang lower at upper bounds, makukuha natin ang:

$$1.10 - 2.26 (\frac{0.23}{\sqrt{10}}) = 1.10 - 2.26 (\frac{0.23}{3.16}) = 1.10 - 2.26 × 0.07 = 1.10 - 0.16 = 0.94$$

$$1.10 + 2.26 (\frac{0.23}{\sqrt{10}}) = 1.10 + 2.26 (\frac{0.23}{3.16}) = 1.10 + 2.26 × 0.07 = 1.10 + 0.16 = 1.26$$

Ang ibig sabihin ng resultang ito, makakatiyak tayo nang 95% na ang tunay na average share price para sa stock na ito ay matatagpuan sa loob ng confidence interval na (0.94, 1.26).