Standart Sapma

Ayrık bir veri seti verildiğinde, bu hesaplayıcı bir örnek veya popülasyonun ortalamasını, varyansını ve standart sapmasını hesaplar ve hesaplamaların tüm ara adımlarını gösterir.

Sonuç
Standart Sapma s = 4.5
Varyans s2 = 20.24
Sayım n = 7
Ortalama x̄ = 14.29
Kareler Toplamı SS = 100

Hesaplamanızda bir hata oluştu.

İçindekiler Tablesi

  1. Standart sapma istatistiksel bir ölçüt olarak
  2. Bu hesaplayıcının kullanım kuralları
  3. Bu hesaplayıcının çözümlemek için tasarlandığı problemler
  4. Standart sapma hesaplamak için formüller
  5. Standart Sapma Hesaplama
  6. Bir örneklemin standart sapma hesaplaması örneği
  7. Standart Sapmanın Uygulamaları

Standart Sapma

Standart sapma istatistiksel bir ölçüt olarak

Standart sapma, verilen bir veri setinin istatistiklerini karakterize etmek için en yaygın kullanılan metriklerden biridir. Basit terimlerle standart sapma, veri setinin ne kadar dağılmış olduğunun bir ölçüsüdür. Standart sapmayı hesaplayarak, sayıların ortalamanın yakınında mı yoksa uzağında mı olduğunu öğrenebilirsiniz. Eğer veri noktaları ortalamanın çok uzağında ise, veri setinde büyük bir sapma vardır. Böylece, verilerdeki dağılım ne kadar büyükse, standart sapma o kadar yüksek olur.

Bu hesaplayıcı, verilen bir veri setinin standart sapmasını tanımlar ve hesaplama işlemine dahil olan matematiksel adımları gösterir.

Bu hesaplayıcının kullanım kuralları

Hesaplayıcı, bir ayırıcı ile ayrılmış sayılar listesi şeklinde girdi kabul eder. Aşağıdaki tabloda olası girişlerin birkaç örneği gösterilmektedir.

satır girişi sütun girişi sütun girişi sütun girişi
44, 63, 72, 75, 80, 86, 87, 89 44 44, 44,63,72
44 63 72 75 80 86 87 89 63 63, 75,80
44,, 63,, 72, 75, 80, 86, 87, 89 72 72, 86,87
44 63 72 75, 80, 86, 87, 89 75 75, 89
44; 63; 72, 75,, 80, 86, 87, 89 80 80,
44,,, 63,, 72, 75, 80, 86, 87, 89 86 86,
44 63,, 72,,,, 75, 80, 86, 87, 89 87 87,
89 89,

Sayılar virgül/boşluk/satır sonu veya bunların bir karışımı ile ayrılabilir ve satır veya sütun formatında girilebilir. Yukarıdaki tabloda gösterilen tüm formatlar için, hesaplayıcı girişi 44, 63, 72, 75, 80, 86, 87 ve 89 olarak işler.

Verileri girerken, bunların bir örnek veya popülasyon verisi olup olmadığını seçin ve enter'a basın. Hesaplayıcı, veri setinin beş istatistiksel parametresini gösterir: sayım (gözlem sayısı), ortalama, karelerin toplamı sapması, varyans ve standart sapma.

Bu hesaplayıcının çözümlemek için tasarlandığı problemler

Bu hesaplayıcı, ayrık bir veri setinin standart sapmasını hesaplamak ve hesaplamanın arkasındaki teoriye dair içgörüler sağlamak için tasarlanmıştır.

Veriler, belirli koşullar altında bir deneyde (her türlü) mümkün olan tüm gözlemlerden oluşan bir popülasyonu içerebilir. Birçok durumda, her popülasyon üyesinin örneğini almak imkansızdır.

İstatistiksel uygulamada, daha büyük bir 'popülasyonun' bir alt kümesi ile çalışmak yaygındır, buna 'örnek' denir. Bu, popülasyondaki her bireyden veri toplamak çoğu zaman pratik olmadığı veya imkansız olduğu için yapılır. Örnekten toplanan bilgilere dayanarak popülasyon hakkında tahminlerde bulunur veya çıkarımlarda bulunuruz.

Standart sapma hesaplarken, bir örnek veya tüm popülasyonla uğraşıp uğraşmadığımıza bağlı olarak kullandığımız formül ayarlanır. Bu ayarlama, 'serbestlik derecesi' olarak bilinen bir faktör aracılığıyla yapılır. Bir örnek için, varyansı hesaplarken n yerine n - 1 (n, örnek boyutu olmak üzere) ile böleriz, bu da standart sapmayı bulmak için karesi alınır. Bu düzeltme, popülasyon standart sapmasını tahmin etmek için örnek verileri kullanmamızın gerçeğini telafi eder ve tahminimizin önyargısız olduğundan emin olur.

Standart sapma, bir veri setinin ortalama dağılımını/deviasyonunu/değişkenliğini ortalamaya göre ölçer. Genellikle popülasyon için Yunan harfi σ veya bir örnek için s ile gösterilir. σ veya s değeri ne kadar büyükse, veri noktalarının örnek ortalamasından dağılımı o kadar büyük olur ve tersi de geçerlidir.

Aşağıdaki veri setlerini göz önünde bulundurun.

(Set I)

11, 3, 5, 21, 10, 15, 20, 25, 13, 26, 27

(Set II)

12, 14, 14, 15, 15, 16, 16, 17, 18, 19, 20

Bu veri setlerini hesaplayıcıya yerleştirirsek, I seti için

  • x̄=16 - ortalama değer
  • s=8,3904708 - standart sapma

II seti için

  • x̄=16 - ortalama değer
  • s=2,3664319 - standart sapma

I Setinde, sayılar örnek ortalamasından önemli ölçüde sapmıştır (s=8,39), buna karşın II Setinde değişkenlik küçüktür (s=2,36) I Seti'ne kıyasla.

Standart sapma hesaplamak için formüller

Bu formül, popülasyonun tüm değerleri analiz edildiğinde uygulanır.

$$σ = \sqrt{\frac{\sum_{i=1}^{N}(x_i-μ)^2}{N}}$$

  • σ popülasyonun standart sapmasıdır,
  • xᵢ popülasyonun bir bireysel değeridir,
  • μ popülasyonun aritmetik ortalamasıdır,
  • n popülasyonun büyüklüğüdür.

Aşağıdaki formül, popülasyonun çok büyük bir büyüklüğü olduğunda ve yalnızca örneği analiz için alındığında kullanılır.

$$s = \sqrt{\frac{\sum_{i=1}^{n}(x_i-\bar{x})^2}{n-1}}$$

  • s örneğin standart sapmasıdır,
  • xᵢ bir örnek değerin bireysel değeridir,
  • örneğin ortalamasıdır,
  • n örnek büyüklüğüdür.

Standart Sapma Hesaplama

Standart sapma hesaplamasında aşağıdaki adımlar izlenir.

Adım 1: Örneklem/nüfus ortalamasını hesaplayın. Bu, tüm veri noktalarının toplamının N veya n sayısına bölünmesidir yani

Örneklem ortalaması:

$$\bar{x}=\frac{x₁+x₂+x₃+........+x_n}{n}$$

Nüfus ortalaması:

$$\mu=\frac{x₁+x₂+x₃+........+x_N}{N}$$

Adım 2: Her veri noktasından örneklem/nüfus ortalamasını çıkartarak sapmaları hesaplayın, yani

Örneklem sapmaları:

$$(x₁-\bar{x}), (x₂-\bar{x}), (x₃-\bar{x})…………………… (x_n-\bar{x})$$

Nüfus sapmaları:

$$(x₁-\mu), (x₂-\mu), (x₃-\mu)……………….. (x_N-\mu)$$

Adım 3: Her veri noktası için kare sapmaları hesaplayın.

Örneklem kare sapmaları:

$$(x₁-\bar{x})^2, (x₂-\bar{x})^2, (x₃-\bar{x})^2…………………… (x_n-\bar{x})^2$$

Nüfus kare sapmaları:

$$(x₁-\mu)^2, (x₂-\mu)^2, (x₃-\mu)^2……………….. (x_N-\mu)^2$$

Adım 4: Kare sapmaların toplamını, tüm bireysel kare sapmaları ekleyerek hesaplayın

Örneklem kare sapmaların toplamı:

$$SS=(x₁-\bar{x})^2+ (x₂-\bar{x})^2+(x₃-\bar{x})^2……………………+(x_n-\bar{x})^2$$

Nüfus kare sapmaların toplamı:

$$SS=(x₁-\mu)^2+ (x₂-\mu)^2+(x₃-\mu)^2……………….+ (x_N-\mu)^2$$

Adım 5: Kare sapmaların toplamını serbestlik derecesinin sayısına bölerek varyansı elde edin. Nüfus için N'ye, örneklem için n-1'e bölün.

Örneklem varyansı

$$ s^2 = \frac{\sum_{i=1}^{n}(xᵢ - \bar{x})^2}{n - 1} $$

Nüfus varyansı

$$ \sigma^2 = \frac{\sum_{i=1}^{N}(xᵢ - \mu)^2}{N} $$

Bir örneklem için varyans hesaplanırken, hesaplamalar için şu ifadeyi kullanabileceğimizi düşünebiliriz:

$$\frac{(x-\bar{x})^2}{n}$$

burada

x̄ örneklem ortalaması ve n örneklem büyüklüğüdür. Ancak böyle bir formül kullanılmaz.

Bu ifade, nüfusun varyansının iyi bir tahminini vermez. Genel nüfus çok büyük ve örneklem çok küçük olduğunda, bu formülle hesaplanan varyans, nüfusun varyansını küçümser. Veri eksikliği nedeniyle çok küçük bir varyans gösterir. Bu yüzden n-1 ifadesini kullanarak potansiyel varyans değerini artırırız.

n'ye bölme yerine, n-1'e bölerek örneklemin varyansını buluruz. Bu işlem, gerçek değere daha yakın biraz daha büyük bir varyans değeri verir.

Adım 6: Elde edilen sayının karekökünü çıkarın. Standart sapma, varyansın kareköküdür.

Örneklem standart sapması

$$s=\sqrt{s^2}=\sqrt{\frac{\sum_{i}^{n}{{(x_i-\bar{x})}^2\ }}{n-1}}$$

Nüfus standart sapması

$$\sigma=\sqrt{\sigma^2}=\sqrt{\frac{\sum_{i}^{N}{{(x_i-\mu)}^2\ }}{N}}$$

Bir örneklemin standart sapma hesaplaması örneği

Fizik finalinde n=8 öğrencinin aşağıdaki puanlarını düşünelim:

45, 67, 70, 75, 80, 81, 82 ve 84

Hesap makinesi, örneklemin standart sapmasını aşağıdaki adımları kullanarak hesaplar:

Adım 1: Ortalamayı hesaplayın.

$$\bar{x}=\frac{\sum_{i} x_i}{n}=\frac{45+\ 67+\ 70+\ 75+\ 80+\ 81+\ 82+\ 84}{8}=73$$

Adım 2: Sapmaları hesaplayın

x₁-x̄ x₂-x̄ x₃-x̄ x₄-x̄ x₅-x̄ x₆-x̄ x₇-x̄ x₈-x̄
45-73 67-73 70-73 75-73 80-73 81-73 82-73 84-73
-28 -6 -3 2 7 8 9 11

Adım 3: Sapmaların karelerini hesaplayın

(x₁-x̄)² (x₂-x̄)² (x₃-x̄)² (x₄-x̄)² (x₅-x̄)² (x₆-x̄)² (x₇-x̄)² (x₈-x̄)²
784 36 9 4 49 64 81 121

Adım 4: Kare sapmaların toplamını hesaplayın.

$$SS=\sum_{i}^{n}{{(x_i-\bar{x})}^2=784+36+9+4+49+64+81+121}=1148$$

Adım 5: Kare sapmaların toplamını serbestlik derecesine (n-1) bölerek varyansı hesaplayın. Bu adımda bir nüfus için varyans, N-1 yerine N'ye bölünürdü. Bu durumda, tüm nüfus değil, öğrenci nüfusunun bir kısmı üzerindeki verilere sahip bir örneklemimiz var.

$$s^2=\frac{\sum_{i}^{n}{{(x_i-\bar{x})}^2\ }}{n-1}=\frac{1148}{8-1}=164$$

Adım 6: Standart sapmayı elde etmek için varyansın karekökünü alın.

$$s=\sqrt{s^2}=\sqrt{164}=12,80$$

Standart Sapmanın Uygulamaları

Dağılım ve standart sapma, verilerin dağılımının belirlenmesinde kullanılabilir. Varyans veya standart sapma büyükse, veriler daha çok dağılmış demektir. Bu bilgi, hangi veri setinin daha fazla (en fazla) değişken olduğunu belirlemek için iki (veya daha fazla) veri setinin karşılaştırılmasında faydalıdır.

Endüstride, standart sapma kalite kontrolü için yaygın olarak kullanılmaktadır. Büyük ölçekli üretimde, belirli ürün özelliklerinin hesaplanarak erişilebilen tanımlı bir aralık içinde olması gerekir. Örneğin, somun ve civataların üretiminde, çaplarındaki varyasyon küçük olmalıdır; aksi takdirde, parçalar birbirine uymaz.

Standart sapma, finansta ve birçok başka alanda riski değerlendirmek için kullanılır. Teknik analizde, standart sapma Bollinger çizgileri oluşturmak ve volatiliteyi hesaplamak için kullanılır.

Ayrıca, standart sapma finansta volatilitenin bir ölçüsü olarak, sosyolojide ise kamuoyu yoklamalarında belirsizliği hesaplamaya yardımcı olmak için kullanılır.

Varyans ve standart sapma, belirli bir dağılım aralığı içinde kaç veri değerinin düştüğünü belirlemek için kullanılır. Örneğin, Çebişev teoremi, herhangi bir dağılım için, veri değerlerinin en az %75'inin ortalamanın 2 standart sapması içinde olacağını gösterir.

İklimle ilgili basit bir örnek alalım. Aynı bölgedeki iki şehrin günlük sıcaklığını incelediğimizi varsayalım. Bir şehir kıyıda, diğeri ise içeride yer alıyor. Bu iki şehirdeki ortalama maksimum günlük sıcaklık aynı olabilir. Ancak, maksimum günlük sıcaklıkların yayılımı, yani standart sapması, kıtada bulunan şehir için daha büyük, kıyı şehri için ise maksimum günlük sıcaklıkların standart sapması daha küçük olacaktır.

Bu, kıta şehrinin, bir yılın herhangi bir gününde maksimum hava sıcaklığında kıyı şehrine göre daha fazla değişim göstereceği anlamına gelir. Yani, kıyı şehri daha ılıman bir iklime sahip olacaktır.