सांख्यिकी कैलकुलेटर
स्टैण्डर्ड डेविएशन कैलकुलेटर


स्टैण्डर्ड डेविएशन कैलकुलेटर

मुफ्त स्टैण्डर्ड डेविएशन कैलकुलेटर का उपयोग करके अपने डेटा सेट के माध्य, वेरीयंस और मानक विचलन की सटीक गणना करें। स्टेप-बाय-स्टेप समाधान आसानी से प्राप्त करें।

परिणाम
मानक विचलन s = 4.5
विचरण s2 = 20.24
गणना n = 7
माध्य x̄ = 14.29
वर्गों का योग SS = 100

आपकी गणना में त्रुटि थी।

विषय सूची

  1. सांख्यिकीय माप के रूप में मानक विचलन (Standard Deviation)
  2. इस कैलकुलेटर का उपयोग कैसे करें
  3. यह कैलकुलेटर कैसे काम करता है?
  4. मानक विचलन की गणना के लिए सूत्र
  5. मानक विचलन की गणना के चरण
  6. नमूने के मानक विचलन की गणना का उदाहरण
  7. मानक विचलन के प्रमुख अनुप्रयोग

स्टैण्डर्ड डेविएशन कैलकुलेटर

सांख्यिकीय माप के रूप में मानक विचलन (Standard Deviation)

किसी दिए गए डेटा सेट के सांख्यिकीय गुणों (Statistics) को परिभाषित करने के लिए सबसे अधिक उपयोग की जाने वाली मीट्रिक मानक विचलन (Standard Deviation) है। सरल शब्दों में कहें तो, मानक विचलन यह मापता है कि आपका डेटा सेट कितना फैला हुआ है या उसमें कितना बिखराव है। इस मीट्रिक का उपयोग यह निर्धारित करने के लिए किया जाता है कि संख्याएँ अपने माध्य (Mean) के कितने करीब या दूर हैं। यदि डेटा बिंदु माध्य से बहुत दूर हैं, तो डेटा सेट में एक बड़ा विचलन (Deviation) होता है। अतः मानक विचलन जितना अधिक होगा, डेटा में बिखराव (Dispersion) उतना ही अधिक होगा।

हमारा यह ऑनलाइन मानक विचलन कैलकुलेटर (Standard Deviation Calculator) किसी भी दिए गए डेटा सेट के लिए मानक विचलन की सटीक गणना करता है और इसमें शामिल सभी गणितीय चरणों को विस्तार से प्रदर्शित करता है।

इस कैलकुलेटर का उपयोग कैसे करें

यह कैलकुलेटर इनपुट के रूप में संख्याओं की एक शृंखला को स्वीकार करता है जिन्हें किसी भी डेलिमिटर (सीमांकक) द्वारा अलग किया जा सकता है। नीचे दी गई तालिका संभावित इनपुट स्वरूपों के कुछ उदाहरण दिखाती है:

पंक्ति इनपुट कॉलम इनपुट कॉलम इनपुट कॉलम इनपुट
44, 63, 72, 75, 80, 86, 87, 89 44 44, 44,63,72
44 63 72 75 80 86 87 89 63 63, 75,80
44,, 63,, 72, 75, 80, 86, 87, 89 72 72, 86,87
44 63 72 75, 80, 86, 87, 89 75 75, 89
44; 63; 72, 75,, 80, 86, 87, 89 80 80,
44,,, 63,, 72, 75, 80, 86, 87, 89 86 86,
44 63,, 72,,,, 75, 80, 86, 87, 89 87 87,
89 89,

संख्याओं को अल्पविराम (Comma), स्पेस, लाइन ब्रेक या इनके मिश्रण से अलग किया जा सकता है, और इन्हें पंक्ति (Row) या कॉलम (Column) प्रारूप में दर्ज किया जा सकता है। उपरोक्त तालिका में दिखाए गए सभी प्रारूपों के लिए, यह कैलकुलेटर इनपुट को 44, 63, 72, 75, 80, 86, 87 और 89 के रूप में ही संसाधित करता है।

डेटा दर्ज करने के बाद, यह चुनें कि दिया गया डेटा एक 'नमूना' (Sample) है या 'संपूर्ण जनसंख्या' (Population) और फिर 'एंटर' (Enter) दबाएं। कैलकुलेटर द्वारा डेटासेट के सभी प्रमुख सांख्यिकीय पैरामीटर प्रदर्शित किए जाएंगे: गणना (अवलोकनों की संख्या), माध्य (Mean), वर्ग विचलनों का योग (Sum of squared deviations), प्रसरण (Variance) और मानक विचलन (Standard Deviation)।

यह कैलकुलेटर कैसे काम करता है?

यह कैलकुलेटर एक असतत (Discrete) डेटा सेट के मानक विचलन की गणना करता है और इस गणना के पीछे के सिद्धांत को स्पष्ट करता है।

कोई डेटा निर्दिष्ट शर्तों के तहत किसी प्रयोग (किसी भी प्रकार के) के सभी संभावित अवलोकनों की 'संपूर्ण जनसंख्या' (Population) हो सकता है। हालाँकि, जनसंख्या के प्रत्येक सदस्य का डेटा या नमूना एकत्र करना अक्सर असंभव होता है।

सांख्यिकी (Statistics) में, यह एक सामान्य बात है कि हम एक बड़ी 'जनसंख्या' के एक छोटे उपसमुच्चय (Subset) के साथ काम करते हैं, जिसे 'नमूना' (Sample) कहा जाता है। ऐसा इसलिए है क्योंकि जनसंख्या में हर एक व्यक्ति से डेटा एकत्र करना अक्सर अव्यावहारिक या असंभव होता है। हम इस नमूने से एकत्रित की गई जानकारी के आधार पर ही पूरी जनसंख्या के बारे में अनुमान या निष्कर्ष निकालते हैं।

मानक विचलन की गणना करते समय, उपयोग किया जाने वाला सूत्र इस बात पर निर्भर करता है कि हम किसी नमूने (Sample) के साथ काम कर रहे हैं या संपूर्ण जनसंख्या (Population) के साथ। यह समायोजन 'स्वतंत्रता की कोटि' (Degrees of Freedom) नामक कारक के माध्यम से किया जाता है। नमूने (Sample) के लिए प्रसरण की गणना करते समय, हम विचलन को n के बजाय n - 1 (जहाँ n नमूने का आकार है) से विभाजित करते हैं, और फिर मानक विचलन प्राप्त करने के लिए उसका वर्गमूल निकालते हैं। यह सुधार इस तथ्य की भरपाई करता है कि हम जनसंख्या के मानक विचलन का अनुमान लगाने के लिए नमूने के डेटा का उपयोग कर रहे हैं, जिससे यह सुनिश्चित होता है कि हमारा अनुमान निष्पक्ष (Unbiased) है।

डेटा सेट का मानक विचलन माध्य के सापेक्ष इसके औसत फैलाव या परिवर्तनशीलता को मापता है। जनसंख्या के लिए इसे आमतौर पर ग्रीक अक्षर σ (सिग्मा) द्वारा और नमूने के लिए s द्वारा दर्शाया जाता है। उच्च σ या s मान यह दर्शाता है कि डेटा बिंदु नमूना माध्य से अधिक फैले हुए हैं, और इसके विपरीत।

निम्नलिखित डेटा सेट उदाहरणों पर विचार करें:

(सेट I)

11, 3, 5, 21, 10, 15, 20, 25, 13, 26, 27

(सेट II)

12, 14, 14, 15, 15, 16, 16, 17, 18, 19, 20

इन डेटा सेटों को कैलकुलेटर में दर्ज करने पर, हमें सेट I के लिए प्राप्त होता है:

  • x̄=16 - माध्य (Mean)
  • s=8.3904708 - मानक विचलन

सेट II के लिए:

  • x̄=16 - माध्य (Mean)
  • s=2.3664319 - मानक विचलन

सेट I में, संख्याएं नमूना माध्य से काफी अधिक विचलित होती हैं (s=8.39), जबकि सेट II में सेट I की तुलना में परिवर्तनशीलता या फैलाव बहुत कम (s=2.36) है।

मानक विचलन की गणना के लिए सूत्र

यह सूत्र तब लागू होता है जब जनसंख्या (Population) के सभी मूल्यों का विश्लेषण किया जाता है:

$$σ = \sqrt{\frac{\sum_{i=1}^{N}(x_i-μ)^2}{N}}$$

  • σ जनसंख्या का मानक विचलन है,
  • xᵢ जनसंख्या के व्यक्तिगत डेटा बिंदु का मान है,
  • μ जनसंख्या का अंकगणितीय माध्य (Mean) है,
  • N जनसंख्या का कुल आकार है।

जब जनसंख्या बहुत बड़ी हो और विश्लेषण के लिए केवल एक नमूना (Sample) लिया गया हो, तो नीचे दिए गए सूत्र का उपयोग किया जाता है:

$$s = \sqrt{\frac{\sum_{i=1}^{n}(x_i-\bar{x})^2}{n-1}}$$

  • s नमूने का मानक विचलन है,
  • xᵢ नमूने के व्यक्तिगत डेटा बिंदु का मान है,
  • नमूने का माध्य (Mean) है,
  • n नमूने का आकार है।

मानक विचलन की गणना के चरण

मानक विचलन की गणना में निम्नलिखित चरण शामिल हैं:

चरण 1: नमूना/जनसंख्या के माध्य (Mean) की गणना करें। इसके लिए सभी डेटा बिंदुओं के योग को N या n की संख्या से विभाजित किया जाता है, अर्थात:

नमूना माध्य:

$$\bar{x}=\frac{x₁+x₂+x_3+........+x_n}{n}$$

जनसंख्या माध्य:

$$\mu=\frac{x₁+x₂+x_3+........+x_N}{N}$$

चरण 2: प्रत्येक डेटा बिंदु से नमूना/जनसंख्या माध्य को घटाकर विचलन (Deviation) की गणना करें, अर्थात:

नमूना विचलन:

$$(x₁-\bar{x}), (x₂-\bar{x}), (x_3-\bar{x})…………………… (x_n-\bar{x})$$

जनसंख्या विचलन:

$$(x₁-\ \mu), (x₂-\ \mu), (x_3-\ \mu)……………….. (x_N-\ \mu)$$

चरण 3: प्रत्येक डेटा बिंदु के लिए वर्ग विचलन (Squared Deviation) की गणना करें।

नमूना वर्ग विचलन:

$$(x₁-\bar{x})^2, (x₂-\bar{x})^2, (x_3-\bar{x})^2…………………… (x_n-\bar{x})^2$$

जनसंख्या वर्ग विचलन:

$$(x₁-\ \mu)^2, (x₂-\ \mu)^2, (x_3-\ \mu)^2……………….. (x_N-\ \mu)^2$$

चरण 4: सभी अलग-अलग वर्ग विचलनों को जोड़कर 'वर्ग विचलनों का योग' (Sum of Squared Deviations) निकालें।

नमूने के वर्ग विचलनों का योग:

$$SS=(x₁-\bar{x})^2+ (x₂-\bar{x})^2+(x_3-\bar{x})^2……………………+(x_n-\bar{x})^2$$

जनसंख्या के वर्ग विचलनों का योग:

$$SS=(x₁-\ \mu)^2+ (x₂-\ \mu)^2+(x_3-\ \mu)^2……………….+ (x_N-\ \mu)^2$$

चरण 5: प्रसरण (Variance) प्राप्त करने के लिए वर्ग विचलनों के योग को 'स्वतंत्रता की कोटि' (Degrees of Freedom) की संख्या से विभाजित करें। जनसंख्या के लिए, N से विभाजित करें, और एक नमूने के लिए, n-1 से विभाजित करें।

नमूने का प्रसरण:

$$ s^2 = \frac{\sum_{i=1}^{n}(x_i - \bar{x})^2}{n - 1} $$

जनसंख्या का प्रसरण:

$$ \sigma^2 = \frac{\sum_{i=1}^{N}(x_i - \mu)^2}{N} $$

एक नमूने के लिए प्रसरण की गणना करते समय, हम मान सकते हैं कि हम इस व्यंजक का उपयोग करेंगे:

$$\frac{(x-\bar{x})^2}{n}$$

जहां:

x̄ नमूना माध्य है और n नमूना आकार है। लेकिन अभ्यास में इस फॉर्मूले का इस्तेमाल नहीं किया जाता है।

इस तरह का व्यंजक जनसंख्या के प्रसरण का सटीक अनुमान प्रदान नहीं करेगा। जब जनसंख्या बहुत बड़ी हो और नमूना बहुत छोटा हो, तो इस सूत्र द्वारा परिकलित प्रसरण, वास्तविक जनसंख्या प्रसरण से कम आंका जाएगा। डेटा की कमी के कारण, यह बहुत छोटा प्रसरण दिखाएगा। इसलिए, हम n-1 का उपयोग करके संभावित प्रसरण मान को बढ़ाते हैं (Bessel's correction)।

n से विभाजित करने के बजाय, हम n-1 से विभाजित करके नमूने का प्रसरण पाते हैं। यह संक्रिया वास्तविक मूल्य के करीब थोड़ा बड़ा प्रसरण मान देती है।

चरण 6: परिणामी संख्या का वर्गमूल (Square Root) निकालें। मानक विचलन हमेशा प्रसरण का वर्गमूल होता है।

नमूना मानक विचलन:

$$s=\sqrt{s^2}=\sqrt{\frac{\sum_{i}^{n}{{(x_i-\ \bar{x})}^2\ }}{n-1}}$$

जनसंख्या मानक विचलन:

$$\sigma=\sqrt{\sigma^2}=\sqrt{\frac{\sum_{i}^{N}{{(x_i-\ \mu)}^2\ }}{N}}$$

नमूने के मानक विचलन की गणना का उदाहरण

आइए हम भौतिक विज्ञान की अंतिम परीक्षा में n=8 छात्रों द्वारा प्राप्त किए गए निम्नलिखित अंकों पर विचार करें:

45, 67, 70, 75, 80, 81, 82 और 84

कैलकुलेटर निम्नलिखित चरणों का उपयोग करके इस नमूने के मानक विचलन की गणना करता है:

चरण 1: माध्य (Mean) की गणना करें।

$$\bar{x}=\frac{\sum_{i} x_i}{n}=\frac{45+\ 67+\ 70+\ 75+\ 80+\ 81+\ 82+\ 84}{8}=73$$

चरण 2: विचलन की गणना करें।

x₁-x̄ x₂-x̄ x₃-x̄ x₄-x̄ x₅-x̄ x₆-x̄ x₇-x̄ x₈-x̄
45-73 67-73 70-73 75-73 80-73 81-73 82-73 84-73
-28 -6 -3 2 7 8 9 11

चरण 3: विचलनों के वर्गों की गणना करें।

(x₁-x̄)² (x₂-x̄)² (x₃-x̄)² (x₄-x̄)² (x₅-x̄)² (x₆-x̄)² (x₇-x̄)² (x₈-x̄)²
784 36 9 4 49 64 81 121

चरण 4: वर्ग विचलनों का योग करें।

$$SS=\sum_{i}^{n}{{(x_i-\ \bar{x})}^2=784+36+9+4+49+64+81+121}=1148$$

चरण 5: वर्ग विचलनों के योग को स्वतंत्रता की कोटि (n-1) से विभाजित करके प्रसरण की गणना करें। जनसंख्या के लिए, इस चरण में प्रसरण को N-1 के बजाय N से विभाजित किया जाएगा। इस मामले में, हमारे पास एक नमूना है, यानी छात्र जनसंख्या के एक छोटे हिस्से का डेटा, पूरी जनसंख्या का नहीं।

$$s^2=\ \frac{\sum_{i}^{n}{{(x_i-\ \bar{x})}^2\ }}{n-1}=\frac{1148}{8-1}=164$$

चरण 6: मानक विचलन प्राप्त करने के लिए प्रसरण का वर्गमूल लें।

$$s=\sqrt{s^2}=\ \sqrt{164}=12.80$$

मानक विचलन के प्रमुख अनुप्रयोग

डेटा के फैलाव को प्रसरण (Variance) और मानक विचलन का उपयोग करके मापा जा सकता है। यदि प्रसरण या मानक विचलन बड़ा है, तो इसका अर्थ है कि डेटा अधिक बिखरा हुआ है। दो (या अधिक) डेटासेट की तुलना करते समय, यह जानकारी यह निर्धारित करने में अत्यंत उपयोगी होती है कि कौन सा डेटासेट अधिक परिवर्तनशील (Variable) है।

गुणवत्ता नियंत्रण (Quality Control) के लिए औद्योगिक क्षेत्र में मानक विचलन का व्यापक रूप से उपयोग किया जाता है। बड़े पैमाने पर उत्पादन में उत्पाद की कुछ विशेषताओं को एक परिभाषित सीमा के भीतर होना चाहिए, जिसे मानक विचलन की गणना करके निर्धारित किया जा सकता है। उदाहरण के लिए, नट और बोल्ट के निर्माण में, व्यास में भिन्नता बहुत छोटी होनी चाहिए; अन्यथा, पुर्जे एक साथ फिट नहीं होंगे।

वित्त (Finance) और कई अन्य क्षेत्रों में जोखिम का आकलन करने के लिए मानक विचलन का उपयोग किया जाता है। तकनीकी विश्लेषण (Technical Analysis) में बोलिंगर बैंड (Bollinger Bands) बनाने और बाजार की अस्थिरता की गणना करने के लिए मानक विचलन का प्रयोग किया जाता है।

इसके अलावा, वित्त में मानक विचलन का उपयोग निवेश की अस्थिरता के माप के रूप में किया जाता है, और समाजशास्त्र (Sociology) में जनमत सर्वेक्षणों में त्रुटि की सीमा या अनिश्चितता की गणना करने में इसका उपयोग किया जाता है।

प्रसरण और मानक विचलन का उपयोग यह पता लगाने के लिए भी किया जाता है कि किसी दिए गए वितरण अंतराल में कितने डेटा मान आते हैं। उदाहरण के लिए, चेबीशेव का प्रमेय (Chebyshev's Theorem) कहता है कि किसी भी डेटा वितरण के लिए, कम से कम 75% डेटा मान माध्य के 2 मानक विचलन के भीतर ही होंगे।

आइए एक उदाहरण के रूप में मौसम को देखें। मान लें कि हम एक ही क्षेत्र के दो शहरों के दैनिक तापमान का विश्लेषण करते हैं। एक शहर समुद्र तट पर है, जबकि दूसरा मुख्य भूमि (अंतर्देशीय) पर है। इन दोनों शहरों में औसत अधिकतम दैनिक तापमान समान हो सकता है। हालांकि, महाद्वीप पर स्थित शहर के लिए मानक विचलन (अधिकतम दैनिक तापमान का प्रसार) अधिक होगा, जबकि तटीय शहर के लिए अधिकतम दैनिक तापमान का मानक विचलन छोटा होगा।

इसका सीधा मतलब यह है कि एक अंतर्देशीय शहर का अधिकतम तापमान वर्ष के किसी भी दिन तटीय शहर की तुलना में अधिक बदल सकता है। अर्थात्, तटीय शहर में मौसम आमतौर पर अधिक सुहावना और स्थिर रहेगा।