सांख्यिकी कैलकुलेटर
वेरीयंस कैलकुलेटर


वेरीयंस कैलकुलेटर

हमारे वेरीयंस कैलकुलेटर के साथ सैंपल और जनसंख्या डेटा के लिए माध्य, विचरण और मानक विचलन की सटीक गणना करें। स्टेप-बाय-स्टेप समाधान के साथ आसान और तेज़।

नमूना जनसंख्या
विचरण σ2 = 28.5 s2 = 24.9375
मानक विचलन σ = 5.3385 s = 4.9937
गिनती n = 8 n = 8
माध्य μ = 18.25 x̄ = 18.25
वर्गों का योग SS = 199.5 SS = 199.5

आपकी गणना में त्रुटि थी।

विषय सूची

  1. परिवर्तनशीलता (Variability) के माप के रूप में वेरिएंस (Variance)
  2. इस वेरिएंस कैलकुलेटर का उपयोग कैसे करें?
  3. वेरिएंस का सूत्र (Variance Formula): जनसंख्या बनाम नमूना वेरिएंस
    1. जनसंख्या वेरिएंस (Population Variance)
    2. नमूना वेरिएंस (Sample Variance)
  4. वेरिएंस (Variance) की गणना करने के चरण
  5. नमूना वेरिएंस की गणना का एक उदाहरण
  6. वेरिएंस (Variance) का महत्व और उपयोग

वेरीयंस कैलकुलेटर

परिवर्तनशीलता (Variability) के माप के रूप में वेरिएंस (Variance)

किसी दिए गए डेटा सेट के सांख्यिकीय विश्लेषण (Statistical Analysis) के सबसे मूलभूत पहलुओं में से एक वह मीट्रिक है, जो डेटा के माध्य (Mean) से उसकी परिवर्तनशीलता या फैलाव को मापता है। इस फैलाव को मापने के लिए सबसे अधिक इस्तेमाल की जाने वाली मीट्रिक निम्नलिखित हैं:

  • वेरिएंस (Variance): इसे माध्य (Mean) से वर्गित विचलन (Squared Deviations) के औसत के रूप में परिभाषित किया जाता है।
  • मानक विचलन (Standard Deviation): यह वेरिएंस का वर्गमूल (Square root) होता है। डेटा के फैलाव या परिवर्तनशीलता को मापने के लिए यह सबसे लोकप्रिय मीट्रिक है।
  • भिन्नता का गुणांक (Coefficient of Variation): इसे सापेक्ष मानक विचलन (Relative Standard Deviation) के रूप में भी जाना जाता है। इसकी गणना मानक विचलन σ और माध्य μ के अनुपात के रूप में की जाती है: \$(C_v=\frac{σ}{μ})\$।

हमारा वेरिएंस कैलकुलेटर (Variance Calculator) किसी भी दिए गए डेटा सेट का वेरिएंस आसानी से निकालता है और गणना में शामिल सभी चरणों को विस्तार से प्रदर्शित करता है।

इस वेरिएंस कैलकुलेटर का उपयोग कैसे करें?

यह कैलकुलेटर इनपुट के रूप में संख्याओं को स्वीकार करता है जिन्हें विभिन्न सीमांककों (Delimiters) द्वारा अलग किया गया हो। नीचे दी गई तालिका संभावित इनपुट प्रारूपों के कुछ उदाहरण दिखाती है:

पंक्ति इनपुट कॉलम इनपुट कॉलम इनपुट कॉलम इनपुट
44, 63, 72, 75, 80, 86, 87, 89 44 44, 44,63,72
44 63 72 75 80 86 87 89 63 63, 75,80
44,, 63,, 72, 75, 80, 86, 87, 89 72 72, 86,87
44 63 72 75, 80, 86, 87, 89 75 75, 89
44; 63; 72, 75,, 80, 86, 87, 89 80 80,
44,,, 63,, 72, 75, 80, 86, 87, 89 86 86,
44 63,, 72,,,, 75, 80, 86, 87, 89 87 87,
89 89,

संख्याओं को अलग करने के लिए अल्पविराम (Comma), रिक्त स्थान (Space), रेखा विराम (Line break) या इनके किसी भी संयोजन का उपयोग किया जा सकता है। आप अपनी सुविधा के अनुसार पंक्ति (Row) या स्तंभ (Column) प्रारूप का उपयोग कर सकते हैं। कैलकुलेटर उपरोक्त तालिका में दिखाए गए सभी प्रारूपों को '44, 63, 72, 75, 80, 86, 87 और 89' के रूप में ही प्रोसेस करेगा।

डेटा दर्ज करने के बाद, आप यह चुन सकते हैं कि आपका डेटा नमूना (Sample) डेटा है या जनसंख्या (Population) डेटा। जब आप 'कैलकुलेट' बटन दबाते हैं, तो कैलकुलेटर डेटासेट के पांच सांख्यिकीय पैरामीटर प्रदर्शित करता है: गणना (अवलोकनों की संख्या), माध्य (Mean), वर्गित विचलनों का योग (Sum of Squared Deviations), वेरिएंस (Variance) और मानक विचलन (Standard Deviation)।

इस कैलकुलेटर का प्राथमिक उद्देश्य डेटा सेट के वेरिएंस की सटीक गणना करना है। इसके साथ ही, यह गणना के पीछे के गणितीय सिद्धांतों को समझने में मदद करता है और इसमें शामिल सभी चरणों को स्पष्ट रूप से दिखाता है।

सांख्यिकी में बेहतर और सटीक अनुमान प्राप्त करने के लिए बड़े डेटा सेट का उपयोग करना हमेशा उचित होता है। हालांकि, पूरी "जनसंख्या (Population)" का डेटा प्राप्त करना अक्सर मुश्किल होता है, जिसमें सभी संभावित अवलोकन शामिल हों। इसलिए, आमतौर पर जनसंख्या का प्रतिनिधित्व करने के लिए एक "नमूना (Sample)" लिया जाता है। इसी नमूना डेटा के आधार पर पूरी जनसंख्या के बारे में निष्कर्ष निकाले जाते हैं।

वेरिएंस यह मापता है कि कोई डेटा सेट अपने माध्य के सापेक्ष कितना फैला हुआ है। जनसंख्या वेरिएंस को आमतौर पर σ² और नमूना वेरिएंस को द्वारा दर्शाया जाता है। σ² या का बड़ा मान यह दर्शाता है कि डेटा बिंदु माध्य से काफी दूर (फैले हुए) हैं, और इसके विपरीत, छोटा मान कम फैलाव को दर्शाता है।

आइए निम्नलिखित डेटा सेटों के उदाहरण पर विचार करें:

(सेट I) 11, 3, 5, 21, 10, 15, 20, 25, 13, 26, 27,

(सेट II) 12, 14, 14, 15, 15, 16, 16, 17, 18, 19, 20

सेट I का डेटा वेरिएंस कैलकुलेटर में दर्ज करने पर प्राप्त परिणाम:

n=11

x̄=16

SS=704

s²=70.4

s=8.39

एक नमूने (Sample) के लिए, और

n=11

μ=16

SS=704

σ²=64

σ=8

एक जनसंख्या (Population) के लिए।

इसी तरह, सेट II का डेटा कैलकुलेटर में दर्ज करने पर प्राप्त परिणाम:

n=11

x̄=16

SS=56

s²=5.6

s=2.36

एक नमूने (Sample) के लिए, और

n=11

μ=16

SS=56

σ²=5.09

σ=2.25

एक जनसंख्या (Population) के लिए।

  • सेट I में, संख्याएं अपने माध्य (Mean) से काफी अधिक विचलित होती हैं:

s²=70.4

σ²=64

  • सेट II में, यह परिवर्तनशीलता (फैलाव) बहुत कम है:

s²=5.6

σ²=5.09

वेरिएंस का सूत्र (Variance Formula): जनसंख्या बनाम नमूना वेरिएंस

जनसंख्या वेरिएंस (Population Variance)

सांख्यिकी में 'जनसंख्या' का अर्थ किसी प्रयोग में शामिल सभी संभावित अवलोकनों से है। N अवलोकनों के लिए, जनसंख्या वेरिएंस का सूत्र है:

$$\sigma^2=\frac{\sum_{i}^{N}{{(x_i-\ \mu)}^2\ }}{N}$$

जहाँ:

  • σ² जनसंख्या वेरिएंस है,
  • Σ योग (Sum) को दर्शाता है,
  • xᵢ प्रत्येक अवलोकन है,
  • μ जनसंख्या का माध्य (Mean) है,
  • N जनसंख्या में अवलोकनों की कुल संख्या है।

नमूना वेरिएंस (Sample Variance)

नमूना वेरिएंस को इस प्रकार परिभाषित किया गया है:

$$s^2=\frac{\sum_{i}^{n}{{(x_i-\ \bar{x})}^2\ }}{n-1}$$

जहाँ:

  • नमूना वेरिएंस है,
  • Σ योग (Sum) को दर्शाता है,
  • xᵢ प्रत्येक अवलोकन है,
  • नमूने का माध्य (Mean) है,
  • n नमूने में अवलोकनों की संख्या है।

वेरिएंस (Variance) की गणना करने के चरण

वेरिएंस की गणना में निम्नलिखित व्यवस्थित चरण शामिल हैं:

चरण 1: नमूना/जनसंख्या का माध्य (Mean) निकालें। यह सभी डेटा बिंदुओं का योग होता है जिसे डेटा बिंदुओं की कुल संख्या (नमूने के लिए n और जनसंख्या के लिए N) से विभाजित किया जाता है, अर्थात:

नमूना माध्य:

$$\bar{x}=\frac{\sum_{i=1}^{n} x_i}{n}$$

जनसंख्या माध्य:

$$\mu=\frac{\sum_{i=1}^{N} x_i}{N}$$

चरण 2: प्रत्येक डेटा बिंदु से नमूने/जनसंख्या के माध्य को घटाकर विचलन (Deviations) की गणना करें, अर्थात:

नमूना विचलन:

$$(x_1-\bar{x}), (x_2-\bar{x}), (x_3-\bar{x}), \ldots, (x_n-\bar{x})$$

जनसंख्या विचलन:

$$(x_1-\mu), (x_2-\mu), (x_3-\mu), \ldots, (x_N-\mu)$$

चरण 3: प्रत्येक डेटा बिंदु के वर्गित विचलन (Squared Deviations) की गणना करें।

नमूना वर्गित विचलन:

$$(x_1-\bar{x})^2, (x_2-\bar{x})^2, (x_3-\bar{x})^2, \ldots, (x_n-\bar{x})^2$$

जनसंख्या वर्गित विचलन:

$$(x_1-\mu)^2, (x_2-\mu)^2, (x_3-\mu)^2, \ldots, (x_N-\mu)^2$$

चरण 4: इन वर्गित विचलनों का योग (Sum of Squared Deviations) निकालें।

नमूना वर्गित विचलनों का योग:

$$SS=\sum_{i=1}^{n}(x_i-\bar{x})^2$$

जनसंख्या वर्गित विचलनों का योग:

$$SS=\sum_{i=1}^{N}(x_i-\mu)^2$$

चरण 5: वेरिएंस की गणना करने के लिए, वर्गित विचलनों के योग को नमूने (Sample) के मामले में \$ n-1 \$ से, और जनसंख्या (Population) के मामले में \$ N \$ से विभाजित करें।

नमूना वेरिएंस:

$$s^2=\frac{SS}{n-1}$$

जनसंख्या वेरिएंस:

$$\sigma^2=\frac{SS}{N}$$

नमूना वेरिएंस की गणना का एक उदाहरण

आइए एक सरल डेटा सेट पर विचार करें: 1, 2, 4, 5, 6, और 12। इस नमूने का वेरिएंस (Sample Variance) निकालने के लिए, हम इन चरणों का पालन करेंगे:

चरण 1: नमूना माध्य (Average/Mean) की गणना करें।

$$\bar{x}=\frac{1+2+4+5+6+12}{6}=\frac{30}{6}=5$$

चरण 2: प्रत्येक डेटा बिंदु के लिए माध्य से विचलन की गणना करें।

x₁-x̄ x₂-x̄ x₃-x̄ x₄-x̄ x₅-x̄ x₆-x̄
1 - 5 2 - 5 4 - 5 5 - 5 6 - 5 12 - 5
-4 -3 -1 0 1 7

चरण 3: विचलनों के वर्गों (Squares) की गणना करें।

(x₁-x̄)² (x₂-x̄)² (x₃-x̄)² (x₄-x̄)² (x₅-x̄)² (x₆-x̄)²
16 9 1 0 1 49

चरण 4: विचलनों के वर्गों का योग करें।

$$SS=\sum_{i=1}^{n}{(x_i-\bar{x})}^2=16+9+1+0+1+49=76$$

चरण 5: विचलनों के वर्गों के योग को स्वतंत्रता की डिग्री / Degrees of Freedom (n-1) से विभाजित करके नमूना वेरिएंस की गणना करें।

$$s^2=\frac{SS}{n-1}=\frac{76}{6-1}=\frac{76}{5}=15.2$$

यदि यह एक जनसंख्या (Population) डेटा होता, तो हम n-1 के बजाय N (डेटा बिंदुओं की कुल संख्या) से विभाजित करके जनसंख्या वेरिएंस की गणना करते।

वेरिएंस (Variance) का महत्व और उपयोग

वित्त और निवेश: परिसंपत्ति प्रबंधक (Asset Managers) और निवेशक अपने निवेश पोर्टफोलियो के प्रदर्शन को अनुकूलित करने के लिए डेटा के फैलाव का उपयोग करते हैं। वित्तीय विश्लेषक पोर्टफोलियो में शामिल व्यक्तिगत शेयरों के जोखिम और प्रदर्शन का मूल्यांकन करने के लिए वेरिएंस का उपयोग करते हैं।

किसी नए निवेश पर विचार करते समय, निवेशक वेरिएंस की गणना करके यह निर्धारित करते हैं कि वह निवेश जोखिम लेने लायक है या नहीं। वेरिएंस और मानक विचलन के बिना बाजार की अनिश्चितता और जोखिम को मापना बहुत मुश्किल होता है।

यद्यपि अनिश्चितता को सीधे मापा नहीं जा सकता, लेकिन वेरिएंस और मानक विचलन (वेरिएंस का वर्गमूल) यह निर्धारित करने में मदद करते हैं कि किसी शेयर का पूरे पोर्टफोलियो के जोखिम पर क्या प्रभाव पड़ सकता है।

विज्ञान और सांख्यिकी: वेरिएंस का उपयोग वैज्ञानिकों, सांख्यिकीविदों, गणितज्ञों और डेटा विश्लेषकों द्वारा व्यापक रूप से किया जाता है। यह किसी प्रयोग या नमूना आबादी (Sample Population) के बारे में अत्यंत उपयोगी अंतर्दृष्टि प्रदान करता है।

वैज्ञानिक परीक्षण समूहों के बीच अंतर खोजने के लिए इसका उपयोग करते हैं, ताकि यह देखा जा सके कि क्या वे किसी परिकल्पना (Hypothesis) का सफलतापूर्वक परीक्षण करने के लिए उपयुक्त हैं। डेटा सेट में मान जितना अधिक बिखरा होगा, उसका वेरिएंस उतना ही अधिक होगा। डेटा वैज्ञानिक इस जानकारी का उपयोग यह समझने के लिए करते हैं कि माध्य (Mean) पूरे डेटा सेट का कितना सटीक प्रतिनिधित्व कर रहा है।

वेरिएंस की सीमाएँ: वेरिएंस का उपयोग करने का एक मुख्य नुकसान यह है कि डेटा सेट में मौजूद बड़े आउटलेयर (Outliers - असामान्य मान) परिणामों को विकृत कर सकते हैं। ऐसा इसलिए होता है क्योंकि गणना करते समय विचलनों का वर्ग (Square) किया जाता है, जिससे आउटलेयर का प्रभाव और भी अधिक बढ़ जाता है।

यही कारण है कि कई शोधकर्ता वेरिएंस के बजाय मानक विचलन (Standard Deviation) के साथ काम करना पसंद करते हैं, जो वेरिएंस का वर्गमूल होता है। मानक विचलन आउटलेर्स से कम प्रभावित होता है, इसकी इकाई मूल डेटा के समान होती है, और इसे समझना कहीं अधिक आसान होता है।