सांख्यिकी कैलकुलेटर
वेरीयंस कैलकुलेटर

वेरीयंस कैलकुलेटर

एक सैंपल या जनसंख्या का प्रतिनिधित्व करने वाले असतत डेटा सेट को देखते हुए, कैलकुलेटर मिन(माध्य), वेरीयंस (विचरण) और स्टैण्डर्ड डेविएशन (विचलन) की गणना करता है और गणना में शामिल वर्कफ़्लो को प्रदर्शित करता है।

नमूना जनसंख्या
झगड़ा σ2 = 28.5 s2 = 24.9375
मानक विचलन σ = 5.3385 s = 4.9937
गिनती करना n = 8 n = 8
अर्थ μ = 18.25 x̄ = 18.25
वर्गों का योग SS = 199.5 SS = 199.5

आपकी गणना में त्रुटि हुई थी।

विषयसूची

  1. परिवर्तनशीलता माप के रूप में वेरियंस
  2. इस कैलकुलेटर का उपयोग करने के नियम
  3. वेरियंस का सूत्र: जनसंख्या वेरियंस बनाम सैंपल वेरियंस
    1. जनसंख्या भिन्नता
    2. सैंपल वेरियंस
  4. परिमाण (Variance) की गणना करने के चरण
  5. नमूना के लिए विचरण की गणना का उदाहरण
  6. भिन्नता का महत्व

वेरीयंस कैलकुलेटर

परिवर्तनशीलता माप के रूप में वेरियंस

किसी दिए गए डेटा सेट के लिए स्टैटिस्टिकल अनुमान के मूलभूत पहलुओं में से एक मीट्रिक का माप है जो उनके औसत से डेटा परिवर्तनशीलता की विशेषता है। परिवर्तनशीलता को मापने के लिए सबसे अधिक इस्तेमाल की जाने वाली मीट्रिक हैं:

  • वेरियंस को मिन से स्क्वायर्ड डेविएशन के औसत के रूप में परिभाषित किया गया है।
  • स्टैण्डर्ड डेविएशन - वेरियंस का वर्गमूल है। स्टैण्डर्ड डेविएशन फैलाव/परिवर्तनशीलता को मापने के लिए एक लोकप्रिय मीट्रिक है।
  • भिन्नता का गुणांक, जिसे सापेक्ष स्टैण्डर्ड डेविएशन के रूप में भी जाना जाता है। भिन्नता के गुणांक की गणना स्टैण्डर्ड डेविएशन σ से मिन μ या \$(C_v=\frac{σ}{μ})\$ के अनुपात के रूप में की जाती है।

यह कैलकुलेटर किसी दिए गए डेटा सेट के वेरियंस का पता लगाता है और गणना में शामिल चरणों को प्रदर्शित करता है।

इस कैलकुलेटर का उपयोग करने के नियम

वेरियंस कैलकुलेटर इनपुट के रूप में एक सीमांकक द्वारा अलग की गई संख्याओं को स्वीकार करता है। नीचे दी गई तालिका संभावित इनपुट के कुछ उदाहरण दिखाती है।

पंक्ति इनपुट कॉलम इनपुट कॉलम इनपुट कॉलम इनपुट
44, 63, 72, 75, 80, 86, 87, 89 44 44, 44,63,72
44 63 72 75 80 86 87 89 63 63, 75,80
44,, 63,, 72, 75, 80, 86, 87, 89 72 72, 86,87
44 63 72 75, 80, 86, 87, 89 75 75, 89
44; 63; 72, 75,, 80, 86, 87, 89 80 80,
44,,, 63,, 72, 75, 80, 86, 87, 89 86 86,
44 63,, 72,,,, 75, 80, 86, 87, 89 87 87,
89 89,

संख्याओं को अलग करने के लिए अल्पविराम, रिक्त स्थान, रेखा विराम या इन सीमांककों के संयोजन का उपयोग किया जा सकता है। आपके पास पंक्ति या स्तंभ प्रारूप का उपयोग करने का विकल्प है। कैलकुलेटर उपरोक्त तालिका में दिखाए गए सभी प्रारूपों के लिए इनपुट को 44, 63, 72, 75, 80, 86, 87 और 89 के रूप में संसाधित करता है।

जब आप डेटा दर्ज करते हैं, तो आप चुन सकते हैं कि यह सैंपल डेटा है या जनसंख्या डेटा। जब आप गणना बटन दबाते हैं, तो कैलकुलेटर डेटासेट के पांच स्टैटिस्टिकल पैरामीटर प्रदर्शित करता है: गणना (अवलोकन की संख्या), मिन, स्क्वायर्ड डेविएशन का योग, वेरियंस और स्टैण्डर्ड डेविएशन।

कैलकुलेटर का उद्देश्य डेटा सेट के वेरियंस की गणना करना है। यह गणना के पीछे के सिद्धांत में एक अंतर्दृष्टि भी प्रदान करता है और इसमें शामिल सभी चरणों को दिखाता है।

अच्छे आँकड़े प्राप्त करने के लिए अनुमान लगाते समय बड़े डेटा सेट का उपयोग करना बेहतर होता है। हालांकि, जनसंख्या डेटा प्राप्त करना अक्सर मुश्किल होता है जिसमें सभी संभावित अवलोकन शामिल होते हैं। नतीजतन, एक "सैंपल" आमतौर पर जनसंख्या से लिया जाता है। सैंपल डेटा आमतौर पर जनसंख्या के बारे में निष्कर्ष निकालने के लिए उपयोग किया जाता है।

वेरिएंस मिन के संबंध में डेटा सेट के औसत फैलाव को मापता है। इसे अक्सर जनसंख्या के लिए σ² और सैंपल के लिए द्वारा दर्शाया जाता है। σ² या का एक बड़ा मान सैंपल मिन से डेटा बिंदुओं का एक बड़ा फैलाव दर्शाता है और इसके विपरीत।

निम्नलिखित उदाहरण डेटा सेट पर विचार करें।

(सेट I) 11, 3, 5, 21, 10, 15, 20, 25, 13, 26, 27,

(सेट II) 12, 14, 14, 15, 15, 16, 16, 17, 18, 19, 20

वेरीयंस कैलकुलेटर यील्ड में सेट I प्लग करना:

n=11

x̄=16

SS=704

s²=70.4

s=8.39

एक सैंपल के लिए, और

n=11

μ=16

SS=704

σ²=64

σ=8

जनसंख्या के लिए।

इसी तरह, कैलकुलेटर यील्ड में सेट II प्लग करना:

n=11

x̄=16

SS=56

s²=5.6

s=2.36

एक सैंपल के लिए, और

n=11

μ=16

SS=56

σ²=5.09

σ=2.25

जनसंख्या के लिए।

  • सेट I में, संख्याएं सैंपल मिन से महत्वपूर्ण रूप से विचलित होती हैं

s²=70.4

σ²=64

  • सेट II में परिवर्तनशीलता छोटी है

s²=5.6

σ²=5.09

वेरियंस का सूत्र: जनसंख्या वेरियंस बनाम सैंपल वेरियंस

जनसंख्या भिन्नता

स्टेटिस्टिक्स में जनसंख्या एक प्रयोग में सभी संभावित अवलोकनों को संदर्भित करती है। एन अवलोकनों के लिए, जनसंख्या भिन्नता है:

$$\sigma^2=\frac{\sum_{i}^{N}{{(x_i-\ \mu)}^2\ }}{N}$$

जहां

  • σ² जनसंख्या वेरियंस है,
  • Σ योग है,
  • xᵢ प्रत्येक अवलोकन है,
  • μ जनसंख्या मिन है,
  • n जनसंख्या में टिप्पणियों की संख्या है।

सैंपल वेरियंस

सैंपल वेरियंस को परिभाषित किया गया है

$$s^2=\frac{\sum_{i}^{n}{{(x_i-\ \bar{x})}^2\ }}{n-1}$$

जहां

  • नमूना प्रसरण है,
  • Σ योग है,
  • xᵢ प्रत्येक अवलोकन है,
  • सैंपल मिन है,
  • n सैंपल में अवलोकनों की संख्या है।

परिमाण (Variance) की गणना करने के चरण

परिमाण की गणना में निम्नलिखित चरण शामिल हैं।

चरण 1: नमूना/जनसंख्या का माध्य (Mean) निकालें। यह सभी डेटा बिंदुओं का योग होता है जिसे डेटा बिंदुओं की संख्या (नमूना के लिए n और जनसंख्या के लिए N) से विभाजित किया गया हो, अर्थात,

नमूना माध्य:

$$\bar{x}=\frac{\sum_{i=1}^{n} x_i}{n}$$

जनसंख्या माध्य:

$$\mu=\frac{\sum_{i=1}^{N} x_i}{N}$$

चरण 2: प्रत्येक डेटा बिंदु से नमूना/जनसंख्या माध्य को घटाकर विचलन (Deviations) की गणना करें, अर्थात,

नमूना विचलन:

$$(x_1-\bar{x}), (x_2-\bar{x}), (x_3-\bar{x}), \ldots, (x_n-\bar{x})$$

जनसंख्या विचलन:

$$(x_1-\mu), (x_2-\mu), (x_3-\mu), \ldots, (x_N-\mu)$$

चरण 3: प्रत्येक डेटा बिंदु के वर्गीकृत विचलन (Squared Deviations) की गणना करें।

नमूना वर्गीकृत विचलन:

$$(x_1-\bar{x})^2, (x_2-\bar{x})^2, (x_3-\bar{x})^2, \ldots, (x_n-\bar{x})^2$$

जनसंख्या वर्गीकृत विचलन:

$$(x_1-\mu)^2, (x_2-\mu)^2, (x_3-\mu)^2, \ldots, (x_N-\mu)^2$$

चरण 4: वर्गीकृत विचलनों का योग निकालें।

नमूना वर्गीकृत विचलनों का योग:

$$SS=\sum_{i=1}^{n}(x_i-\bar{x})^2$$

जनसंख्या वर्गीकृत विचलनों का योग:

$$SS=\sum_{i=1}^{N}(x_i-\mu)^2$$

चरण 5: परिमाण की गणना करने के लिए वर्गीकृत विचलनों के योग को ( n-1 ) से विभाजित करें अगर नमूना हो, और ( N ) से अगर जनसंख्या हो।

नमूना परिमाण:

$$s^2=\frac{SS}{n-1}$$

जनसंख्या परिमाण:

$$\sigma^2=\frac{SS}{N}$$

नमूना के लिए विचरण की गणना का उदाहरण

आइए हम निम्नलिखित डेटा सेट पर विचार करें: 1, 2, 4, 5, 6, और 12। नमूना विचरण की गणना करने के लिए, हम इन चरणों का अनुसरण करते हैं:

चरण 1: नमूना माध्य (औसत) की गणना करें।

$$\bar{x}=\frac{1+2+4+5+6+12}{6}=\frac{30}{6}=5$$

चरण 2: प्रत्येक डेटा बिंदु के लिए माध्य से विचलन की गणना करें।

x₁-x̄ x₂-x̄ x₃-x̄ x₄-x̄ x₅-x̄ x₆-x̄
1 - 5 2 - 5 4 - 5 5 - 5 6 - 5 12 - 5
-4 -3 -1 0 1 7

चरण 3: विचलन के वर्गों की गणना करें।

(x₁-x̄)² (x₂-x̄)² (x₃-x̄)² (x₄-x̄)² (x₅-x̄)² (x₆-x̄)²
16 9 1 0 1 49

चरण 4: विचलन के वर्गों का योग करें।

$$SS=\sum_{i=1}^{n}{(x_i-\bar{x})}^2=16+9+1+0+1+49=76$$

चरण 5: स्वतंत्रता की डिग्री (n-1) से विचलन के वर्गों के योग को विभाजित करके नमूना विचरण की गणना करें।

$$s^2=\frac{SS}{n-1}=\frac{76}{6-1}=\frac{76}{5}=15.2$$

एक जनसंख्या के लिए, हम n-1 के बजाय n (डेटा बिंदुओं की कुल संख्या) से विभाजित क

रके जनसंख्या विचरण की गणना करेंगे।

भिन्नता का महत्व

निवेश फैलाव का उपयोग करता है। यह परिसंपत्ति प्रबंधकों को उनके निवेश के प्रदर्शन को अनुकूलित करने में सहायता करता है। वित्तीय विश्लेषक निवेश पोर्टफोलियो घटकों के व्यक्तिगत प्रदर्शन का मूल्यांकन करने के लिए भिन्नता का उपयोग कर सकते हैं।

नई खरीद पर विचार करते समय, निवेशक यह निर्धारित करने के लिए भिन्नता की गणना करते हैं कि निवेश जोखिम के लायक है या नहीं। विश्लेषक फैलाव का उपयोग अनिश्चितता के माप को निर्धारित करने के लिए कर सकते हैं जो कि भिन्नता और स्टैण्डर्ड डेविएशन के बिना मापना मुश्किल होगा।

अनिश्चितता को सीधे मापा नहीं जा सकता। हालांकि, वेरियंस और स्टैण्डर्ड डेविएशन (वेरियंस का वर्गमूल) एक पोर्टफोलियो पर स्टॉक के कथित प्रभाव को निर्धारित करने में मदद करते हैं।

वेरिएंस का उपयोग वैज्ञानिक, स्टेटिस्टिक्सविद, गणितज्ञ और डेटा विश्लेषक भी कर सकते हैं। यह एक प्रयोग या सैंपल आबादी के बारे में उपयोगी जानकारी के प्रावधान में योगदान देता है।

वैज्ञानिक यह देखने के लिए परीक्षण समूहों के बीच मतभेदों की तलाश कर सकते हैं कि क्या वे एक परिकल्पना का सफलतापूर्वक परीक्षण करने के लिए समान हैं। डेटा सेट में मान जितना अधिक बिखरा हुआ होगा, डेटा सेट का वेरियंस उतना ही अधिक होगा। डेटा वैज्ञानिकों द्वारा इस जानकारी का उपयोग यह निर्धारित करने के लिए किया जा सकता है कि मिन डेटा सेट का कितना अच्छा प्रतिनिधित्व करता है।

वेरियंस का उपयोग करने का नुकसान यह है कि एक सेट में बड़े आउटलेयर डेटा विरूपण का कारण बन सकते हैं। यह इस तथ्य के कारण है कि चुकता होने पर आउटलेयर अपना वजन और भी अधिक बढ़ा सकते हैं।

कई शोधकर्ता स्टैण्डर्ड डेविएशन के साथ काम करना पसंद करते हैं, जिसकी गणना वेरियंस के वर्गमूल के रूप में की जाती है। स्टैण्डर्ड डेविएशन आउटलेर्स से कम प्रभावित होता है, एक छोटा आंकड़ा होता है, और समझने में आसान होता है।