شماریاتی کیلکولیٹرز
معیاری انحراف کیلکولیٹر


معیاری انحراف کیلکولیٹر

مفت معیاری انحراف (standard deviation) کیلکولیٹر مرحلہ وار حل کے ساتھ۔ سیمپل یا پاپولیشن ڈیٹا کے لیے اوسط، تغیر اور معیاری انحراف باآسانی معلوم کریں۔

نمونہ آبادی
معیاری انحراف σ = 5.3385 s = 4.9937
تغیر σ2 = 28.5 s2 = 24.9375
تعداد n = 8 n = 8
اوسط μ = 18.25 x̄ = 18.25
مربعات کا مجموعہ SS = 199.5 SS = 199.5

آپ کے حساب میں ایک خرابی تھی۔

فہرستِ مضامین

  1. معیاری انحراف (Standard Deviation)
  2. پاپولیشن معیاری انحراف (Population Standard Deviation)
    1. ایک عام پاپولیشن کے معیاری انحراف کو معلوم کرنے کی مثال
  3. سیمپل معیاری انحراف (Sample Standard Deviation)
  4. مارجن آف ایرر (Margin of Error)
  5. کانفیڈنس انٹرول (The Confidence Interval)
    1. کانفیڈنس انٹرول کیلکولیشن کی مثال

معیاری انحراف کیلکولیٹر

ہمارا معیاری انحراف (standard deviation) کیلکولیٹر ایک طاقتور اور استعمال میں آسان ٹول ہے جسے کسی بھی ڈیٹا سیٹ کا معیاری انحراف معلوم کرنے کے لیے ڈیزائن کیا گیا ہے۔ معیاری انحراف کا حساب لگانے کے علاوہ، یہ فوری طور پر اہم شماریاتی بصیرت (insights) بھی فراہم کرتا ہے، جن میں اوسط (mean)، تغیر (variance)، اور تفصیلی فریکوئنسی ڈسٹری بیوشن ٹیبل شامل ہیں۔ مزید برآں، یہ ٹول مختلف کانفیڈنس لیولز پر آپ کے ڈیٹا سیٹ کا کانفیڈنس انٹرول (confidence interval) بھی کیلکولیٹ کرتا ہے۔

شروع کرنے کے لیے، بس اپنے ڈیٹا پوائنٹس کو کوما (comma) سے الگ کر کے درج کریں۔ اس کے بعد، منتخب کریں کہ آیا آپ کے نمبرز مکمل پاپولیشن (آبادی) کی نمائندگی کرتے ہیں یا محض ایک سیمپل (نمونہ) کی، اور اپنے تفصیلی نتائج دیکھنے کے لیے "Calculate" پر کلک کریں۔

معیاری انحراف (Standard Deviation)

معیاری انحراف ایک بنیادی شماریاتی پیمانہ ہے جو کسی دیے گئے ڈیٹا سیٹ میں پھیلاؤ یا تغیریت (variability) کے درجے کی نشاندہی کرتا ہے۔ یہ آپ کے ڈیٹا پوائنٹس کے ڈیٹا سیٹ کے اوسط (mean) سے اوسط فاصلے کی نمائندگی کرتا ہے۔ کم معیاری انحراف کا مطلب یہ ہے کہ ڈیٹا پوائنٹس اوسط کے قریب جمع ہیں، جبکہ زیادہ معیاری انحراف اس بات کی نشاندہی کرتا ہے کہ ڈیٹا وسیع پیمانے پر پھیلا ہوا ہے۔ ریاضیاتی طور پر، معیاری انحراف تغیر (variance) کا جزر (square root) ہوتا ہے—جو ڈیٹا کے پھیلاؤ کا ایک اور اہم پیمانہ ہے۔

آپ معیاری انحراف کا حساب کیسے لگاتے ہیں، یہ مکمل طور پر آپ کے ڈیٹا سیٹ پر منحصر ہے۔ اگر آپ کے ڈیٹا میں زیرِ مطالعہ گروپ کا ہر ایک ممبر شامل ہے، تو آپ پاپولیشن اسٹینڈرڈ ڈیوی ایشن (population standard deviation) کا حساب لگائیں گے۔ تاہم، اگر آپ کا ڈیٹا ایک بڑے گروپ کا صرف ایک حصہ (subset) ہے، تو آپ سیمپل اسٹینڈرڈ ڈیوی ایشن (sample standard deviation) معلوم کریں گے۔

پاپولیشن معیاری انحراف (Population Standard Deviation)

جب آپ کے ڈیٹا سیٹ میں آپ کے مطلوبہ گروپ کا ہر ممکنہ مشاہدہ (observation) شامل ہو تو آپ کو پاپولیشن اسٹینڈرڈ ڈیوی ایشن کا حساب لگانا چاہیے۔ شماریات میں، پاپولیشن معیاری انحراف کو σ کی علامت سے ظاہر کیا جاتا ہے۔

σ (جسے "سگما" پڑھا جاتا ہے) ایک چھوٹا یونانی حرف ہے۔ پاپولیشن معیاری انحراف کا فارمولا درج ذیل ہے:

$$\sigma=\sqrt{\frac{\sum_{i=1}^{N}{(x_i-\mu)^2}}{N}}$$

جہاں:

  • Σ یونانی کا بڑا حرف سگما ہے، جو ریاضی میں مجموعے (summation) کو ظاہر کرتا ہے؛
  • xᵢ ڈیٹا سیٹ میں ہر انفرادی ڈیٹا پوائنٹ (مشاہدے) کی نمائندگی کرتا ہے، جو پہلی ویلیو سے شروع ہو کر N ویں (آخری) ویلیو تک جاتا ہے؛
  • μ پاپولیشن کے اوسط (mean) کی نمائندگی کرتا ہے؛
  • N پاپولیشن کا کل سائز ہے۔

ایک عام پاپولیشن کے معیاری انحراف کو معلوم کرنے کی مثال

درج ذیل مثال ظاہر کرتی ہے کہ پاپولیشن ڈیٹا کا معیاری انحراف کیسے معلوم کیا جائے۔

سرمایہ کار اکثر اسٹاکس کو دیگر سرمایہ کاری اثاثوں کے مقابلے میں قیمت کے زیادہ اتار چڑھاؤ کی وجہ سے خطرناک اثاثے سمجھتے ہیں۔ فرض کریں ایک انویسٹمنٹ مینیجر پچھلے مہینے کے مخصوص اسٹاکس کے اتار چڑھاؤ (volatility) کا تجزیہ کرنا چاہتا ہے۔ وہ فیصلہ کرتا ہے کہ وہ اپنے کلائنٹس کو کسی بھی ایسے اسٹاک کی سفارش نہیں کرے گا جس کا معیاری انحراف اس کے اوسط (mean) کے برابر یا اس سے زیادہ ہو، اور ایسے اثاثوں کو "بہت زیادہ خطرناک" (too risky) قرار دے گا۔

نیچے ایک مخصوص اسٹاک کی پچھلے مہینے کی تمام روزانہ کی کلوزنگ قیمتیں (امریکی ڈالر میں) دی گئی ہیں۔ آئیے یہ تعین کرنے کے لیے معیاری انحراف کا حساب لگاتے ہیں کہ آیا مینیجر اس اسٹاک کو زیادہ خطرناک سمجھے گا یا نہیں:

1.31, 1.30, 1.36, 1.40, 1.40, 1.41, 1.27, 1.19, 1.15, 1.12, 0.99, 1.00, 0.97, 0.94, 0.88, 0.90, 0.86, 0.88, 0.80, 0.81

چونکہ مینیجر کو صرف پچھلے مہینے کے اسٹاک کی قیمتوں میں دلچسپی ہے، اور ہمارے پاس اس مخصوص ٹائم فریم کے لیے ریکارڈ شدہ تمام قیمتیں موجود ہیں، اس لیے ہم مکمل پاپولیشن کے ساتھ کام کر رہے ہیں۔ لہذا، ہم پاپولیشن معیاری انحراف کے فارمولے کا استعمال کریں گے۔

معیاری انحراف معلوم کرنے کے لیے، ہمیں سب سے پہلے اوسط (μ) کا حساب لگانا ہوگا۔ یاد رکھیں، اوسط معلوم کرنے کے لیے نمبروں کے کل مجموعے کو نمبروں کی کل تعداد سے تقسیم کیا جاتا ہے۔

$$\mu=\frac{1.31+1.30+1.36+1.40+1.40+1.41+1.27+1.19+1.15+1.12+0.99+1.00+0.97+0.94+0.88+0.90+0.86+0.88+0.80+0.81}{20}=1.097$$

اس کے بعد، اوسط کو ہر انفرادی ڈیٹا پوائنٹ سے منفی (subtract) کریں اور فرق کا مربع (square) لیں۔ ان تمام مربع شدہ فرق کو ایک ساتھ جمع کریں، اور نتیجے کو کل تعداد سے تقسیم کریں۔ یہ نتیجہ تغیر یا ویرینس (σ²) ہے۔

$$\sigma^2=\frac{\left(1.31-1.097\right)^2+\left(1.30-1.097\right)^2+\left(1.36-1.097\right)^2+\left(1.40-1.097\right)^2+\ldots+\left(0.81-1.097\right)^2}{20}=0.045031$$

آخر میں، پاپولیشن معیاری انحراف معلوم کرنے کے لیے ویرینس کا جزر (square root) لیں۔

$$\sigma=\sqrt{0.045031}\approx0.21$$

جیسا کہ آپ دیکھ سکتے ہیں، پچھلے مہینے کے لیے اس اسٹاک کی قیمتوں کا معیاری انحراف (0.21) اس کے اوسط (1.097) سے کم ہے۔ لہذا، مینیجر اس اسٹاک کو "بہت زیادہ خطرناک" تصور نہیں کرے گا۔

سیمپل معیاری انحراف (Sample Standard Deviation)

آپ کو سیمپل اسٹینڈرڈ ڈیوی ایشن کا حساب اس وقت لگانا چاہیے جب آپ کا ڈیٹا سیٹ مطلوبہ بڑی پاپولیشن سے لیا گیا محض ایک سیمپل (چھوٹا حصہ) ہو۔ سیمپل کے معیاری انحراف کو حرف s سے ظاہر کیا جاتا ہے اور اسے درج ذیل فارمولے کے ذریعے معلوم کیا جاتا ہے:

$$s=\sqrt{\frac{\sum_{i=1}^{n}\left(x_i-\bar{x}\right)^2}{n-1}}$$

جہاں:

  • Σ مجموعے (summation) کو ظاہر کرتا ہے؛
  • xᵢ ہر انفرادی ڈیٹا پوائنٹ کی نمائندگی کرتا ہے؛
  • سیمپل کے اوسط کی نمائندگی کرتا ہے؛
  • n سیمپل کا سائز ہے۔

آئیے دیکھتے ہیں کہ پچھلی مثال میں تھوڑی تبدیلی کر کے سیمپل کا معیاری انحراف کیسے معلوم کیا جا سکتا ہے۔ فرض کریں کہ انویسٹمنٹ مینیجر اسی اسٹاک کا تجزیہ کرنا چاہتا ہے، لیکن اس بار، اسے پچھلے مہینے کے ہر ایک تجارتی دن کی کلوزنگ قیمتوں تک رسائی حاصل نہیں ہے۔ اس کے بجائے، اس کے پاس صرف 5 دنوں کے رینڈم سیمپل کی کلوزنگ قیمتیں ہیں۔ اسے اس محدود سیمپل ڈیٹا کا استعمال کرتے ہوئے اسٹاک کے معیاری انحراف کا تخمینہ لگانا ہوگا۔

فرض کریں کہ درج شدہ 5 کلوزنگ قیمتیں یہ ہیں:

1.31, 1.40, 0.86, 0.88, 1.40

اگرچہ مینیجر کی حتمی دلچسپی پورے پچھلے مہینے میں ہے، لیکن اس کے پاس صرف 5 دن کا سب سیٹ (حصہ) موجود ہے۔ چونکہ ہم مکمل پاپولیشن کے بجائے سیمپل کے ساتھ کام کر رہے ہیں، اس لیے ہمیں سیمپل اسٹینڈرڈ ڈیوی ایشن فارمولے کا استعمال کرتے ہوئے معیاری انحراف کا حساب لگانا ہوگا۔

سب سے پہلے، سیمپل کے اوسط () کا حساب لگائیں۔

$$\bar{x}=\frac{1.31+1.40+0.86+0.88+1.40}{5}=1.17$$

اگلا قدم، سیمپل کے ویرینس () کا حساب لگائیں۔

$$s^2=\frac{\left(1.31-1.17\right)^2+\left(1.40-1.17\right)^2+\left(0.86-1.17\right)^2+\left(0.88-1.17\right)^2+\left(1.40-1.17\right)^2}{5-1}=0.0764$$

آخر میں، سیمپل کا معیاری انحراف حاصل کرنے کے لیے ویرینس کا جزر (square root) لیں۔

$$s=\sqrt{0.0764}\approx 0.28$$

مارجن آف ایرر (Margin of Error)

معیاری انحراف کا ایک انتہائی کارآمد استعمال ویلیوز کی ایک "قابلِ قبول" رینج معلوم کرنا ہے، جو پیشین گوئی کے تجزیات (predictive analytics) اور صنعتی شماریاتی کوالٹی ایشورنس (quality assurance) میں اہم کردار ادا کرتی ہے۔ اگر بنیادی ڈیٹا نارمل ڈسٹری بیوشن کے تابع ہو، تو اس رینج کو کانفیڈنس انٹرول (confidence interval) کہا جاتا ہے (جس کی تفصیل اگلے سیکشن میں موجود ہے)۔ یہ انٹرولز مختلف کانفیڈنس لیولز پر کیلکولیٹ کیے جاتے ہیں، جنہیں عام طور پر فیصد کے طور پر ظاہر کیا جاتا ہے۔

مارجن آف ایرر کانفیڈنس انٹرول کا ایک کلیدی حصہ ہے جو اس کی مجموعی چوڑائی (width) کا تعین کرتا ہے۔ بنیادی طور پر، مارجن آف ایرر اس میٹرک کے لیے زیادہ سے زیادہ اور کم سے کم قابل قبول ویلیوز قائم کرتا ہے جس کا آپ تجزیہ کر رہے ہیں۔

مارجن آف ایرر کو اس فارمولے کا استعمال کر کے کیلکولیٹ کیا جاتا ہے:

$$Margin\ of\ error\ = z_{\alpha/2}\left(\dfrac{\sigma}{\sqrt{n}}\right)$$

ہم اس فارمولے کا اطلاق اس وقت کرتے ہیں جب پاپولیشن معیاری انحراف (σ) معلوم ہو، بشرطیکہ سیمپل کا سائز کافی بڑا ہو (عام طور پر n > 30

جب پاپولیشن معیاری انحراف نامعلوم ہو اور سیمپل چھوٹا ہو (عام طور پر n ≤ 30)، تو ہم اس کے بجائے درج ذیل فارمولہ استعمال کرتے ہیں:

$$Margin\ of\ error\ = t_{n-1,\alpha/2}\left(\frac{s}{\sqrt{n}}\right)$$

اس صورت حال میں، ہم پاپولیشن معیاری انحراف (σ) کی جگہ سیمپل معیاری انحراف (s) کو استعمال کرتے ہیں۔

اجزاء $z_{\alpha/2}$ اور $t_{n-1, \alpha/2}$ کو کریٹیکل ویلیوز (critical values) کہا جاتا ہے۔ ان کا تعین بالترتیب z-statistics اور t-statistics کا استعمال کرتے ہوئے کیا جاتا ہے، اور یہ آپ کے منتخب کردہ کانفیڈنس لیول سے منسلک کانسٹنٹس (constants) کے طور پر کام کرتے ہیں۔

شماریاتی تجزیے میں استعمال ہونے والے سب سے عام کانفیڈنس لیولز 90%، 95%، اور 99% ہیں۔ ان سے متعلقہ $z_{\alpha/2}$ کریٹیکل ویلیوز 1.645 (90% کے لیے)، 1.96 (95% کے لیے)، اور 2.575 (99% کے لیے) ہیں۔

اجزاء $\frac{\sigma}{\sqrt n}$ اور $\frac{s}{\sqrt n}$ معیاری غلطی یا اسٹینڈرڈ ایرر (standard error) کی نمائندگی کرتے ہیں۔

  • $\frac{\sigma}{\sqrt n}$ اس وقت استعمال کیا جاتا ہے جب ہم پاپولیشن کا معیاری انحراف (σ) جانتے ہوں اور ہمارے پاس سیمپل کا سائز بڑا ہو (عام طور پر n > 30
  • $\frac{s}{\sqrt n}$ اس وقت استعمال کیا جاتا ہے جب ہم پاپولیشن کا معیاری انحراف نہیں جانتے اور ہم چھوٹے سیمپل سائز (عام طور پر n ≤ 30) کے ساتھ کام کر رہے ہوں۔ چونکہ σ نامعلوم ہے، اس لیے ہمیں اپنے دستیاب سیمپل کے معیاری انحراف (s) پر انحصار کرنا ہوگا۔

کانفیڈنس انٹرول (The Confidence Interval)

جیسا کہ اوپر ذکر کیا گیا ہے، کانفیڈنس انٹرول ویلیوز کی ایک شماریاتی رینج (range) ہے جس کے اندر ایک دی گئی پاپولیشن کے پیرامیٹر کے گرنے یا آنے کی توقع ہوتی ہے، جو کہ ایک مخصوص کانفیڈنس لیول پر مبنی ہوتی ہے۔

مثال کے طور پر، ایک ماہر شماریات یہ کہہ سکتا ہے کہ 13 سالہ لڑکیوں کی اوسط اونچائی 90% کانفیڈنس لیول پر 59 انچ اور 66 انچ کے درمیان ہوتی ہے۔ اس کا مطلب یہ ہے کہ اگر ہم 13 سالہ لڑکیوں کے متعدد رینڈم سیمپلز لیں، تو 90 فیصد امکانات ہیں کہ ان کی اوسط اونچائی ان دونوں حدود (bounds) کے درمیان ہوگی۔

جب پاپولیشن کا معیاری انحراف معلوم ہو، تو کانفیڈنس انٹرول کو درج ذیل فارمولے کے ذریعے کیلکولیٹ کیا جاتا ہے:

$$\bar{x}± z_{\alpha/2}\left(\frac{\sigma}{\sqrt{n}}\right)$$

  • سیمپل اوسط (mean) ہے،
  • $z_{\alpha/2}$ کریٹیکل ویلیو ہے،
  • σ پاپولیشن کا معیاری انحراف ہے،
  • n مشاہدات کی تعداد ہے۔

اگر ہم پاپولیشن کا معیاری انحراف (σ) نہیں جانتے اور اس کے بجائے سیمپل معیاری انحراف (s) استعمال کرنا لازمی ہو، تو ہم یہ متبادل فارمولہ استعمال کرتے ہیں:

$$\bar{x}± t_{n-1,\alpha/2}\left(\frac{s}{\sqrt{n}}\right)$$

  • سیمپل اوسط ہے،
  • $t_{n-1,\alpha/2}$ کریٹیکل ویلیو ہے،
  • s سیمپل معیاری انحراف ہے،
  • n مشاہدات کی تعداد ہے۔

جیسا کہ پچھلے سیکشن میں تفصیل سے بتایا گیا ہے، مساوات $z_{\alpha/2}\left(\frac{\sigma}{\sqrt{n}}\right)$ اور $t_{n-1,\alpha/2}\left(\frac{s}{\sqrt{n}}\right)$ مارجن آف ایرر کی نمائندگی کرتی ہیں۔

کانفیڈنس انٹرول کیلکولیشن کی مثال

فرض کریں کہ ہم جانتے ہیں کہ جن روزانہ کی اسٹاک قیمتوں کا ہم تجزیہ کر رہے ہیں وہ ایک نارمل ڈسٹری بیوشن کی پیروی کرتی ہیں۔ ہمارے پاس 10 اسٹاک قیمتوں کا درج ذیل سیمپل دستیاب ہے:

1.31, 1.36, 1.40, 1.27, 1.15, 0.99, 0.97, 0.88, 0.86, 0.80

ہم وہ رینج (حد) کیلکولیٹ کرنا چاہتے ہیں جس کے اندر اسٹاک کی اصل اوسط قیمت 95% کانفیڈنس لیول کے ساتھ اوپر نیچے (fluctuate) ہوگی۔

چونکہ یہ ایک چھوٹا سیمپل ہے اور پاپولیشن کا معیاری انحراف نامعلوم ہے، اس لیے ہم سیمپل معیاری انحراف اور متعلقہ t-statistic فارمولہ استعمال کریں گے:

$$\bar{x}± t_{n-1,\alpha/2}\left(\frac{s}{\sqrt{n}}\right)$$

  • سیمپل اوسط ہے: 1.10
  • $t_{n-1,\alpha/2}$ کریٹیکل ویلیو ہے: $t_{9, 0.025}$ = 2.26 (دیے گئے سیمپل سائز اور کانفیڈنس لیول کے لیے کریٹیکل ویلیوز عام طور پر معیاری t-ٹیبل یا z-ٹیبل کے ذریعے معلوم کی جاتی ہیں)
  • s سیمپل معیاری انحراف ہے: 0.23
  • n مشاہدات کی تعداد ہے: 10
  • $\frac{s}{\sqrt n}$ معیاری غلطی (standard error) ہے: $\frac{0.23}{\sqrt{10}}=0.07$

اب، ہم ان نمبروں کو اپنے کانفیڈنس انٹرول کے فارمولے میں شامل کرتے ہیں:

$$\bar{x}± t_{n-1,\alpha/2}\left(\frac{s}{\sqrt{n}}\right)$$

نچلی اور بالائی حدود (lower and upper bounds) کو کیلکولیٹ کرنے پر، ہمیں یہ حاصل ہوتا ہے:

$$1.10 - 2.26 (\frac{0.23}{\sqrt{10}}) = 1.10 - 2.26 (\frac{0.23}{3.16}) = 1.10 - 2.26 × 0.07 = 1.10 - 0.16 = 0.94$$

$$1.10 + 2.26 (\frac{0.23}{\sqrt{10}}) = 1.10 + 2.26 (\frac{0.23}{3.16}) = 1.10 + 2.26 × 0.07 = 1.10 + 0.16 = 1.26$$

اس نتیجے کا مطلب ہے کہ ہم 95% پراعتماد ہو سکتے ہیں کہ اس اسٹاک کے شیئر کی اصل اوسط قیمت (0.94, 1.26) کے کانفیڈنس انٹرول کے اندر واقع ہے۔