انحراف معیار

ماشین حساب انحراف معیار آنلاین برای محاسبه دقیق میانگین، واریانس و انحراف معیار نمونه و جامعه آماری. همراه با نمایش گام‌به‌گام مراحل حل برای داده‌های گسسته.

نتیجه
انحراف معیار s = 4.5
واریانس s2 = 20.24
تعداد n = 7
میانگین x̄ = 14.29
مجموع مربع ها SS = 100

در محاسبه شما خطایی رخ داد.

فهرست مطالب

  1. انحراف معیار به‌عنوان یک معیار آماری
  2. راهنمای استفاده از این ماشین حساب
  3. این ماشین حساب چه مشکلاتی را حل می‌کند؟
  4. فرمول‌های محاسبه انحراف معیار
  5. مراحل محاسبه انحراف معیار (گام‌به‌گام)
  6. مثال عملی: محاسبه انحراف معیار یک نمونه
  7. کاربردهای انحراف معیار در دنیای واقعی

انحراف معیار

انحراف معیار به‌عنوان یک معیار آماری

انحراف معیار (Standard Deviation) یکی از پرکاربردترین شاخص‌های آماری برای توصیف مجموعه داده‌هاست. به زبان ساده، این شاخص میزان پراکندگی داده‌ها را حول نقطه میانگین اندازه‌گیری می‌کند. با محاسبه انحراف معیار، متوجه می‌شویم که اعداد تا چه حد به میانگین نزدیک یا از آن دور هستند. اگر نقاط داده فاصله زیادی از میانگین داشته باشند، به این معناست که انحراف و پراکندگی بالایی در مجموعه داده‌ها وجود دارد. بنابراین، هرچه پراکندگی داده‌ها بیشتر باشد، مقدار انحراف معیار نیز بالاتر خواهد بود.

این ماشین حساب انحراف معیار، برای تحلیل یک مجموعه داده مشخص طراحی شده است و تمامی مراحل و محاسبات ریاضی لازم برای رسیدن به جواب را به‌صورت گام‌به‌گام به شما نمایش می‌دهد.

راهنمای استفاده از این ماشین حساب

این ماشین حساب، داده‌های ورودی شما را به‌صورت فهرستی از اعداد که با یک جداکننده (Delimiter) مشخص شده‌اند، دریافت می‌کند. در جدول زیر، چند نمونه از فرمت‌های قابل‌قبول برای وارد کردن اعداد نشان داده شده است:

ورودی سطری ورودی ستونی ورودی ستونی ورودی ستونی
44, 63, 72, 75, 80, 86, 87, 89 44 44, 44,63,72
44 63 72 75 80 86 87 89 63 63, 75,80
44,, 63,, 72, 75, 80, 86, 87, 89 72 72, 86,87
44 63 72 75, 80, 86, 87, 89 75 75, 89
44; 63; 72, 75,, 80, 86, 87, 89 80 80,
44,,, 63,, 72, 75, 80, 86, 87, 89 86 86,
44 63,, 72,,,, 75, 80, 86, 87, 89 87 87,
89 89,

شما می‌توانید اعداد را با استفاده از کاما، فاصله (اسپیس)، رفتن به خط بعد (Enter) یا ترکیبی از آن‌ها جدا کنید و داده‌ها را در قالب سطر یا ستون وارد نمایید. در تمامی فرمت‌های نمایش‌داده‌شده در جدول بالا، ماشین حساب داده‌ها را دقیقاً به‌صورت مجموعه اعداد ۴۴، ۶۳، ۷۲، ۷۵، ۸۰، ۸۶، ۸۷ و ۸۹ پردازش خواهد کرد.

پس از وارد کردن داده‌ها، تنها کافی است مشخص کنید که این اعداد مربوط به یک «نمونه آماری» هستند یا کل «جامعه آماری»، و سپس دکمه محاسبه را بزنید. ماشین حساب پنج پارامتر کلیدی آماری را برای شما محاسبه و نمایش می‌دهد: تعداد مشاهدات (Count)، میانگین (Mean)، مجموع مربعات انحرافات (Sum of Squared Deviations)، واریانس (Variance) و انحراف معیار (Standard Deviation).

این ماشین حساب چه مشکلاتی را حل می‌کند؟

این ابزار برای محاسبه دقیق انحراف معیار مجموعه‌ای از داده‌های گسسته طراحی شده است و علاوه بر ارائه پاسخ نهایی، درک عمیق‌تری از تئوری و منطق پشت این محاسبات به کاربر می‌دهد.

داده‌های جمع‌آوری‌شده می‌توانند نمایانگر کل یک جامعه آماری باشند؛ یعنی تمام مشاهدات یا اعضای ممکنی که در یک آزمایش تحت شرایط مشخص وجود دارند. اما در بسیاری از پروژه‌های واقعی، بررسی و اندازه‌گیری تک‌تک اعضای یک جامعه آماری بزرگ، عملاً غیرممکن یا بسیار هزینه‌بر است.

به همین دلیل، در علم آمار معمولاً با زیرمجموعه‌ای از این جامعه بزرگتر کار می‌کنیم که به آن نمونه آماری می‌گویند. ما داده‌ها را از این نمونه جمع‌آوری کرده و بر اساس اطلاعات به‌دست‌آمده، برآوردها و نتیجه‌گیری‌های خود را به کل جامعه تعمیم می‌دهیم.

هنگام محاسبه انحراف معیار، فرمولی که استفاده می‌کنیم بستگی به این دارد که با داده‌های یک نمونه سروکار داریم یا داده‌های کل جامعه. این تفاوت از طریق عاملی به نام «درجات آزادی» (Degrees of Freedom) در فرمول اعمال می‌شود. برای محاسبه واریانس یک نمونه، به‌جای تقسیم بر $n$ (کل تعداد مشاهدات)، مخرج کسر را بر $n - 1$ تقسیم می‌کنیم. سپس برای به‌دست آوردن انحراف معیار، از عدد حاصل جذر (ریشه دوم) می‌گیریم. این اصلاح (معروف به تصحیح بسل) به این دلیل انجام می‌شود که ما در حال استفاده از نمونه برای تخمین جامعه هستیم و این کار باعث می‌شود تخمین ما بدون سوگیری (Unbiased) و دقیق‌تر باشد.

انحراف معیار در واقع میزان پراکندگی، انحراف یا تغییرپذیری داده‌ها را نسبت به میانگین مشخص می‌کند. این شاخص معمولاً با حرف یونانی σ (سیگما) برای جامعه آماری و با حرف s برای نمونه آماری نشان داده می‌شود. مقدار بزرگتر σ یا s نشان می‌دهد که نقاط داده فاصله بیشتری از میانگین دارند، و مقدار کوچکتر نشان‌دهنده تمرکز بیشتر داده‌ها حول میانگین است.

برای درک بهتر، دو مجموعه داده زیر را در نظر بگیرید:

(مجموعه I)

11، 3، 5، 21، 10، 15، 20، 25، 13، 26، 27

(مجموعه II)

12، 14، 14، 15، 15، 16، 16، 17، 18، 19، 20

با وارد کردن این داده‌ها در ماشین حساب انحراف معیار، نتایج زیر حاصل می‌شود:

برای مجموعه I:

  • x̄=16 - مقدار میانگین
  • s=8.3904708 - انحراف معیار نمونه

برای مجموعه II:

  • x̄=16 - مقدار میانگین
  • s=2.3664319 - انحراف معیار نمونه

همان‌طور که می‌بینید، در مجموعه I اعداد پراکندگی زیادی نسبت به میانگین دارند (s=8.39)، درحالی‌که در مجموعه II، داده‌ها بسیار به میانگین نزدیک‌ترند و تغییرپذیری کمتری دارند (s=2.36).

فرمول‌های محاسبه انحراف معیار

اگر در حال تحلیل داده‌های کل جامعه آماری هستید، از این فرمول استفاده می‌شود:

$$σ = \sqrt{\frac{\sum_{i=1}^{N}(x_i-μ)^2}{N}}$$

  • σ انحراف معیار جامعه آماری است.
  • xᵢ مقدار هر یک از داده‌های فردی در جامعه است.
  • μ میانگین حسابی کل جامعه است.
  • N اندازه (تعداد اعضای) جامعه است.

اما اگر جامعه بسیار بزرگ است و شما تنها یک نمونه آماری را برای تحلیل انتخاب کرده‌اید، باید از فرمول زیر استفاده کنید:

$$s = \sqrt{\frac{\sum_{i=1}^{n}(x_i-\bar{x})^2}{n-1}}$$

  • s انحراف معیار نمونه است.
  • xᵢ مقدار هر یک از داده‌های فردی در نمونه است.
  • میانگین نمونه است.
  • n اندازه (تعداد اعضای) نمونه است.

مراحل محاسبه انحراف معیار (گام‌به‌گام)

محاسبه انحراف معیار شامل مراحل ریاضی زیر است که ماشین حساب نیز همین روند را طی می‌کند:

مرحله ۱: محاسبه میانگین نمونه یا جامعه. برای این کار باید مجموع تمامی داده‌ها را بر تعداد آن‌ها (N یا n) تقسیم کنید:

میانگین نمونه:

$$\bar{x}=\frac{x₁+x₂+x₃+........+x_n}{n}$$

میانگین جامعه:

$$\mu=\frac{x₁+x₂+x₃+........+x_N}{N}$$

مرحله ۲: محاسبه انحراف هر نقطه داده؛ به این صورت که مقدار میانگین را از تک‌تک داده‌ها کم می‌کنیم:

انحرافات نمونه:

$$(x₁-\bar{x}), (x₂-\bar{x}), (x₃-\bar{x}) …………………… (x_n-\bar{x})$$

انحرافات جامعه:

$$(x₁-\ \mu), (x₂-\ \mu), (x₃-\ \mu) ………………….. (x_N-\ \mu)$$

مرحله ۳: محاسبه مربع انحرافات (به‌توان دو رساندن مقادیر به‌دست‌آمده برای هر نقطه داده).

مربعات انحراف نمونه:

$$(x₁-\bar{x})^2, (x₂-\bar{x})^2, (x₃-\bar{x})^2 …………………… (x_n-\bar{x})^2$$

مربعات انحراف جامعه:

$$(x₁-\ \mu)^2, (x₂-\ \mu)^2, (x₃-\ \mu)^2 ………………….. (x_N-\ \mu)^2$$

مرحله ۴: محاسبه مجموع مربعات انحرافات (SS) با جمع کردن تمامی مقادیر محاسبه‌شده در مرحله قبل:

مجموع مربعات انحرافات نمونه:

$$SS=(x₁-\bar{x})^2+ (x₂-\bar{x})^2+(x₃-\bar{x})^2……………………+(x_n-\bar{x})^2$$

مجموع مربعات انحرافات جامعه:

$$SS=(x₁-\ \mu)^2+ (x₂-\ \mu)^2+(x₃-\ \mu)^2……………….+ (x_N-\ \mu)^2$$

مرحله ۵: محاسبه واریانس با تقسیم مجموع مربعات انحرافات بر درجات آزادی. برای جامعه آماری مخرج برابر با N و برای نمونه آماری برابر با n-1 است.

واریانس نمونه:

$$s^2 = \frac{\sum_{i=1}^{n}(xᵢ - \bar{x})^2}{n - 1}$$

واریانس جامعه:

$$\sigma^2 = \frac{\sum_{i=1}^{N}(xᵢ - \mu)^2}{N}$$

شاید هنگام محاسبه واریانس برای یک نمونه، به نظر برسد که باید از فرمول زیر استفاده کنیم:

$$\frac{(x-\bar{x})^2}{n}$$

که در آن x̄ میانگین نمونه و n اندازه نمونه است. اما در علم آمار از چنین فرمولی برای نمونه استفاده نمی‌شود! دلیل این امر آن است که این کسر، برآورد خوبی از واریانس جامعه به ما نمی‌دهد. وقتی جامعه اصلی بسیار بزرگ و نمونه ما کوچک باشد، استفاده از مخرج n باعث می‌شود واریانس محاسبه‌شده بسیار کوچکتر از واقعیت (واریانس جامعه) به دست آید. بنابراین، برای جبران کمبود داده‌ها در نمونه، مخرج را به n-1 کاهش می‌دهیم تا مقدار واریانس کمی افزایش یابد و به مقدار واقعی جامعه آماری نزدیک‌تر شود. این کار خطای سوگیری را برطرف می‌کند.

مرحله ۶: محاسبه جذر (ریشه دوم) عدد به‌دست‌آمده. انحراف معیار، در واقع جذر واریانس است.

انحراف معیار نمونه:

$$s=\sqrt{s^2}=\sqrt{\frac{\sum_{i}^{n}{{(x_i-\ \bar{x})}^2\ }}{n-1}}$$

انحراف معیار جامعه:

$$\sigma=\sqrt{\sigma^2}=\sqrt{\frac{\sum_{i}^{N}{{(x_i-\ \mu)}^2\ }}{N}}$$

مثال عملی: محاسبه انحراف معیار یک نمونه

فرض کنید می‌خواهیم نمرات امتحان نهایی فیزیک را برای یک نمونه شامل n=8 دانش‌آموز بررسی کنیم. نمرات به شرح زیر است:

45، 67، 70، 75، 80، 81، 82 و 84

ماشین حساب انحراف معیار، این محاسبات را طی مراحل زیر انجام می‌دهد:

مرحله ۱: محاسبه میانگین:

$$\bar{x} = \frac{\sum_{i} x_i}{n} = \frac{45+ 67+ 70+ 75+ 80+ 81+ 82+ 84}{8} = 73$$

مرحله ۲: محاسبه انحرافات (تفاضل نمرات از میانگین):

x₁-x̄ x₂-x̄ x₃-x̄ x₄-x̄ x₅-x̄ x₆-x̄ x₇-x̄ x₈-x̄
45-73 67-73 70-73 75-73 80-73 81-73 82-73 84-73
28- 6- 3- 2 7 8 9 11

مرحله ۳: محاسبه مربع انحرافات:

(x₁-x̄)² (x₂-x̄)² (x₃-x̄)² (x₄-x̄)² (x₅-x̄)² (x₆-x̄)² (x₇-x̄)² (x₈-x̄)²
784 36 9 4 49 64 81 121

مرحله ۴: محاسبه مجموع مربعات انحرافات (SS):

$$SS = \sum_{i}^{n}{{(x_i-\ \bar{x})}^2 = 784+36+9+4+49+64+81+121} = 1148$$

مرحله ۵: محاسبه واریانس با تقسیم مجموع مربعات بر درجات آزادی (n-1). از آنجا که ما با نمرات بخشی از دانش‌آموزان (یک نمونه) سروکار داریم نه کل دانش‌آموزان مدرسه، مخرج را n-1 قرار می‌دهیم:

$$s^2= \frac{\sum_{i}^{n}{{(x_i-\ \bar{x})}^2\ }}{n-1}=\frac{1148}{8-1}=164$$

مرحله ۶: محاسبه انحراف معیار با گرفتن جذر از واریانس:

$$s = \sqrt{s^2} = \sqrt{164} = 12.80$$

کاربردهای انحراف معیار در دنیای واقعی

از انحراف معیار و واریانس برای بررسی توزیع و پراکندگی داده‌ها استفاده می‌شود. هرچه مقدار این شاخص‌ها بزرگتر باشد، نشان می‌دهد که داده‌ها پراکنده‌تر هستند. این ویژگی، به‌خصوص زمانی که می‌خواهیم نوسان یا تغییرپذیری دو یا چند مجموعه داده را با هم مقایسه کنیم، بسیار کاربردی است.

در صنعت و کنترل کیفیت، انحراف معیار نقشی حیاتی دارد. در خطوط تولید انبوه، ویژگی‌های محصول باید در یک بازه استاندارد و مشخص قرار گیرند که این امر با محاسبه انحراف معیار قابل ارزیابی است. برای مثال، در تولید پیچ و مهره، تغییرات در قطر قطعات تولیدی باید حداقل ممکن (انحراف معیار بسیار پایین) باشد؛ در غیر این صورت، پیچ و مهره‌ها با یکدیگر چفت نخواهند شد.

در بازارهای مالی و سرمایه‌گذاری، از انحراف معیار برای ارزیابی ریسک و نوسانات بازار استفاده می‌شود. تحلیل‌گران تکنیکال از این شاخص آماری برای ترسیم اندیکاتورهایی مانند «باندهای بولینگر» (Bollinger Bands) و سنجش میزان نوسانات قیمت بهره می‌برند.

علاوه بر این، در جامعه‌شناسی و نظرسنجی‌های افکار عمومی، از این معیار برای محاسبه حاشیه خطا و عدم قطعیت استفاده می‌شود.

از نظر آماری نیز، واریانس و انحراف معیار کمک می‌کنند تا بفهمیم چه درصدی از داده‌ها در یک بازه مشخص قرار دارند. به‌عنوان مثال، طبق قضیه چبیشف (Chebyshev's theorem)، در هر نوع توزیع آماری، حداقل ۷۵٪ از کل داده‌ها در فاصله‌ای برابر با دو انحراف معیار از میانگین قرار می‌گیرند.

بیایید با یک مثال ملموس از آب‌وهوا بحث را روشن‌تر کنیم. فرض کنید میانگین دمای روزانه دو شهر را بررسی می‌کنیم: یکی در کنار ساحل و دیگری در مناطق خشک و دور از دریا. ممکن است میانگین بیشینه دمای سالانه در هر دو شهر دقیقاً یکسان باشد؛ اما انحراف معیار برای شهر خشک بسیار بیشتر خواهد بود، درحالی‌که شهر ساحلی پراکندگی دمایی کمتری دارد. این یعنی شهر دور از ساحل، نوسانات شدیدتری را بین روزهای گرم و سرد سال تجربه می‌کند، اما شهر ساحلی در طول سال آب‌وهوایی معتدل‌تر، یکنواخت‌تر و با نوسان کمتر دارد.