কোনো ফলাফল পাওয়া যায়নি
এই মুহূর্তে ওই শব্দ দিয়ে কিছুই খুঁজে পাওয়া যাচ্ছে না, অন্য কিছু খুঁজে দেখুন।
ধাপে ধাপে সমাধানসহ ফ্রি স্ট্যান্ডার্ড ডেভিয়েশন ক্যালকুলেটর। স্যাম্পল বা পপুলেশন ডেটার গড়, ভেদাঙ্ক এবং পরিমিত ব্যবধান দ্রুত ও নির্ভুলভাবে নির্ণয় করুন।
| নমুনা | জনসংখ্যা | |
|---|---|---|
| মানক বিচ্যুতি | σ = 5.3385 | s = 4.9937 |
| বিচরণ | σ2 = 28.5 | s2 = 24.9375 |
| সংখ্যা | n = 8 | n = 8 |
| গড় | μ = 18.25 | x̄ = 18.25 |
| বর্গগুলোর যোগফল | SS = 199.5 | SS = 199.5 |
আপনার গণনায় একটি ত্রুটি ছিল।
আমাদের স্ট্যান্ডার্ড ডেভিয়েশন ক্যালকুলেটর হলো যেকোনো ডেটা সেটের পরিমিত ব্যবধান (standard deviation) নির্ণয় করার জন্য একটি শক্তিশালী এবং সহজে ব্যবহারযোগ্য টুল। স্ট্যান্ডার্ড ডেভিয়েশন ছাড়াও এটি তাৎক্ষণিকভাবে গড় (mean), ভেদাঙ্ক (variance) এবং একটি বিস্তারিত গণসংখ্যা নিবেশন সারণির (frequency distribution table) মতো গুরুত্বপূর্ণ পরিসংখ্যানগত ডেটা প্রদান করে। উপরন্তু, এই টুলটি বিভিন্ন কনফিডেন্স লেভেলে আপনার ডেটাসেটের কনফিডেন্স ইন্টারভ্যালও (confidence interval) গণনা করে।
শুরু করতে, আপনার ডেটা পয়েন্টগুলোকে কমা দিয়ে আলাদা করে ইনপুট দিন। এরপর, আপনার সংখ্যাগুলো সম্পূর্ণ পপুলেশন নাকি একটি স্যাম্পল নির্দেশ করে তা নির্বাচন করুন এবং বিস্তারিত ফলাফল দেখতে "Calculate" বোতামে ক্লিক করুন।
স্ট্যান্ডার্ড ডেভিয়েশন বা পরিমিত ব্যবধান হলো একটি মৌলিক পরিসংখ্যানগত পরিমাপ যা কোনো ডেটাসেটের বিস্তৃতি (spread) বা পরিবর্তনশীলতার (variability) মাত্রা নির্দেশ করে। এটি মূলত ডেটাসেটের গড় থেকে ডেটা পয়েন্টগুলোর গড় দূরত্ব উপস্থাপন করে। পরিমিত ব্যবধান কম হওয়ার অর্থ হলো ডেটা পয়েন্টগুলো গড়ের খুব কাছাকাছি অবস্থান করছে, অন্যদিকে পরিমিত ব্যবধান বেশি হলে বুঝতে হবে ডেটাগুলো ব্যাপকভাবে ছড়িয়ে আছে। গাণিতিকভাবে, স্ট্যান্ডার্ড ডেভিয়েশন হলো ভেদাঙ্কের (variance) বর্গমূল—যা ডেটা বিস্তৃতির আরেকটি গুরুত্বপূর্ণ পরিমাপ।
আপনি কীভাবে স্ট্যান্ডার্ড ডেভিয়েশন গণনা করবেন তা সম্পূর্ণভাবে আপনার ডেটাসেটের ওপর নির্ভর করে। যদি আপনার ডেটায় গবেষণাধীন গ্রুপের প্রতিটি সদস্য অন্তর্ভুক্ত থাকে, তবে আপনি পপুলেশন স্ট্যান্ডার্ড ডেভিয়েশন (population standard deviation) গণনা করবেন। তবে, যদি আপনার ডেটা কোনো বৃহত্তর গ্রুপের একটি ছোট অংশ বা উপসেট হয়, তবে আপনাকে স্যাম্পল স্ট্যান্ডার্ড ডেভিয়েশন (sample standard deviation) গণনা করতে হবে।
যখন আপনার ডেটাসেটে আপনার কাঙ্ক্ষিত গ্রুপের প্রতিটি সম্ভাব্য পর্যবেক্ষণ অন্তর্ভুক্ত থাকে, তখন আপনার পপুলেশন স্ট্যান্ডার্ড ডেভিয়েশন গণনা করা উচিত। পরিসংখ্যানে, পপুলেশন স্ট্যান্ডার্ড ডেভিয়েশনকে σ প্রতীক দ্বারা প্রকাশ করা হয়।
σ (উচ্চারণ "সিগমা") হলো একটি ছোট হাতের গ্রিক অক্ষর। পপুলেশন স্ট্যান্ডার্ড ডেভিয়েশনের সূত্রটি নিম্নরূপ:
$$\sigma=\sqrt{\frac{\sum_{i=1}^{N}{(x_i-\mu)^2}}{N}}$$
যেখানে:
নিচের উদাহরণটি পপুলেশন ডেটার স্ট্যান্ডার্ড ডেভিয়েশন কীভাবে বের করতে হয় তা প্রদর্শন করে।
বিনিয়োগকারীরা প্রায়শই শেয়ার বা স্টককে ঝুঁকিপূর্ণ সম্পদ হিসেবে বিবেচনা করেন কারণ অন্যান্য বিনিয়োগ খাতের তুলনায় এর মূল্যের ওঠানামা বেশি হয়। ধরুন, একজন বিনিয়োগ ব্যবস্থাপক গত মাসের নির্দিষ্ট কিছু স্টকের অস্থিরতা (volatility) বিশ্লেষণ করতে চান। তিনি সিদ্ধান্ত নেন যে, কোনো স্টকের স্ট্যান্ডার্ড ডেভিয়েশন যদি তার গড়ের সমান বা তার চেয়ে বেশি হয়, তবে তিনি তার ক্লায়েন্টদের সেই স্টকটি সুপারিশ করবেন না এবং এগুলোকে "অত্যন্ত ঝুঁকিপূর্ণ" সম্পদ হিসেবে শ্রেণীবদ্ধ করবেন।
নিচে গত মাসের একটি নির্দিষ্ট স্টকের প্রতিদিনের ক্লোজিং প্রাইস (মার্কিন ডলারে) দেওয়া হলো। চলুন স্ট্যান্ডার্ড ডেভিয়েশন গণনা করে দেখি ব্যবস্থাপক এই স্টকটিকে অত্যন্ত ঝুঁকিপূর্ণ হিসেবে বিবেচনা করবেন কি না:
1.31, 1.30, 1.36, 1.40, 1.40, 1.41, 1.27, 1.19, 1.15, 1.12, 0.99, 1.00, 0.97, 0.94, 0.88, 0.90, 0.86, 0.88, 0.80, 0.81
যেহেতু ব্যবস্থাপক শুধুমাত্র গত মাসের স্টক মূল্যের বিষয়ে আগ্রহী এবং আমাদের কাছে ওই নির্দিষ্ট সময়সীমার সমস্ত রেকর্ড করা মূল্য রয়েছে, তাই আমরা সম্পূর্ণ পপুলেশন নিয়ে কাজ করছি। অতএব, আমরা পপুলেশন স্ট্যান্ডার্ড ডেভিয়েশনের সূত্র ব্যবহার করব।
স্ট্যান্ডার্ড ডেভিয়েশন বের করতে, আমাদের প্রথমে গড় (μ) গণনা করতে হবে। মনে রাখবেন, সংখ্যাগুলোর মোট যোগফলকে সংখ্যাগুলোর মোট পরিমাণ দিয়ে ভাগ করে গড় নির্ণয় করা হয়।
$$\mu=\frac{1.31+1.30+1.36+1.40+1.40+1.41+1.27+1.19+1.15+1.12+0.99+1.00+0.97+0.94+0.88+0.90+0.86+0.88+0.80+0.81}{20}=1.097$$
এরপর, প্রতিটি স্বতন্ত্র ডেটা পয়েন্ট থেকে গড় বিয়োগ করুন এবং বিয়োগফলকে বর্গ করুন। এই সমস্ত বর্গ করা বিয়োগফলগুলোকে একসাথে যোগ করুন এবং ফলাফলটিকে মোট সংখ্যা দিয়ে ভাগ করুন। এই ফলাফলটি হলো ভেদাঙ্ক (σ²)।
$$\sigma^2=\frac{\left(1.31-1.097\right)^2+\left(1.30-1.097\right)^2+\left(1.36-1.097\right)^2+\left(1.40-1.097\right)^2+\ldots+\left(0.81-1.097\right)^2}{20}=0.045031$$
সবশেষে, পপুলেশন স্ট্যান্ডার্ড ডেভিয়েশন নির্ণয় করতে ভেদাঙ্কের বর্গমূল করুন।
$$\sigma=\sqrt{0.045031}\approx0.21$$
যেমনটা আপনি দেখতে পাচ্ছেন, গত মাসের এই স্টকের মূল্যের স্ট্যান্ডার্ড ডেভিয়েশন (0.21) এর গড়ের (1.097) চেয়ে কম। তাই ব্যবস্থাপক এই স্টকটিকে "অত্যন্ত ঝুঁকিপূর্ণ" হিসেবে বিবেচনা করবেন না।
যখন আপনার ডেটাসেট বৃহত্তর কোনো পপুলেশনের একটি স্যাম্পল (বা ছোট উপসেট) মাত্র, তখন আপনার স্যাম্পল স্ট্যান্ডার্ড ডেভিয়েশন গণনা করা উচিত। স্যাম্পল স্ট্যান্ডার্ড ডেভিয়েশনকে s অক্ষর দ্বারা প্রকাশ করা হয় এবং এটি নিচের সূত্র ব্যবহার করে গণনা করা হয়:
$$s=\sqrt{\frac{\sum_{i=1}^{n}\left(x_i-\bar{x}\right)^2}{n-1}}$$
যেখানে:
চলুন পূর্ববর্তী উদাহরণের একটু ভিন্ন রূপ ব্যবহার করে কীভাবে স্যাম্পল স্ট্যান্ডার্ড ডেভিয়েশন নির্ণয় করতে হয় তা ব্যাখ্যা করি। ধরুন, বিনিয়োগ ব্যবস্থাপক একই স্টক বিশ্লেষণ করতে চান, কিন্তু এবার, তার কাছে গত মাসের প্রতিটি ট্রেডিং দিনের ক্লোজিং প্রাইস নেই। এর পরিবর্তে, তার কাছে এলোমেলোভাবে নেওয়া মাত্র 5 দিনের একটি স্যাম্পলের ক্লোজিং প্রাইস রয়েছে। তাকে এই সীমিত স্যাম্পল ডেটা ব্যবহার করে স্টকের স্ট্যান্ডার্ড ডেভিয়েশন অনুমান করতে হবে।
ধরে নেওয়া যাক, 5টি রেকর্ড করা ক্লোজিং প্রাইস হলো:
1.31, 1.40, 0.86, 0.88, 1.40
যদিও ব্যবস্থাপকের মূল আগ্রহ সম্পূর্ণ গত মাসের ওপর, তার কাছে শুধুমাত্র 5 দিনের একটি উপসেট বা অংশ রয়েছে। যেহেতু আমরা সম্পূর্ণ পপুলেশনের বদলে একটি স্যাম্পল নিয়ে কাজ করছি, তাই আমাদের স্যাম্পল স্ট্যান্ডার্ড ডেভিয়েশনের সূত্র ব্যবহার করে পরিমিত ব্যবধান গণনা করতে হবে।
প্রথমে স্যাম্পল গড় (x̄) নির্ণয় করুন।
$$\bar{x}=\frac{1.31+1.40+0.86+0.88+1.40}{5}=1.17$$
এরপর স্যাম্পল ভেদাঙ্ক (s²) গণনা করুন।
$$s^2=\frac{\left(1.31-1.17\right)^2+\left(1.40-1.17\right)^2+\left(0.86-1.17\right)^2+\left(0.88-1.17\right)^2+\left(1.40-1.17\right)^2}{5-1}=0.0764$$
সবশেষে, স্যাম্পল স্ট্যান্ডার্ড ডেভিয়েশন পেতে ভেদাঙ্কের বর্গমূল করুন।
$$s=\sqrt{0.0764}\approx 0.28$$
স্ট্যান্ডার্ড ডেভিয়েশনের একটি অত্যন্ত কার্যকরী প্রয়োগ হলো মানগুলোর একটি "গ্রহণযোগ্য" পরিসর গণনা করা, যা প্রেডিকটিভ অ্যানালিটিক্স এবং শিল্পক্ষেত্রে পরিসংখ্যানগত মান নিশ্চিতকরণে গুরুত্বপূর্ণ ভূমিকা পালন করে। যদি মূল ডেটা একটি স্বাভাবিক বন্টন (normal distribution) মেনে চলে, তবে এই পরিসরটি কনফিডেন্স ইন্টারভ্যাল হিসেবে পরিচিত (পরবর্তী বিভাগে বিস্তারিত বলা হয়েছে)। এই ইন্টারভ্যালগুলো বিভিন্ন কনফিডেন্স লেভেলে গণনা করা হয়, যা সাধারণত শতকরা হিসেবে প্রকাশ করা হয়।
মার্জিন অফ এরর হলো কনফিডেন্স ইন্টারভ্যালের একটি মূল উপাদান যা এর সামগ্রিক প্রস্থ নির্ধারণ করে। মূলত, মার্জিন অফ এরর আপনার বিশ্লেষিত মেট্রিকের জন্য সর্বোচ্চ এবং সর্বনিম্ন গ্রহণযোগ্য মান প্রতিষ্ঠা করে।
নিচের সূত্র ব্যবহার করে মার্জিন অফ এরর গণনা করা হয়:
$$Margin\ of\ error\ = z_{\alpha/2}\left(\dfrac{\sigma}{\sqrt{n}}\right)$$
যখন পপুলেশন স্ট্যান্ডার্ড ডেভিয়েশন (σ) জানা থাকে এবং স্যাম্পল সাইজ যথেষ্ট বড় হয় (সাধারণত n > 30), তখন আমরা এই সূত্রটি প্রয়োগ করি।
যখন পপুলেশন স্ট্যান্ডার্ড ডেভিয়েশন অজানা থাকে এবং স্যাম্পল ছোট হয় (সাধারণত n ≤ 30), তখন আমরা এর পরিবর্তে নিচের সূত্রটি ব্যবহার করি:
$$Margin\ of\ error\ = t_{n-1,\alpha/2}\left(\frac{s}{\sqrt{n}}\right)$$
এই ক্ষেত্রে, আমরা পপুলেশন স্ট্যান্ডার্ড ডেভিয়েশনের (σ) পরিবর্তে স্যাম্পল স্ট্যান্ডার্ড ডেভিয়েশন (s) ব্যবহার করি।
\$z_{\alpha/2}\$ এবং \$t_{n-1, \alpha/2}\$ উপাদানগুলো ক্রিটিকাল ভ্যালু (critical values) বা ক্রান্তিক মান হিসেবে পরিচিত। এগুলো যথাক্রমে z-স্ট্যাটিস্টিকস এবং t-স্ট্যাটিস্টিকস ব্যবহার করে নির্ধারণ করা হয়, এবং আপনার নির্বাচিত কনফিডেন্স লেভেলের সাথে যুক্ত ধ্রুবক হিসেবে কাজ করে।
পরিসংখ্যানগত বিশ্লেষণে ব্যবহৃত সবচেয়ে সাধারণ কনফিডেন্স লেভেলগুলো হলো 90%, 95% এবং 99%। এদের সংশ্লিষ্ট \$z_{\alpha/2}\$ ক্রিটিকাল ভ্যালুগুলো হলো 1.645 (90% এর জন্য), 1.96 (95% এর জন্য) এবং 2.575 (99% এর জন্য)।
\$\frac{\sigma}{\sqrt n}\$ এবং \$\frac{s}{\sqrt n}\$ উপাদানগুলো স্ট্যান্ডার্ড এরর (standard error) নির্দেশ করে।
উপরে যেমন উল্লেখ করা হয়েছে, কনফিডেন্স ইন্টারভ্যাল হলো মানের একটি পরিসংখ্যানগত পরিসর, যার মধ্যে একটি নির্দিষ্ট কনফিডেন্স লেভেলের উপর ভিত্তি করে কোনো পপুলেশন প্যারামিটার থাকার সম্ভাবনা থাকে।
উদাহরণস্বরূপ, একজন পরিসংখ্যানবিদ বলতে পারেন যে 90% কনফিডেন্স লেভেলে 13 বছর বয়সী মেয়েদের গড় উচ্চতা 59 ইঞ্চি থেকে 66 ইঞ্চির মধ্যে থাকে। এর মানে হলো, যদি আমরা 13 বছর বয়সী মেয়েদের একাধিক র্যান্ডম স্যাম্পল নিই, তবে প্রায় 90% ক্ষেত্রে তাদের গড় উচ্চতা ওই দুই সীমার মধ্যে থাকবে।
যখন পপুলেশন স্ট্যান্ডার্ড ডেভিয়েশন জানা থাকে, তখন নিচের সূত্র ব্যবহার করে কনফিডেন্স ইন্টারভ্যাল গণনা করা হয়:
$$\bar{x}± z_{\alpha/2}\left(\frac{\sigma}{\sqrt{n}}\right)$$
যদি আমরা পপুলেশন স্ট্যান্ডার্ড ডেভিয়েশন (σ) না জানি এবং তার বদলে স্যাম্পল স্ট্যান্ডার্ড ডেভিয়েশন (s) ব্যবহার করতে বাধ্য হই, তবে আমরা এই বিকল্প সূত্রটি ব্যবহার করি:
$$\bar{x}± t_{n-1,\alpha/2}\left(\frac{s}{\sqrt{n}}\right)$$
আগের বিভাগে বিস্তারিত আলোচনা করা হয়েছে যে, \$z_{\alpha/2}\left(\frac{\sigma}{\sqrt{n}}\right)\$ এবং \$t_{n-1,\alpha/2}\left(\frac{s}{\sqrt{n}}\right)\$ রাশিমালাগুলো মার্জিন অফ এরর প্রকাশ করে।
ধরুন আমরা জানি যে আমরা যে প্রতিদিনের স্টক মূল্যগুলো বিশ্লেষণ করছি তা একটি নরমাল ডিস্ট্রিবিউশন অনুসরণ করে। আমাদের কাছে 10টি স্টক মূল্যের নিচের স্যাম্পলটি রয়েছে:
1.31, 1.36, 1.40, 1.27, 1.15, 0.99, 0.97, 0.88, 0.86, 0.80
আমরা 95% কনফিডেন্স লেভেলে এমন একটি পরিসর গণনা করতে চাই, যার মধ্যে স্টকের প্রকৃত গড় মূল্য ওঠানামা করবে।
যেহেতু এটি একটি ছোট স্যাম্পল এবং পপুলেশন স্ট্যান্ডার্ড ডেভিয়েশন অজানা, তাই আমরা স্যাম্পল স্ট্যান্ডার্ড ডেভিয়েশন এবং সংশ্লিষ্ট t-স্ট্যাটিস্টিক সূত্র ব্যবহার করব:
$$\bar{x}± t_{n-1,\alpha/2}\left(\frac{s}{\sqrt{n}}\right)$$
এখন, আমরা এই সংখ্যাগুলো আমাদের কনফিডেন্স ইন্টারভ্যাল সূত্রে বসিয়ে দিই:
$$\bar{x}± t_{n-1,\alpha/2}\left(\frac{s}{\sqrt{n}}\right)$$
নিম্ন এবং উচ্চ সীমা (lower and upper bounds) গণনা করে আমরা পাই:
$$1.10 - 2.26 (\frac{0.23}{\sqrt{10}}) = 1.10 - 2.26 (\frac{0.23}{3.16}) = 1.10 - 2.26 × 0.07 = 1.10 - 0.16 = 0.94$$
$$1.10 + 2.26 (\frac{0.23}{\sqrt{10}}) = 1.10 + 2.26 (\frac{0.23}{3.16}) = 1.10 + 2.26 × 0.07 = 1.10 + 0.16 = 1.26$$
এই ফলাফলের অর্থ হলো আমরা 95% নিশ্চিত হতে পারি যে এই স্টকের আসল গড় শেয়ার মূল্য (0.94, 1.26) কনফিডেন্স ইন্টারভ্যালের মধ্যে রয়েছে।