পরিসংখ্যান ক্যালকুলেটর
ভ্যারিয়েন্স ক্যালকুলেটর


ভ্যারিয়েন্স ক্যালকুলেটর

আমাদের ভ্যারিয়েন্স ক্যালকুলেটর দিয়ে সহজেই যেকোনো নমুনা বা পপুলেশন ডেটার ভ্যারিয়েন্স, স্ট্যান্ডার্ড ডেভিয়েশন এবং গড় নির্ণয় করুন এবং ধাপে ধাপে সমাধান পান।

নমুনা জনসংখ্যা
বিচরণ σ2 = 28.5 s2 = 24.9375
মানক বিচ্যুতি σ = 5.3385 s = 4.9937
গণনা n = 8 n = 8
গড় μ = 18.25 x̄ = 18.25
বর্গগুলোর যোগফল SS = 199.5 SS = 199.5

আপনার গণনায় একটি ত্রুটি ছিল।

সূচিপত্র

  1. পরিবর্তনশীলতার পরিমাপ হিসেবে ভ্যারিয়েন্স (Variance)
  2. এই ক্যালকুলেটরটি ব্যবহারের নিয়মাবলি
  3. ভ্যারিয়েন্সের সূত্র: পপুলেশন ভ্যারিয়েন্স বনাম স্যাম্পল ভ্যারিয়েন্স
    1. পপুলেশন ভ্যারিয়েন্স
    2. স্যাম্পল ভ্যারিয়েন্স
  4. ভ্যারিয়েন্স নির্ণয়ের ধাপসমূহ
  5. স্যাম্পল ভ্যারিয়েন্স গণনার উদাহরণ
  6. ভ্যারিয়েন্সের তাৎপর্য

ভ্যারিয়েন্স ক্যালকুলেটর

পরিবর্তনশীলতার পরিমাপ হিসেবে ভ্যারিয়েন্স (Variance)

কোনো ডেটাসেট বিশ্লেষণ করার সময়, পরিসংখ্যানগত অনুমানের একটি মৌলিক দিক হলো ডেটা তার গড় থেকে কতটা পরিবর্তিত বা বিচ্যুত হয় তা পরিমাপ করা। এই পরিবর্তনশীলতা পরিমাপের সবচেয়ে জনপ্রিয় মেট্রিকগুলো হলো:

  • ভ্যারিয়েন্স (Variance) হলো গড় থেকে বিচ্যুতিগুলোর বর্গের গড়।
  • স্ট্যান্ডার্ড ডেভিয়েশন (Standard deviation) বা পরিমিত ব্যবধান হলো ভ্যারিয়েন্সের বর্গমূল। এটি ডিসপারসন বা বিস্তৃতি এবং সামগ্রিক পরিবর্তনশীলতা পরিমাপের জন্য একটি বহুল ব্যবহৃত মেট্রিক।
  • কোয়েফিসিয়েন্ট অফ ভ্যারিয়েশন (The coefficient of variation), যা আপেক্ষিক স্ট্যান্ডার্ড ডেভিয়েশন (relative standard deviation) নামেও পরিচিত। এটি স্ট্যান্ডার্ড ডেভিয়েশন σ এবং গড় μ এর অনুপাত হিসেবে নির্ণয় করা হয়, অর্থাৎ \$(C_v=\frac{σ}{μ})\$।

আমাদের অনলাইন ভ্যারিয়েন্স ক্যালকুলেটর খুব সহজেই প্রদত্ত ডেটাসেটের ভ্যারিয়েন্স নির্ণয় করে এবং হিসাব প্রক্রিয়ার একটি বিস্তারিত, ধাপে ধাপে ব্রেকডাউন প্রদান করে।

এই ক্যালকুলেটরটি ব্যবহারের নিয়মাবলি

এই ভ্যারিয়েন্স ক্যালকুলেটরটি ডিলিমিটার (delimiter) দ্বারা পৃথক করা সংখ্যার তালিকা ইনপুট হিসেবে গ্রহণ করে। সমর্থিত ফরম্যাটিংয়ের কয়েকটি উদাহরণ নিচের টেবিলে দেখানো হলো:

সারি ইনপুট কলাম ইনপুট কলাম ইনপুট কলাম ইনপুট
44, 63, 72, 75, 80, 86, 87, 89 44 44, 44,63,72
44 63 72 75 80 86 87 89 63 63, 75,80
44,, 63,, 72, 75, 80, 86, 87, 89 72 72, 86,87
44 63 72 75, 80, 86, 87, 89 75 75, 89
44; 63; 72, 75,, 80, 86, 87, 89 80 80,
44,,, 63,, 72, 75, 80, 86, 87, 89 86 86,
44 63,, 72,,,, 75, 80, 86, 87, 89 87 87,
89 89,

আপনি কমা, স্পেস, লাইন ব্রেক বা এই ডিলিমিটারগুলোর সংমিশ্রণ ব্যবহার করে সংখ্যাগুলোকে আলাদা করতে পারেন। আপনি সারি (row) বা কলাম (column) যেকোনো ফরম্যাট ব্যবহার করতে পারেন। উপরের টেবিলে দেখানো সমস্ত ডেটা ফরম্যাটের জন্য, ক্যালকুলেটরটি ইনপুটকে 44, 63, 72, 75, 80, 86, 87 এবং 89 হিসেবে নির্ভুলভাবে প্রক্রিয়া করে।

আপনার ডেটা প্রবেশ করানোর পর, এটি কোনো নমুনা (sample) নাকি সম্পূর্ণ পপুলেশন (population) তা নির্বাচন করুন। ক্যালকুলেট বাটনে চাপ দেওয়ার পর, টুলটি পাঁচটি মূল পরিসংখ্যানগত প্যারামিটার প্রদর্শন করে: কাউন্ট (পর্যবেক্ষণের সংখ্যা), গড় (mean), বর্গের বিচ্যুতির সমষ্টি (sum of squared deviations), ভ্যারিয়েন্স (variance) এবং স্ট্যান্ডার্ড ডেভিয়েশন (standard deviation)।

এই ক্যালকুলেটরটি বিশেষভাবে কোনো ডেটাসেটের ভ্যারিয়েন্স গণনা করার জন্য তৈরি করা হয়েছে। এছাড়া, এটি প্রতিটি ধাপ স্পষ্টভাবে দেখিয়ে এর পেছনের পরিসংখ্যানগত তত্ত্ব সম্পর্কে মূল্যবান ধারণা প্রদান করে।

অত্যন্ত নির্ভরযোগ্য পরিসংখ্যানগত অনুমানের জন্য, সব সময় একটি বড় ডেটাসেট ব্যবহার করা শ্রেয়। তবে, সম্ভাব্য সকল পর্যবেক্ষণকে উপস্থাপন করে এমন পপুলেশন ডেটা সংগ্রহ করা প্রায়শই অবাস্তব। এ কারণে, পরিসংখ্যানবিদরা সাধারণত পপুলেশন থেকে একটি "নমুনা (sample)" গ্রহণ করেন, যা নমুনা ডেটা থেকে সরাসরি সমগ্র পপুলেশন সম্পর্কে সিদ্ধান্তে পৌঁছাতে সাহায্য করে।

ভ্যারিয়েন্স কোনো ডেটাসেটের গড়ের সাপেক্ষে এর গড় বিস্তৃতি পরিমাপ করে। এটি ঐতিহ্যগতভাবে পপুলেশনের জন্য σ² এবং নমুনার জন্য দ্বারা প্রকাশ করা হয়। σ² বা -এর বৃহত্তর মান গড়ের তুলনায় ডেটা পয়েন্টগুলোর বিস্তৃত বিচ্যুতি নির্দেশ করে, যেখানে ক্ষুদ্রতর মান নির্দেশ করে যে ডেটা পয়েন্টগুলো গড়ের কাছাকাছি অবস্থান করছে।

নিচের উদাহরণ ডেটাসেটগুলো বিবেচনা করুন:

(Set I) 11, 3, 5, 21, 10, 15, 20, 25, 13, 26, 27,

(Set II) 12, 14, 14, 15, 15, 16, 16, 17, 18, 19, 20

ভ্যারিয়েন্স ক্যালকুলেটরে Set I ইনপুট দিলে ফলাফল আসে:

n=11

x̄=16

SS=704

s²=70.4

s=8.39

নমুনার (sample) জন্য, এবং

n=11

μ=16

SS=704

σ²=64

σ=8

পপুলেশনের (population) জন্য।

একইভাবে, ক্যালকুলেটরে Set II ইনপুট দিলে ফলাফল আসে:

n=11

x̄=16

SS=56

s²=5.6

s=2.36

নমুনার (sample) জন্য, এবং

n=11

μ=16

SS=56

σ²=5.09

σ=2.25

পপুলেশনের (population) জন্য।

  • Set I-এ সংখ্যাগুলো নমুনার গড় থেকে উল্লেখযোগ্যভাবে বিচ্যুত, যার ফলে ভ্যারিয়েন্স বেশি হয়:

s²=70.4

σ²=64

  • Set II-এ সামগ্রিক পরিবর্তনশীলতা অনেক কম:

s²=5.6

σ²=5.09

ভ্যারিয়েন্সের সূত্র: পপুলেশন ভ্যারিয়েন্স বনাম স্যাম্পল ভ্যারিয়েন্স

পপুলেশন ভ্যারিয়েন্স

পরিসংখ্যানে, একটি পপুলেশন বলতে কোনো পরীক্ষণের অন্তর্গত সমস্ত সম্ভাব্য পর্যবেক্ষণকে বোঝায়। N সংখ্যক পর্যবেক্ষণের জন্য, পপুলেশন ভ্যারিয়েন্সের সূত্র হলো:

$$\sigma^2=\frac{\sum_{i}^{N}{{(x_i-\ \mu)}^2\ }}{N}$$

যেখানে:

  • σ² হলো পপুলেশন ভ্যারিয়েন্স,
  • Σ যোগফল বা সমষ্টি নির্দেশ করে,
  • xᵢ হলো প্রতিটি স্বতন্ত্র পর্যবেক্ষণ,
  • μ হলো পপুলেশন গড়,
  • N হলো পপুলেশনের মোট পর্যবেক্ষণ সংখ্যা।

স্যাম্পল ভ্যারিয়েন্স

স্যাম্পল ভ্যারিয়েন্স বা নমুনার ভ্যারিয়েন্স নিচের সূত্র দ্বারা সংজ্ঞায়িত করা হয়:

$$s^2=\frac{\sum_{i}^{n}{{(x_i-\ \bar{x})}^2\ }}{n-1}$$

যেখানে:

  • হলো স্যাম্পল ভ্যারিয়েন্স,
  • Σ যোগফল বা সমষ্টি নির্দেশ করে,
  • xᵢ হলো প্রতিটি স্বতন্ত্র পর্যবেক্ষণ,
  • হলো স্যাম্পলের গড়,
  • n হলো স্যাম্পলে পর্যবেক্ষণের মোট সংখ্যা।

ভ্যারিয়েন্স নির্ণয়ের ধাপসমূহ

ম্যানুয়ালি ভ্যারিয়েন্স গণনা করার ক্ষেত্রে নিচের সাধারণ ধাপগুলো অনুসরণ করতে হয়:

ধাপ ১: স্যাম্পল বা পপুলেশনের গড় নির্ণয় করুন। এটি হলো সমস্ত ডেটা পয়েন্টের সমষ্টিকে ডেটা পয়েন্টের সংখ্যা দিয়ে ভাগ করা (নমুনার জন্য n এবং পপুলেশনের জন্য N), অর্থাৎ,

নমুনার গড় (Sample mean):

$$\bar{x}=\frac{\sum_{i=1}^{n} x_i}{n}$$

পপুলেশনের গড় (Population mean):

$$\mu=\frac{\sum_{i=1}^{N} x_i}{N}$$

ধাপ ২: প্রতিটি ডেটা পয়েন্ট থেকে স্যাম্পল বা পপুলেশনের গড় বিয়োগ করে প্রতিটি বিচ্যুতি (deviation) নির্ণয় করুন, অর্থাৎ,

নমুনার বিচ্যুতি (Sample deviations):

$$(x_1-\bar{x}), (x_2-\bar{x}), (x_3-\bar{x}), \ldots, (x_n-\bar{x})$$

পপুলেশনের বিচ্যুতি (Population deviations):

$$(x_1-\mu), (x_2-\mu), (x_3-\mu), \ldots, (x_N-\mu)$$

ধাপ ৩: প্রতিটি ডেটা পয়েন্টের জন্য বর্গের বিচ্যুতি বা স্কোয়ার্ড ডেভিয়েশন (squared deviations) নির্ণয় করুন।

নমুনার স্কোয়ার্ড ডেভিয়েশন:

$$(x_1-\bar{x})^2, (x_2-\bar{x})^2, (x_3-\bar{x})^2, \ldots, (x_n-\bar{x})^2$$

পপুলেশনের স্কোয়ার্ড ডেভিয়েশন:

$$(x_1-\mu)^2, (x_2-\mu)^2, (x_3-\mu)^2, \ldots, (x_N-\mu)^2$$

ধাপ ৪: বর্গের বিচ্যুতিগুলোর সমষ্টি (sum of the squared deviations) নির্ণয় করুন।

নমুনার বর্গের বিচ্যুতির সমষ্টি:

$$SS=\sum_{i=1}^{n}(x_i-\bar{x})^2$$

পপুলেশনের বর্গের বিচ্যুতির সমষ্টি:

$$SS=\sum_{i=1}^{N}(x_i-\mu)^2$$

ধাপ ৫: চূড়ান্ত ভ্যারিয়েন্স নির্ণয় করতে, বর্গের বিচ্যুতির সমষ্টিকে নমুনার ক্ষেত্রে n-1 দ্বারা এবং পপুলেশনের ক্ষেত্রে N দ্বারা ভাগ করুন।

স্যাম্পল ভ্যারিয়েন্স:

$$s^2=\frac{SS}{n-1}$$

পপুলেশন ভ্যারিয়েন্স:

$$\sigma^2=\frac{SS}{N}$$

স্যাম্পল ভ্যারিয়েন্স গণনার উদাহরণ

আসুন নিচের ডেটাসেটটি ব্যবহার করে একটি ব্যবহারিক উদাহরণ বিবেচনা করি: 1, 2, 4, 5, 6 এবং 12। স্যাম্পল ভ্যারিয়েন্স নির্ণয় করতে, আমরা এই ধাপগুলো অনুসরণ করব:

ধাপ ১: স্যাম্পল গড় নির্ণয় করুন।

$$\bar{x}=\frac{1+2+4+5+6+12}{6}=\frac{30}{6}=5$$

ধাপ ২: প্রতিটি ডেটা পয়েন্টের জন্য গড় থেকে বিচ্যুতি নির্ণয় করুন।

x₁-x̄ x₂-x̄ x₃-x̄ x₄-x̄ x₅-x̄ x₆-x̄
1 - 5 2 - 5 4 - 5 5 - 5 6 - 5 12 - 5
-4 -3 -1 0 1 7

ধাপ ৩: বিচ্যুতিগুলোর বর্গ নির্ণয় করুন।

(x₁-x̄)² (x₂-x̄)² (x₃-x̄)² (x₄-x̄)² (x₅-x̄)² (x₆-x̄)²
16 9 1 0 1 49

ধাপ ৪: বর্গের বিচ্যুতিগুলোর যোগফল নির্ণয় করুন।

$$SS=\sum_{i=1}^{n}{(x_i-\bar{x})}^2=16+9+1+0+1+49=76$$

ধাপ ৫: বর্গের বিচ্যুতির যোগফলকে ডিগ্রিস অফ ফ্রিডম (n-1) দ্বারা ভাগ করে স্যাম্পল ভ্যারিয়েন্স নির্ণয় করুন।

$$s^2=\frac{SS}{n-1}=\frac{76}{6-1}=\frac{76}{5}=15.2$$

পপুলেশনের ক্ষেত্রে, পপুলেশন ভ্যারিয়েন্স নির্ণয় করার জন্য আপনাকে n-1 এর পরিবর্তে n (মোট ডেটা পয়েন্টের সংখ্যা) দ্বারা ভাগ করতে হবে।

ভ্যারিয়েন্সের তাৎপর্য

বিনিয়োগের জগতে ভ্যারিয়েন্স এবং ডিসপারসন অত্যন্ত গুরুত্বপূর্ণ মেট্রিক। এগুলো সম্পদ পরিচালকদের (asset managers) তাদের বিনিয়োগের পারফরম্যান্স অপ্টিমাইজ করতে এবং কার্যকরভাবে পোর্টফোলিও পরিচালনা করতে সক্ষম করে। আর্থিক বিশ্লেষকরা একটি বিনিয়োগ পোর্টফোলিওতে নির্দিষ্ট সম্পদের ব্যক্তিগত ঝুঁকি এবং ঐতিহাসিক পারফরম্যান্স মূল্যায়ন করার জন্য ভ্যারিয়েন্সের উপর ব্যাপকভাবে নির্ভর করেন।

নতুন কিছু কেনার কথা বিবেচনা করার সময়, সম্ভাব্য বিনিয়োগের সাথে যুক্ত ঝুঁকিটি নেওয়ার যোগ্য কিনা তা নির্ধারণ করতে বিনিয়োগকারীরা ভ্যারিয়েন্স গণনা করেন। ডিসপারসন মেট্রিকগুলো বিশ্লেষকদের অনিশ্চয়তার পরিমাণ নির্ধারণ করতে সাহায্য করে—এমন একটি প্রভাবক যা ভ্যারিয়েন্স এবং স্ট্যান্ডার্ড ডেভিয়েশন ছাড়া সঠিকভাবে মূল্যায়ন করা প্রায় অসম্ভব।

যদিও অনিশ্চয়তা সরাসরি পরিমাপযোগ্য নয়, ভ্যারিয়েন্স এবং স্ট্যান্ডার্ড ডেভিয়েশন (ভ্যারিয়েন্সের বর্গমূল) বিনিয়োগকারীদের অনুমিত অস্থিরতা এবং একটি নির্দিষ্ট স্টক বৃহত্তর পোর্টফোলিওতে কেমন প্রভাব ফেলবে তা নির্ধারণ করতে সহায়তা করে।

অর্থায়নের বাইরেও, বিজ্ঞানী, পরিসংখ্যানবিদ, গণিতবিদ এবং ডেটা বিশ্লেষকদের জন্য ভ্যারিয়েন্স একটি অপরিহার্য হাতিয়ার। এটি পরীক্ষা-নিরীক্ষা এবং স্যাম্পল পপুলেশন সম্পর্কে গভীর গাণিতিক অন্তর্দৃষ্টি প্রদান করে।

বিজ্ঞানীরা প্রায়শই পরীক্ষা গোষ্ঠীগুলোর (test groups) মধ্যে কাঠামোগত পার্থক্য শনাক্ত করার জন্য ভ্যারিয়েন্সের উপর নির্ভর করেন, এটি নির্ধারণ করে যে তারা সফলভাবে কোনো হাইপোথিসিস (hypothesis) পরীক্ষা করার জন্য যথেষ্ট সদৃশ কিনা। ভ্যারিয়েন্স যত বেশি হবে, ডেটাসেটের মানগুলো তত বেশি বিক্ষিপ্ত হবে। ডেটা গবেষকরা এই তথ্যগুলো ব্যবহার করে বোঝেন যে সামগ্রিকভাবে ডেটাসেটটিকে এর গড় কতটা নির্ভুলভাবে উপস্থাপন করে।

তবে, ভ্যারিয়েন্স ব্যবহারের একটি অসুবিধা হলো এটি বড় আউটলায়ারের (outliers) প্রতি অত্যন্ত সংবেদনশীল। যেহেতু গড় থেকে বিচ্যুতিগুলোকে গাণিতিকভাবে বর্গ করা হয়, আউটলায়ারগুলোকে অসমভাবে বেশি গুরুত্ব দেওয়া হয়, যা অসাবধানতাবশত ডেটার সামগ্রিক উপস্থাপনাকে বিকৃত করতে পারে।

এই কারণে, অনেক গবেষক এবং আর্থিক পেশাজীবীরা স্ট্যান্ডার্ড ডেভিয়েশন নিয়ে কাজ করতে পছন্দ করেন। কারণ এটি ভ্যারিয়েন্সের বর্গমূল হিসেবে নির্ণয় করা হয়, স্ট্যান্ডার্ড ডেভিয়েশন মূল ডেটার একই এককে প্রকাশ করা হয়। এটি একটি অপেক্ষাকৃত ছোট, আরও সহজবোধ্য সংখ্যা প্রদান করে যা ব্যাখ্যা করা অনেক সহজ এবং চরম আউটলায়ার দ্বারা কিছুটা কম বিকৃত থাকে।