পরিসংখ্যান ক্যালকুলেটর
নমুনা আকার ক্যালকুলেটর


নমুনা আকার ক্যালকুলেটর

আপনার পরবর্তী জরিপ বা গবেষণার জন্য সঠিক নমুনার আকার এবং মার্জিন অফ এরর গণনা করুন। পরিসংখ্যানগতভাবে নির্ভুল ফলাফলের জন্য আমাদের বিনামূল্যের ক্যালকুলেটর ব্যবহার করুন।

নমুনার আকার

385

ত্রুটির সীমা

9.8%

আপনার গণনায় একটি ত্রুটি ছিল।

সূচিপত্র

  1. নমুনা (Sample)
  2. মার্জিন অফ এরর (Margin of error)
  3. কনফিডেন্স ইন্টারভাল (Confidence Interval)
  4. পরিসংখ্যানে নমুনা, মার্জিন অফ এরর এবং কনফিডেন্স ইন্টারভালের মধ্যে পারস্পরিক সম্পর্ক
  5. নমুনার আকার (Sample Size) গণনার সূত্র
  6. উদাহরণ ১
  7. উদাহরণ ২
  8. উদাহরণ ৩
  9. কনফিডেন্স ইন্টারভাল গণনার সূত্র
  10. উদাহরণ ৪

নমুনা আকার ক্যালকুলেটর

আমাদের বহুমুখী স্যাম্পল সাইজ ক্যালকুলেটরে দুটি প্রাথমিক ফাংশন রয়েছে: আদর্শ নমুনার আকার (sample size) গণনা করা এবং আপনার গবেষণার জন্য মার্জিন অফ এরর (margin of error) নির্ধারণ করা।

আপনার প্রয়োজনীয় নমুনার আকার গণনা করতে, প্রথমে ড্রপ-ডাউন মেনু থেকে আপনার পছন্দসই কনফিডেন্স লেভেল (confidence level) নির্বাচন করুন। এরপর, আপেক্ষিক মার্জিন অফ এরর (relative margin of error) ইনপুট করুন। (দ্রষ্টব্য: আপনি আপনার পয়েন্ট এস্টিমেট (point estimate) দিয়ে পরম মানকে ভাগ করে একটি পরম মার্জিন অফ এররকে আপেক্ষিক মার্জিনে রূপান্তর করতে পারেন)। যদি আপনার সঠিক পপুলেশন প্রপোরশন (population proportion) জানা থাকে তবে তা ইনপুট করুন; অন্যথায় এটিকে ডিফল্ট ৫০%-এ রেখে দিন। মোট জনসংখ্যার আকার (population size) জানা থাকলে নির্দিষ্ট ঘরে সেটি লিখুন, অথবা অজানা বা অসীম জনসংখ্যার জন্য এটি ফাঁকা রাখুন। সবশেষে, "Calculate" এ ক্লিক করুন।

ক্যালকুলেটরের দ্বিতীয় ফাংশন ব্যবহার করে মার্জিন অফ এরর নির্ধারণ করতে, ড্রপ-ডাউন মেনু থেকে আপনার কনফিডেন্স লেভেল বেছে নেওয়ার মাধ্যমে শুরু করুন। পরবর্তী ফিল্ডগুলোতে, গবেষণার নমুনার আকার এবং পপুলেশন প্রপোরশন লিখুন। সবশেষে, পপুলেশনের আকার ইনপুট করুন—অজানা থাকলে এটি ফাঁকা রাখুন—এবং "Calculate" এ ক্লিক করুন।

নমুনা (Sample)

পরিসংখ্যানে, একটি নমুনা হলো একটি বৃহত্তর জনসংখ্যার (population) একটি নির্দিষ্ট উপসেট বা অংশ। "পপুলেশন" বা জনসংখ্যা শব্দটি একটি নির্দিষ্ট গবেষণার অন্তর্ভুক্ত প্রতিটি উপাদান বা ব্যক্তিকে বোঝায়। যদিও সমগ্র জনসংখ্যার ওপর জরিপ চালালে সবচেয়ে নির্ভুল ডেটা পাওয়া যায়, তবুও অসংখ্য সীমাবদ্ধতার কারণে বাস্তবে তা করা খুব কমই সম্ভব হয়।

উদাহরণস্বরূপ, আপনি যদি একটি বিশাল জঙ্গলে নির্দিষ্ট প্রজাতির কীটপতঙ্গ নিয়ে গবেষণা করেন, তবে সেখানকার জনসংখ্যা কার্যত অসীম, যা একটি বিস্তৃত শুমারিকে অসম্ভব করে তোলে। উপরন্তু, কিছু পরীক্ষামূলক পদ্ধতি স্বভাবতই ধ্বংসাত্মক হয়ে থাকে। আপনি যদি এর সঠিক আয়তন পরিমাপ করার জন্য একটি সিল করা কোমল পানীয়ের বোতল খোলেন, তবে সেই নির্দিষ্ট পণ্যটি আর বাজারে পাঠানোর উপযোগী থাকে না।

একটি সমগ্র জনসংখ্যা মূল্যায়ন করার জন্য উল্লেখযোগ্য সময়, মূলধন এবং সম্পদের প্রয়োজন। যেহেতু গবেষকরা সাধারণত কঠোর বাজেট এবং সময়ের সীমাবদ্ধতার মধ্যে কাজ করেন, তাই বেশিরভাগ ক্ষেত্রেই সম্পূর্ণ জনসংখ্যার ওপর শুমারি পরিচালনা করা অবাস্তব। এর সবচেয়ে কার্যকর সমাধান হলো একটি প্রতিনিধিত্বমূলক নমুনা (representative sample) বের করে আনা এবং সেই ছোট গোষ্ঠীর ওপর গবেষণা পরিচালনা করা।

মার্জিন অফ এরর (Margin of error)

যেহেতু জনসংখ্যার প্রতিটি উপাদান পরীক্ষা করা খুব কমই সম্ভব, তাই গবেষকরা পপুলেশন প্যারামিটার (পুরো জনসংখ্যার বৈশিষ্ট্যযুক্ত মেট্রিক্স) অনুমান করতে স্যাম্পল স্ট্যাটিস্টিক্স (নমুনা থেকে গণনা করা মেট্রিক্স) ব্যবহার করেন। এই স্যাম্পল স্ট্যাটিস্টিক্স আপনার নির্বাচিত নমুনার মধ্যে পর্যবেক্ষণ করা প্রকৃত ডেটা উপস্থাপন করে। আপনি যখন এই ডেটার উপর ভিত্তি করে একটি পপুলেশন প্যারামিটারের জন্য একটি একক মান অনুমান করেন, তখন এটি পয়েন্ট এস্টিমেট (point estimate) হিসাবে পরিচিত হয়।

উদাহরণস্বরূপ, আপনি যদি প্রোডাকশন লাইনে কোমল পানীয়ের বোতলগুলোর গড় আয়তন অনুমান করতে চান, তবে আপনি একটি র‍্যান্ডম ব্যাচ নির্বাচন করতে পারেন এবং এর গড় আয়তন গণনা করতে পারেন। ধরে নেওয়া যাক, সেই ব্যাচটির গড় আয়তন (x̄) হলো ২৫০ মিলি। এই পয়েন্ট এস্টিমেটের উপর ভিত্তি করে, আপনি ধরে নিতে পারেন যে পুরো প্রোডাকশন লাইনের প্রতিটি বোতলের গড় আয়তন \$(\hat{μ})\$ ২৫০ মিলি।

বাস্তবে, একটি আনুমানিক প্যারামিটার খুব কম ক্ষেত্রেই প্রকৃত পপুলেশন প্যারামিটারের সাথে পুরোপুরি মিলে যায়। এই অমিলটি স্বাভাবিকভাবেই ঘটে কারণ এই গণনাটি সম্পূর্ণ জনসংখ্যার পরিবর্তে শুধুমাত্র একটি নমুনার উপর নির্ভর করে।

মার্জিন অফ এরর এই অনিশ্চয়তাকে পরিমাপ করে। এটিকে একটি প্যারামিটারের পয়েন্ট এস্টিমেট এবং এর প্রকৃত পপুলেশন মানের মধ্যে সর্বাধিক প্রত্যাশিত পার্থক্য হিসাবে সংজ্ঞায়িত করা হয়, যাকে কখনও কখনও অনুমানের সর্বোচ্চ ত্রুটি (maximum error of the estimate) হিসেবেও উল্লেখ করা হয়।

কনফিডেন্স ইন্টারভাল (Confidence Interval)

কনফিডেন্স ইন্টারভাল এমন একটি গ্রহণযোগ্য পরিসরকে নির্দেশ করে যার মধ্যে একটি পপুলেশন প্যারামিটারের অবস্থান আশা করা যায়। অনুমানের এই পরিসীমা নির্দেশ করে যে, একটি নির্দিষ্ট মার্জিন অফ এররের মধ্যে একটি প্যারামিটার গণনা করা হয়েছে। কনফিডেন্স ইন্টারভালের নিম্ন সীমা গণনা করতে, আপনাকে পয়েন্ট এস্টিমেট থেকে মার্জিন অফ এরর বিয়োগ করতে হবে। বিপরীতভাবে, উচ্চ সীমা বের করতে, পয়েন্ট এস্টিমেটের সাথে মার্জিন অফ এরর যোগ করতে হবে।

পরিসংখ্যানে নমুনা, মার্জিন অফ এরর এবং কনফিডেন্স ইন্টারভালের মধ্যে পারস্পরিক সম্পর্ক

সমগ্র জনসংখ্যার ওপর জরিপ করার পরিবর্তে, গবেষকরা পপুলেশন প্যারামিটার সম্পর্কে সুশিক্ষিত অনুমান করার জন্য একটি নমুনা নিয়ে অধ্যয়ন করেন। এই স্যাম্পলিং পদ্ধতির কারণে, আনুমানিক প্যারামিটার এবং প্রকৃত পপুলেশন প্যারামিটারের মধ্যে একটি স্বাভাবিক ভিন্নতা দেখা যায়। মার্জিন অফ এরর পয়েন্ট এস্টিমেট এবং প্রকৃত মানের মধ্যে সর্বাধিক প্রত্যাশিত পার্থক্য নির্ধারণ করে এই ভিন্নতার হিসাব রাখে।

সবচেয়ে গুরুত্বপূর্ণ বিষয় হলো, নমুনার আকার এবং মার্জিন অফ এররের মধ্যে একটি ব্যস্তানুপাতিক সম্পর্ক রয়েছে। একটি বড় আকারের নমুনা বৃহত্তর জনসংখ্যার আরও নিখুঁত উপস্থাপনা প্রদান করে, যা কার্যকরভাবে মার্জিন অফ এরর কমিয়ে দেয়। বিপরীতভাবে, একটি ছোট আকারের নমুনা ব্যবহার করলে মার্জিন অফ এরর বৃদ্ধি পায়।

পরিশেষে, আপনার প্রাথমিক পয়েন্ট এস্টিমেটে এই মার্জিন অফ এরর প্রয়োগ করলে গবেষণার কনফিডেন্স ইন্টারভাল পাওয়া যায়।

নমুনার আকার (Sample Size) গণনার সূত্র

উপলব্ধ ডেটার উপর নির্ভর করে, উপযুক্ত নমুনার আকার গণনা করতে বেশ কয়েকটি সূত্র ব্যবহার করা যেতে পারে।

আপনার কাঙ্ক্ষিত কনফিডেন্স লেভেল নির্ভুলতার মাত্রা নির্ধারণ করে, যেখানে গ্রহণযোগ্য মার্জিন অফ এরর আপনার রেঞ্জ এস্টিমেটের সূক্ষ্মতা নির্ধারণ করে।

যদি পপুলেশন স্ট্যান্ডার্ড ডেভিয়েশন জানা থাকে, তবে আপনি নিচের সূত্রটি ব্যবহার করে আপনার লক্ষ্যমাত্রার কনফিডেন্স ইন্টারভাল অর্জনের জন্য প্রয়োজনীয় ন্যূনতম নমুনার আকার গণনা করতে পারেন:

$$n=\left(\frac{z_{\alpha/2}×\sigma}{E}\right)^2$$

চূড়ান্ত ফলাফল n-কে তার নিকটবর্তী পূর্ণ সংখ্যায় রাউন্ড আপ (round up) করা উচিত।

বিকল্পভাবে, ককরান সূত্র (Cochran formula) আপনাকে আপনার গ্রহণযোগ্য মার্জিন অফ এরর, লক্ষ্যমাত্রার কনফিডেন্স লেভেল এবং জনসংখ্যার মধ্যে বৈশিষ্ট্যের আনুমানিক অনুপাতের উপর ভিত্তি করে ন্যূনতম নমুনার আকার নির্ধারণ করতে সহায়তা করে। ককরান সূত্রটি নিচে প্রকাশ করা হলো:

$$n₀=\frac{z^2p(1-p)}{E^2}$$

  • z = আপনার কাঙ্ক্ষিত কনফিডেন্স লেভেলের সাথে সামঞ্জস্যপূর্ণ z-টেবিল থেকে প্রাপ্ত Z-স্কোর
  • p = জনসংখ্যার মধ্যে উপস্থিত বৈশিষ্ট্যের প্রত্যাশিত অনুপাত (প্রপোরশন)
  • E = মার্জিন অফ এরর

উদাহরণ ১

ধরে নিন, আমরা পুরো কানাডায় স্নাতক কোর্সে অধ্যয়নরত আন্তর্জাতিক শিক্ষার্থীদের নিয়ে গবেষণা করছি। শুরুতে আমাদের কাছে সুনির্দিষ্ট ডেটা নেই, তাই আমরা অনুমান করি যে কানাডার মোট স্নাতক শিক্ষার্থীদের মধ্যে ৬০% হলো আন্তর্জাতিক শিক্ষার্থী। ফলস্বরূপ, আনুমানিক পপুলেশন প্রপোরশন হলো ৬০%। আমরা যদি ৯৫% কনফিডেন্স লেভেল এবং ৪% মার্জিন অফ এরর চাই, তবে এই গবেষণার জন্য প্রয়োজনীয় ন্যূনতম নমুনার আকার কত হবে?

$$(1-\alpha)=95\%$$

$$z_{α/2}=z_{{95\%}/2}=1.96$$

$$p=60\%$$

$$E=4\%$$

$$n₀=\frac{z²p(1-p)}{E²}=\frac{1.96²×60\%×(1-60\%)}{4\%²}=576.24≈577$$

অতএব, ৪% মার্জিন অফ এররসহ ৯৫% কনফিডেন্স লেভেল অর্জনের জন্য ন্যূনতম ৫৭৭ জন শিক্ষার্থীর ওপর জরিপ চালাতে হবে।

বৃহত্তর বা অসীম জনসংখ্যার জন্য ককরান সূত্রটি আদর্শ। তবে, আপনার পপুলেশনের আকার যদি ছোট বা সসীম হয়, তবে আপনাকে নমুনার আকার সমন্বয় (adjust) করতে হবে। সসীম জনসংখ্যা সংশোধনের (finite population correction) সূত্রটি হলো:

$$n=\frac{n₀}{1+\left(\frac{n₀-1}{N}\right)}$$

  • n₀ = ককরান সূত্র ব্যবহার করে গণনা করা প্রাথমিক নমুনার আকার
  • N = মোট জনসংখ্যার আকার
  • n = সসীম জনসংখ্যার জন্য সমন্বয়কৃত নমুনার আকার

উদাহরণ ২

এবার ধরুন, আমরা কানাডায় আপনার নির্দিষ্ট কলেজে স্নাতক কোর্সে অধ্যয়নরত আন্তর্জাতিক শিক্ষার্থীদের নিয়ে গবেষণা করছি। আগের উদাহরণের মতো, আমরা ধরে নিই যে আন্তর্জাতিক শিক্ষার্থীরা মোট শিক্ষার্থীর ৬০%। ফলে আনুমানিক প্রপোরশন ৬০% ই থাকছে। তবে, আপনার কলেজে মোট শিক্ষার্থীর সংখ্যা ঠিক ১২,০০০ জন। ৯৫% কনফিডেন্স লেভেল এবং ৪% মার্জিন অফ এররের জন্য ন্যূনতম কত নমুনার আকার প্রয়োজন?

এই পরিস্থিতিতে, যেহেতু জনসংখ্যা সসীম, তাই আপনাকে প্রথমে ককরান সূত্র ব্যবহার করে n₀ গণনা করতে হবে এবং তারপর সমন্বয় (adjustment) প্রয়োগ করতে হবে।

$$n₀=\frac{z^2p(1-p)}{{E}^2}=\frac{1.96^2×{60\%}×(1-{60\%})}{{4\%}^2}=576.24$$

$$n=\frac{n₀}{1+\left(\frac{n₀-1}{N}\right)}=\frac{576.24}{1+\left(\frac{576.24-1}{12,000}\right)}=549.88\approx550$$

আমাদের ডেডিকেটেড ন্যূনতম নমুনার আকার ক্যালকুলেটর ব্যবহার করে, আপনি এই জটিল ম্যানুয়াল গণনাগুলো এড়িয়ে যেতে পারেন এবং মাত্র কয়েক সেকেন্ডের ভগ্নাংশে নির্ভুল ফলাফল পেতে পারেন।

মার্জিন অফ এরর গণনার সূত্র

মার্জিন অফ এরর বের করার জন্য আপনি গাণিতিকভাবে স্ট্যান্ডার্ড স্যাম্পল সাইজ সূত্রটিকে পুনর্বিন্যাস করতে পারেন।

ন্যূনতম নমুনার আকার সূত্রটি দিয়ে শুরু করা যাক:

$$n₀=\frac{z^2p\left(1-p\right)}{E^2}$$

আমরা সমীকরণের সাবজেক্ট হিসেবে E-কে (মার্জিন অফ এরর) আলাদা করতে পারি:

$$n₀=\frac{z^2p\left(1-p\right)}{E^2}$$

$${n₀}×{E}^2=z^2p\left(1-p\right)$$

$$E^2=\frac{z^2p\left(1-p\right)}{n₀}$$

$$E=\sqrt{\frac{z^2p\left(1-p\right)}{n₀}}$$

$$E=z\sqrt{\frac{p\left(1-p\right)}{n₀}}$$

উদাহরণ ৩

কানাডায় আন্তর্জাতিক স্নাতক শিক্ষার্থীদের নিয়ে আমাদের দেশব্যাপী গবেষণায় ফিরে গিয়ে ধরে নিই যে, তারা মোট স্নাতক জনসংখ্যার ৬০% প্রতিনিধিত্ব করে। আপনি যদি ৫৭৭ জন শিক্ষার্থীর নমুনার ওপর জরিপ চালান এবং ৯৫% কনফিডেন্স লেভেলের লক্ষ্য রাখেন, তবে আপনার গবেষণার সঠিক মার্জিন অফ এরর কত হবে?

$$z_{{95\%}/2}=1.96$$

$$p=60\%$$

$$n₀=577$$

$$E=z\sqrt{\frac{p\left(1-p\right)}{n_0}}=1.96 \times \sqrt{\frac{60\% \times \left(1-60\%\right)}{577}}=4\%$$

সসীম জনসংখ্যা নিয়ে কাজ করার সময়, আপনাকে প্রথমে নিচের সূত্রটি ব্যবহার করে সমন্বয়কৃত n₀ নির্ধারণ করতে হবে:

$$n₀=\frac{n-nN}{n-N}$$

এই মানটি পেয়ে গেলে, এটিকে মূল মার্জিন অফ এরর সূত্রে প্রয়োগ করুন:

$$E=z\sqrt{\frac{p\left(1-p\right)}{n₀}}$$

আমাদের স্যাম্পল সাইজ ক্যালকুলেটরে থাকা বিল্ট-ইন মার্জিন অফ এরর ফিচারটি ব্যবহার করে আপনি এই ক্লান্তিকর ম্যানুয়াল ধাপগুলো এড়িয়ে যেতে পারেন এবং তাৎক্ষণিকভাবে আপনার গবেষণার মার্জিন অফ এরর খুঁজে পেতে পারেন।

কনফিডেন্স ইন্টারভাল গণনার সূত্র

একবার মার্জিন অফ এরর নির্ধারণ করা হয়ে গেলে কনফিডেন্স ইন্টারভাল গণনা করা বেশ সহজ। আপনি নিচের বেসলাইন সূত্রগুলো ব্যবহার করে কনফিডেন্স ইন্টারভাল গণনা করতে পারেন:

কনফিডেন্স ইন্টারভাল = পয়েন্ট এস্টিমেট ± মার্জিন অফ এরর

কনফিডেন্স ইন্টারভালের উচ্চ সীমা = পয়েন্ট এস্টিমেট + মার্জিন অফ এরর

কনফিডেন্স ইন্টারভালের নিম্ন সীমা = পয়েন্ট এস্টিমেট - মার্জিন অফ এরর

পপুলেশন মিন বা গড়ের (μ) জন্য, কনফিডেন্স ইন্টারভালটি নিম্নরূপে প্রকাশ করা হয়:

x̄ - E < μ < x̄ + E

এখানে, x̄ - E নিম্ন সীমা (lower limit) এবং x̄ + E উচ্চ সীমা (upper limit) উপস্থাপন করে।

একইভাবে, পপুলেশন প্রপোরশনের (P) জন্য কনফিডেন্স ইন্টারভাল লেখা হয়:

p - E < P < p + E

উদাহরণ ৪

ধরুন, আপনি কানাডায় আন্তর্জাতিক শিক্ষার্থীদের গড় প্রোগ্রাম খরচ নিয়ে গবেষণা করছেন। আপনি ১,০০০ জন শিক্ষার্থীর একটি র‍্যান্ডম নমুনা নির্বাচন করলেন। আপনার জরিপ ডেটার উপর ভিত্তি করে, আপনি অনুমান করেন যে গড় প্রোগ্রাম খরচ ২০,০০০ কানাডিয়ান ডলার (CAD), যার গণনা করা মার্জিন অফ এরর হলো ৫,০০০ CAD। এই গড় প্রোগ্রাম খরচের জন্য আপনি কীভাবে কনফিডেন্স ইন্টারভাল বের করবেন?

উচ্চ সীমা = x̄ + E = ২০,০০০ CAD + ৫,০০০ CAD = ২৫,০০০ CAD

নিম্ন সীমা = x̄ - E = ২০,০০০ CAD - ৫,০০০ CAD = ১৫,০০০ CAD

অতএব, সম্পূর্ণ কনফিডেন্স ইন্টারভাল হলো:

x̄ - E < μ < x̄ + E

১৫,০০০ CAD < μ < ২৫,০০০ CAD