কোনো ফলাফল পাওয়া যায়নি
এই মুহূর্তে ওই শব্দ দিয়ে কিছুই খুঁজে পাওয়া যাচ্ছে না, অন্য কিছু খুঁজে দেখুন।
যেকোনো ডেটা সেটের গড়, মধ্যক, প্রচুরক এবং পরিসর খুব সহজেই নির্ণয় করুন। আমাদের বিনামূল্যের পরিসংখ্যান ক্যালকুলেটর দিয়ে কেন্দ্রীয় প্রবণতা বের করা দ্রুত ও নির্ভুল!
| ফলাফল | |||
|---|---|---|---|
| গড় (মধ্যমান) | 28.7 | সর্ববৃহৎ | 48 |
| মধ্যক | 13.5 | সর্বনিম্ন | 12 |
| পরিসর | 36 | সমষ্টি | 287 |
| বহুলক | 15, 38 প্রতিটি 2 বার উপস্থিত হয়েছে | সংখ্যা | 10 |
| জ্যামিতিক গড় | 25.88779096735222 | ||
0
1
2
3
4
5
আপনার গণনায় একটি ত্রুটি ছিল।
আমাদের বহুমুখী গড়, মধ্যক, প্রচুরক এবং পরিসর ক্যালকুলেটর দিয়ে এই অপরিহার্য পরিসংখ্যানগত মানগুলো একসাথে বের করা অবিশ্বাস্যরকম সহজ। ইনপুট বক্সে আপনার কাঁচা ডেটা (raw data) টাইপ করুন বা পেস্ট করুন, এবং খেয়াল রাখবেন প্রতিটি সংখ্যা বা মান যেন কমা (,) দ্বারা আলাদা করা থাকে। তারপর ক্যালকুলেট (calculate) বাটনে ক্লিক করুন।
মুহূর্তের মধ্যেই আপনার ফলাফল তৈরি হয়ে যাবে। গড়, মধ্যক, প্রচুরক এবং পরিসর গণনা করার পাশাপাশি, এই ব্যাপক টুলটি জ্যামিতিক গড় নির্ণয় করে, সবচেয়ে বড় ও ছোট সংখ্যা শনাক্ত করে, মোট যোগফল ও সংখ্যা গণনা করে এবং ডেটাগুলোকে সাজিয়ে (sorted data set) প্রদান করে।
আমাদের গড়, মধ্যক এবং প্রচুরক ক্যালকুলেটর দিয়ে আপনার ডেটাসেটকে সঠিকভাবে উপস্থাপন করার জন্য একটি আদর্শ মান খুঁজে পাওয়া এখন অনায়াস। এছাড়াও, এতে যুক্ত থাকা পরিসর ক্যালকুলেটরটি আপনাকে তাৎক্ষণিকভাবে আপনার ডেটার বিস্তার ও বিস্তৃতি (spread and dispersion) মূল্যায়ন করতে সাহায্য করে। চলুন দেখে নেওয়া যাক এই পরিসংখ্যানগত মেট্রিকগুলোর প্রতিটির অর্থ কী এবং এগুলো কীভাবে গণনা করা হয়।
গড় হলো আপনার ডেটাসেটের গাণিতিক গড় (average)। পরিসংখ্যানের ভাষায়, সকল ডেটার মানের যোগফলকে মোট ডেটা পয়েন্টের সংখ্যা দিয়ে ভাগ করে গড় নির্ণয় করা হয়। সম্পূর্ণ পপুলেশনের গড়কে গ্রিক অক্ষর μ (মিউ) দ্বারা প্রকাশ করা হয়, অন্যদিকে একটি নমুনার (sample) গড়কে x̄ (এক্স-বার) দ্বারা চিহ্নিত করা হয়।
পপুলেশনের গড় নির্ণয় করতে, আপনি নিচের সূত্রটি ব্যবহার করতে পারেন:
$$\mu=\frac{Sum\ of\ the\ data\ set’s\ values}{Total\ number\ of\ data\ values\ in\ the\ population}=\frac{ΣX}{N}$$
নমুনার গড় নির্ণয় করতে, আপনি নিচের সূত্রটি ব্যবহার করতে পারেন:
$$\bar{X}=\frac{Sum\ of\ the\ data\ set’s\ values}{Total\ number\ of\ data\ values\ in\ the\ sample}=\frac{ΣX}{n}$$
চলুন একটি বাস্তব উদাহরণের মাধ্যমে কীভাবে গড় নির্ণয় করতে হয় তা দেখে নিই।
ধরুন আপনার কলেজের বাস্কেটবল খেলোয়াড়দের উচ্চতা (মিটারে) নিচে দেওয়া হলো। দলটির গড় উচ্চতা কত?
1.75 m, 1.96 m, 1.95 m, 2.00 m, 2.05 m, 2.05 m, 2.10 m
সমাধান:
$$The\ mean\ height=\frac{\sum{}{}X}{N}=\frac{1.75\ m+1.96\ m+1.95\ m+2.00\ m+2.05\ m+2.05\ m+2.10\ m}{7}=\frac{13.86\ m}{7}=1.98\ m$$
যেহেতু গড় ডেটাসেটের প্রতিটি মানকে বিবেচনা করে, তাই এটি কেন্দ্রীয় প্রবণতার একটি অত্যন্ত প্রতিনিধিত্বমূলক পরিমাপ হিসেবে কাজ করে।
আমাদের টুলটি কেবল একটি সাধারণ গাণিতিক গড় ক্যালকুলেটরের চেয়ে বেশি কিছু হিসেবে কাজ করে। আপনি এটি ব্যবহার করে অনায়াসে আপনার ডেটাসেটের জ্যামিতিক গড়ও (geometric mean) গণনা করতে পারেন। জ্যামিতিক গড়কে একটি ডেটাসেটের n সংখ্যক আইটেমের গুণফলের n-তম মূল (root) হিসেবে সংজ্ঞায়িত করা হয়।
$$Geometric\ mean=\sqrt[n]{x₁ × x₂ × x₃ × \cdots × xₙ}$$
চলুন আমাদের আগের বাস্কেটবল দলের উদাহরণের জন্য জ্যামিতিক গড় নির্ণয় করি।
$$Geometric\ mean=\sqrt[7]{1.75×1.96×1.95×2.00×2.05×2.05×2.10}=\sqrt[7]{118.0554}=1.977$$
পরিসংখ্যানের একটি মৌলিক নিয়ম হলো, যেকোনো অঋণাত্মক (non-negative) সংখ্যার সেটের ক্ষেত্রে জ্যামিতিক গড় সর্বদা গাণিতিক গড়ের চেয়ে ছোট বা তার সমান হয়।
আমাদের উদাহরণে এটি প্রয়োগ করলে পাই:
$$Geometric\ mean < Arithmetic\ mean$$
$$1.977<1.98$$
ঊর্ধ্বক্রম বা অধোক্রম অনুসারে সাজানো হলে কোনো ডেটাসেটের ঠিক মাঝখানের মানটিই হলো মধ্যক। কার্যকরভাবে, একটি মধ্যক ক্যালকুলেটর আপনার ডেটাসেটকে দুটি সমান ভাগে বিভক্ত করে।
$$Median=Value\ of\ \left(\frac{N+1}{2}\right)-th\ item$$
যদি আপনার ডেটাসেটে বিজোড় সংখ্যক মান থাকে, তবে সাজানো তালিকার ঠিক মাঝখানের সংখ্যাটিই হবে মধ্যক। (আমাদের গড়, মধ্যক, প্রচুরক এবং পরিসর ক্যালকুলেটর স্বয়ংক্রিয়ভাবে আপনার জন্য ডেটা সাজিয়ে দেয়!) আর যদি আপনার ডেটাসেটে জোড় সংখ্যক মান থাকে, তবে মাঝখানের দুটি ডেটা পয়েন্টের গড় বের করে মধ্যক গণনা করা হয়।
চলুন আগের বাস্কেটবল উদাহরণের জন্য মধ্যক নির্ণয় করি।
প্রথমে, আমাদের ডেটাসেটটিকে ঊর্ধ্বক্রমে সাজাতে হবে:
1.75 m, 1.95 m, 1.96 m, 2.00 m, 2.05 m, 2.05 m, 2.10 m
এরপর, আমরা মাঝখানের অবস্থানটি নির্ণয় করব:
$$Median=Value\ of\ \left(\frac{N+1}{2}\right)-th\ item=Value\ of\ \left(\frac{7+1}{2}\right)-th\ item=Value\ of\ 4-th\ item$$
আমাদের সাজানো ডেটাসেটে ৪র্থ আইটেমটির মান হলো 2.00 m। অতএব,
মধ্যক = 2.00 m
এখন কল্পনা করুন, বাস্কেটবল দলে 1.90 m উচ্চতার একজন নতুন খেলোয়াড় যুক্ত হয়েছে। তাহলে দলের খেলোয়াড়দের উচ্চতার নতুন মধ্যক কত হবে?
আপডেট করা উচ্চতাগুলো হলো:
1.75 m, 1.96 m, 1.95 m, 2.00 m, 2.05 m, 2.05 m, 2.10 m, 1.90 m
পুনরায়, আমরা প্রথমে ডেটাসেটটিকে সাজিয়ে নিই:
1.75 m, 1.90 m, 1.95 m, 1.96 m, 2.00 m, 2.05 m, 2.05 m, 2.10 m
মাঝখানের অবস্থান নির্ণয় করে পাই:
$$Median=Value\ of\ \left(\frac{N+1}{2}\right)-th\ item=Value\ of\ \left(\frac{8+1}{2}\right)-th\ item=Value\ of\ {4.5}-th\ item$$
যেহেতু খেলোয়াড়ের সংখ্যা জোড় (8), তাই আমাদের মাঝের দুটি পয়েন্টের গড় হিসাব করতে হবে। এক্ষেত্রে, মধ্যক হলো ৪র্থ এবং ৫ম আইটেমের গড়।
অতএব,
$$Median=\frac{1.96\ m+2.00\ m}{2}=1.98\ m$$
মধ্যক হলো কেন্দ্রীয় প্রবণতার একটি অত্যন্ত শক্তিশালী পরিমাপ, বিশেষ করে যখন কোনো ডেটাসেটে চরম মান বা আউটলায়ার (outliers) থাকে। গড়ের বিপরীতে, চরম আউটলায়ারগুলো মধ্যককে প্রভাবিত করতে পারে না কারণ এটি কঠোরভাবে শুধুমাত্র একেবারে মাঝখানের সংখ্যাগুলোর ওপর ফোকাস করে। তবে, যদিও মধ্যক একটি চমৎকার কেন্দ্রীয় রেফারেন্স পয়েন্ট প্রদান করে, এটা মনে রাখা গুরুত্বপূর্ণ যে এটি ডেটাসেটের প্রতিটি একক মানের গাণিতিক ওজনকে বিবেচনায় নেয় না।
প্রচুরক হলো কোনো ডেটাসেটের সবচেয়ে সাধারণ বা বহুল ব্যবহৃত মান। সহজ কথায়, প্রচুরক হলো সেই সংখ্যা বা ডেটা পয়েন্ট যা সবচেয়ে বেশিবার উপস্থিত থাকে।
চলুন আমাদের চলমান উদাহরণটিতে প্রচুরক শনাক্ত করি।
প্রতিটি খেলোয়াড়ের উচ্চতা ঠিক একবার করে এসেছে, কেবল 2.05 m ছাড়া, যা দুজন খেলোয়াড়ের উচ্চতা। যেহেতু 2.05 m অন্য যেকোনো মানের চেয়ে বেশিবার এসেছে, তাই এটিই হলো আমাদের প্রচুরক।
প্রচুরক = 2.05 m
যেহেতু আমাদের উদাহরণের ডেটাসেটে মাত্র একটি প্রচুরক রয়েছে, তাই এটিকে ইউনিমোডাল (unimodal) হিসেবে শ্রেণীবদ্ধ করা হয়। তবে, ডেটাসেটে সহজেই একাধিক প্রচুরক থাকতে পারে। দুটি প্রচুরক বিশিষ্ট ডেটাসেটকে বলা হয় বাইমোডাল (bimodal), এবং দুইয়ের বেশি প্রচুরক থাকলে তাকে মাল্টিমোডাল (multimodal) হিসেবে বিবেচনা করা হয়। অন্যদিকে, কোনো ডেটাসেটের প্রতিটি মান যদি ঠিক একবার করে আসে, তবে সেই ডেটাসেটের কোনো প্রচুরক থাকে না।
যদিও প্রচুরক ক্যালকুলেটর ব্যবহার করলে প্রক্রিয়াটি অনায়াস হয়ে যায়, আপনি প্রায়শই কোনো জটিল গণনা ছাড়াই প্রচুরক শনাক্ত করতে পারেন। তবে মনে রাখবেন, প্রচুরক সর্বোচ্চ ফ্রিকোয়েন্সিকে হাইলাইট করলেও এটি গড়ের মতো সম্পূর্ণ ডেটাসেটের কোনো ব্যাপক গাণিতিক উপস্থাপনা প্রদান করে না।
পরিসর হলো আপনার ডেটাসেটের সবচেয়ে বড় এবং সবচেয়ে ছোট মানের মধ্যবর্তী পার্থক্য। যখন আপনি আপনার ডেটার বিস্তার বা বিস্তৃতি মূল্যায়ন করতে চান, তখন এটি গণনা করার সবচেয়ে দ্রুত ও সহজ মেট্রিক।
পরিসর = সর্বোচ্চ মান - সর্বনিম্ন মান
চলুন আমাদের বাস্কেটবল দলের উদাহরণ ব্যবহার করে পরিসর হিসাব করি।
প্রথমে, আপনাকে সর্বোচ্চ এবং সর্বনিম্ন মানগুলো খুঁজে বের করতে হবে। আপনার ডেটাসেটটি সাজানো না থাকলে, আমাদের ডেডিকেটেড পরিসর ক্যালকুলেটর (Range Calculator) তাৎক্ষণিকভাবে আপনার জন্য এই প্রান্তিক মানগুলো শনাক্ত করে দেবে।
এরপর, সবচেয়ে বড় মানটি থেকে সবচেয়ে ছোট মানটি বিয়োগ করুন:
সর্বোচ্চ মান = 2.10 m
সর্বনিম্ন মান = 1.75 m
অতএব,
পরিসর = 2.10 m - 1.75 m = 0.35 m
ডেটার বিস্তারের একটি দ্রুত ওভারভিউ পাওয়ার জন্য অত্যন্ত কার্যকর হলেও, পরিসর আউটলায়ারগুলোর (outliers) কারণে সহজেই প্রভাবিত বা বিকৃত হতে পারে, কারণ এটি কেবল ডেটাসেটের দুটি চরম প্রান্ত বিবেচনা করে এবং এর মাঝখানের সমস্ত মানকে উপেক্ষা করে।