เครื่องคำนวณสถิติ
เครื่องคำนวณค่าเฉลี่ย ค่ามัธยฐาน ค่าฐานนิยม


เครื่องคำนวณค่าเฉลี่ย ค่ามัธยฐาน ค่าฐานนิยม

คำนวณค่าเฉลี่ย ค่ามัธยฐาน ค่าฐานนิยม และพิสัย (Range) ได้อย่างรวดเร็วและแม่นยำด้วยเครื่องมือออนไลน์ฟรี เหมาะสำหรับนักเรียนและงานสถิติ ใช้งานง่าย ลองใช้เลย!

ผลลัพธ์
ค่าเฉลี่ย x̄ 16.75 ค่าผิดปกติ 6, 33, 35
ค่ามัธยฐาน x̃ 15 ควอร์ไทล์ Q1 12.5
ฐานนิยม 15 ปรากฏ 3 ครั้ง ควอร์ไทล์ Q2 15
ช่วง 29 ควอร์ไทล์ Q3 16
ต่ำสุด 6 ช่วงระหว่างไตรมาส IQR 3.5
สูงสุด 35
ผลรวม 201
จำนวน n 12

เกิดข้อผิดพลาดกับการคำนวณของคุณ

สารบัญ

  1. การวัดแนวโน้มเข้าสู่ส่วนกลาง
  2. เครื่องคำนวณค่าเฉลี่ย
  3. ค่าเฉลี่ยสำหรับกลุ่มตัวอย่างและประชากร
  4. ตัวอย่างการคำนวณค่าเฉลี่ย
  5. เครื่องคำนวณค่ามัธยฐาน
  6. ตัวอย่างการคำนวณค่ามัธยฐาน
  7. ความแตกต่างระหว่างค่าเฉลี่ยและค่ามัธยฐาน
  8. เครื่องคำนวณค่าฐานนิยม
  9. ตัวอย่างการคำนวณฐานนิยม
  10. การวัดการกระจายข้อมูล
  11. เครื่องคำนวณพิสัย
  12. ตัวอย่างการคำนวณพิสัย
  13. เครื่องคำนวณควอร์ไทล์
    1. การคำนวณควอร์ไทล์
  14. ตัวอย่างการคำนวณควอร์ไทล์
  15. เครื่องคำนวณพิสัยระหว่างควอร์ไทล์ (IQR)
  16. ตัวอย่างการคำนวณ IQR
  17. บทสรุปเชิงปฏิบัติ (ผลลัพธ์)

เครื่องคำนวณค่าเฉลี่ย ค่ามัธยฐาน ค่าฐานนิยม

การวัดแนวโน้มเข้าสู่ส่วนกลาง

การพิจารณาเพียงตารางและกราฟของข้อมูลทางสถิติอาจเป็นเรื่องยากในการตีความ เราจึงมักจำเป็นต้องสรุปชุดข้อมูลและระบุคุณสมบัติที่สำคัญ เพื่อให้ได้ข้อมูลเชิงลึกที่เป็นประโยชน์มากยิ่งขึ้นจากสถิติเหล่านั้น

ในทางสถิติ มีการใช้มาตรวัดหลายรูปแบบเพื่อสรุปข้อมูล มาตรวัดบางประเภทใช้อธิบายจุดศูนย์กลางของข้อมูล ซึ่งเรียกว่า "การวัดแนวโน้มเข้าสู่ส่วนกลาง" (Measures of Central Tendency) ในขณะที่มาตรวัดอื่นๆ ใช้บอกระดับการกระจายตัวของข้อมูล เรียกว่า "การวัดการกระจายข้อมูล" (Measures of Dispersion) นอกจากนี้ยังมีการวัดตำแหน่ง ซึ่งช่วยเปิดเผยสัดส่วนของข้อมูลที่มีค่าน้อยกว่าค่าที่กำหนด

วัตถุประสงค์หลักของเครื่องคำนวณนี้คือ การคำนวณการวัดแนวโน้มเข้าสู่ส่วนกลาง — ได้แก่ ค่าเฉลี่ย (Mean) และค่ามัธยฐาน (Median) — ซึ่งสามารถแสดงถึงค่าตัวแทนหรือค่ากลางของชุดข้อมูล ส่วนวัตถุประสงค์รองของเครื่องคำนวณทางสถิตินี้คือ การหาระดับความแปรปรวนในชุดข้อมูล โดยการคำนวณพิสัย (Range) ควอร์ไทล์ (Quartiles) และพิสัยระหว่างควอร์ไทล์ (Interquartile Range - IQR)

เครื่องคำนวณค่าเฉลี่ย

ค่าเฉลี่ย (Mean) คือผลรวมของค่าทั้งหมดหารด้วยจำนวนค่าในชุดข้อมูล เป็นค่าที่เข้าใจง่ายที่สุดและสามารถคำนวณได้โดยใช้สูตรการหาค่าเฉลี่ยของกลุ่มตัวอย่างดังต่อไปนี้:

$$\bar{x}=\frac{x₁+x₂+x₃+\ldots+x_n}{n}=\frac{\sum_{}^{}x}{n}$$

สูตรสำหรับการหาค่าเฉลี่ยของประชากรคือ:

$$\mu=\frac{x₁+x₂+x₃+\ldots+x_n}{N}=\frac{\sum_{}^{}x}{N}$$

ในที่นี้ ตัวเศษแสดงถึงผลรวมของค่าทั้งหมดในชุดข้อมูล และตัวส่วนแสดงถึงจำนวนข้อมูลทั้งหมดในชุดข้อมูล

คุณสมบัติที่สำคัญของการใช้ค่าเฉลี่ยเลขคณิตคือ การคำนวณจะครอบคลุมจุดข้อมูลทุกจุดที่มีอยู่ในชุดข้อมูลนั้น

ข้อจำกัดหลักของค่าเฉลี่ยคือ มีความอ่อนไหวต่อค่าข้อมูลที่มีขนาดใหญ่หรือเล็กผิดปกติ ค่าดังกล่าวเรียกว่า "ค่าสุดโต่ง" (Outliers) ซึ่งจะส่งผลให้ค่าเฉลี่ยคลาดเคลื่อนไปจากความเป็นจริงอย่างมีนัยสำคัญ

นอกจากนี้ โปรดทราบว่าค่าเฉลี่ยไม่จำเป็นต้องเป็นค่าที่มีอยู่จริงในชุดข้อมูล ค่าเฉลี่ยอาจเป็นตัวเลขที่ไม่มีปรากฏในชุดข้อมูลเลยก็ได้

ค่าเฉลี่ยสำหรับกลุ่มตัวอย่างและประชากร

ประชากร (Population) ประกอบด้วยชุดข้อมูลทั้งหมดที่เราสนใจศึกษา ส่วนกลุ่มตัวอย่าง (Sample) ประกอบด้วยข้อมูลกลุ่มเล็กๆ ที่สุ่มเลือกมาจากประชากร

วิธีการคำนวณค่าเฉลี่ยจะเหมือนกันทั้งสำหรับกลุ่มตัวอย่างและประชากร แตกต่างกันเพียงแค่สัญลักษณ์ที่ใช้เท่านั้น

ถ้า x₁, x₂,..., xₙ คือกลุ่มตัวอย่าง ค่าเฉลี่ยที่ได้จะเรียกว่า "ค่าเฉลี่ยกลุ่มตัวอย่าง" และเขียนแทนด้วยสัญลักษณ์ x̄ (เอ็กซ์บาร์) ส่วนค่าเฉลี่ยของประชากรจะแทนด้วยตัวอักษรกรีก 𝜇 (มิว)

ในทางสถิติ เราใช้ตัวอักษรพิมพ์เล็ก n เพื่อแสดงถึงขนาดของกลุ่มตัวอย่าง และตัวอักษรพิมพ์ใหญ่ N เพื่อแสดงถึงขนาดของประชากร

ตัวอย่างการคำนวณค่าเฉลี่ย

ลองดูตัวอย่างต่อไปนี้: Luigi เป็นเชฟชั้นยอดและเป็นผู้ที่หลงใหลในพิซซ่า เขาตัดสินใจที่จะเปิดร้านพิซซ่าของตัวเองในเกาะบาหลี เพื่อนำเสนอแก่นักลงทุน Luigi จำเป็นต้องเขียนแผนธุรกิจ เขาต้องการทราบราคาเฉลี่ยของพิซซ่าตามร้านอาหารต่างๆ บนเกาะ เพื่อประเมินผลประกอบการทางการเงินในอนาคต

เขาได้ทำการสำรวจเล็กๆ เกี่ยวกับราคาพิซซ่ามาร์การิต้าตามร้านต่างๆ ในบาหลี และได้ชุดข้อมูลราคามา เพื่อความสะดวกในการคำนวณ เราจะตัดศูนย์สามตัวท้ายออกและใช้ตัวเลขในหลักพันแทน นั่นหมายความว่าเลข 60 ในการคำนวณของเราจะหมายถึง 60,000 รูเปียห์อินโดนีเซีย (IDR)

60, 60, 84, 45, 59, 70, 42, 59, 53, 70, 69, 70, 120, 160, 95, 50, 75, 55, 72, 70

Luigi ไม่ได้ไปสำรวจร้านพิซซ่าทุกแห่งบนเกาะ เขาสุ่มเลือกร้านมา 20 แห่ง ดังนั้น ในกรณีนี้เรากำลังทำงานกับกลุ่มตัวอย่าง

มาคำนวณค่าเฉลี่ยสำหรับชุดข้อมูลนี้โดยใช้สูตรกัน:

$$\bar{x}=\frac{x₁+x₂+x₃+\ldots+x_n}{n}=\frac{\sum_{}^{}x}{n}$$

เราจะได้ผลลัพธ์ค่าเฉลี่ย x̄ = 71.9

การสำรวจของ Luigi แสดงให้เห็นว่า 71,900 รูเปียห์อินโดนีเซีย คือราคาเฉลี่ยของพิซซ่ามาร์การิต้าในบาหลี ตอนนี้เขาสามารถนำราคานี้ไปใช้อ้างอิงในการคำนวณแผนธุรกิจของเขาได้แล้ว

เครื่องคำนวณค่ามัธยฐาน

ค่ามัธยฐาน (Median) คือการวัดตำแหน่งจุดกึ่งกลางของชุดข้อมูลที่ถูกจัดเรียงลำดับจากน้อยไปหามาก หรือจากมากไปน้อย

ในการหาค่ามัธยฐาน เรากำลังพยายามหาตัวเลขที่แบ่งชุดข้อมูลออกเป็นสองส่วนเท่าๆ กัน โดยข้อมูลครึ่งหนึ่งจะมีค่าน้อยกว่าค่ามัธยฐาน และข้อมูลอีกครึ่งหนึ่งจะมีค่ามากกว่าค่ามัธยฐาน นี่คือเหตุผลว่าทำไมเมื่อเราหาค่ามัธยฐานด้วยตนเองโดยไม่ใช้โปรแกรมคำนวณ เราจึงจำเป็นต้องเรียงลำดับข้อมูลเสียก่อน

วิธีการคำนวณค่ามัธยฐานจะแตกต่างกันเล็กน้อย ขึ้นอยู่กับว่าจำนวนข้อมูลในชุดข้อมูลนั้นเป็นจำนวนคู่หรือจำนวนคี่

หากจำนวนข้อมูลทั้งหมดเป็นจำนวนคี่ (n หรือ N เป็นเลขคี่) จะใช้สูตรต่อไปนี้:

$$\text{มัธยฐาน} = (\frac{n+1}{2})\text{-หน่วยที่}$$

อย่างไรก็ตาม หากจำนวนข้อมูลทั้งหมดเป็นจำนวนคู่ (หมายความว่า n เป็นเลขคู่) จะใช้สูตรดังนี้:

$$\text{มัธยฐาน} = \frac{\left[(\frac{n}{2})\text{-หน่วยที่} + (\frac{n}{2}+1)\text{-หน่วยที่}\right]}{2}$$

ข้อได้เปรียบหลักของการใช้ค่ามัธยฐานคือ เป็นค่าที่ได้รับผลกระทบน้อยที่สุดจากค่าข้อมูลที่สูงหรือต่ำผิดปกติ (Outliers)

ตัวอย่างการคำนวณค่ามัธยฐาน

สำหรับชุดข้อมูล 20 ค่านี้:

60, 60, 84, 45, 59, 70, 42, 59, 53, 70, 69, 70, 120, 160, 95, 50, 75, 55, 72, 70

เราสามารถหาค่ามัธยฐานได้ตามขั้นตอนดังนี้:

  1. จัดเรียงชุดข้อมูลจากน้อยไปหามากหรือจากมากไปน้อย ในที่นี้เมื่อเรียงจากน้อยไปมากจะได้ดังนี้:

42, 45, 50, 53, 55, 59, 59, 60, 60, 69, 70, 70, 70, 70, 72, 75, 84, 95, 120, 160

  1. นับจำนวนค่าข้อมูลทั้งหมด ในที่นี้เรามี n = 20

  2. หาก n เป็นจำนวนคี่ เราจะเลือกค่าที่อยู่ตรงกลางเป็นค่ามัธยฐาน แต่ถ้า n เป็นจำนวนคู่ เราจะนำข้อมูลที่อยู่ตรงกลาง 2 ค่ามาบวกกันแล้วหารด้วย 2 เพื่อหาค่าเฉลี่ย

เนื่องจาก 20 เป็นจำนวนคู่

ค่าที่อยู่ตรงกลางในกลุ่มตัวอย่างของเราคือ 69 และ 70 เราจึงหาค่ามัธยฐานได้ด้วยวิธีนี้:

$$\text{มัธยฐาน} = \frac{69 + 70}{2} = 69.5$$

แต่หากสมมติว่า Luigi มีชุดข้อมูล 21 ค่า เช่น:

60, 60, 84, 45, 59, 70, 42, 59, 53, 70, 69, 70, 120, 160, 95, 50, 75, 90, 55, 72, 70

เขาจะต้องจัดเรียงลำดับใหม่เป็น:

42, 45, 50, 53, 55, 59, 59, 60, 60, 69, 70, 70, 70, 70, 72, 75, 84, 90, 95, 120, 160

และเลือกค่าที่อยู่ตรงกลางพอดี ซึ่งก็คือตำแหน่งที่ 11 ทำให้ได้ค่ามัธยฐานคือ 70

ความแตกต่างระหว่างค่าเฉลี่ยและค่ามัธยฐาน

ทั้งค่าเฉลี่ยและค่ามัธยฐานต่างก็ถูกใช้เพื่อเป็นตัวแทนการวัดแนวโน้มเข้าสู่ส่วนกลาง แต่สิ่งสำคัญคือเราต้องเข้าใจว่ามันแตกต่างกันอย่างไร

ความแตกต่างหลักประการหนึ่งคือ สูตรการหาค่าเฉลี่ยจะต้องนำข้อมูลทุกตัวในชุดข้อมูลมาคำนวณ ในทางตรงกันข้าม สูตรของค่ามัธยฐานจะพิจารณาเฉพาะตัวเลขที่อยู่ตรงกลางเพียงตัวเดียว (หรือสองตัว) เท่านั้น

ประเด็นนี้มีความสำคัญอย่างมากสำหรับชุดข้อมูลที่มีตัวเลขที่ใหญ่หรือเล็กผิดปกติอย่างน้อยหนึ่งตัว หรือที่เรียกว่า "ค่าสุดโต่ง" (Outliers) ในกรณีส่วนใหญ่ ค่าสุดโต่งเหล่านี้จะดึงค่าเฉลี่ยให้คลาดเคลื่อนไปจากความเป็นจริงอย่างมาก แต่จะแทบไม่ส่งผลกระทบต่อค่ามัธยฐานเลย

ในทางสถิติ เราเรียกการวัดที่ไม่ได้รับผลกระทบจากค่าสุดโต่งว่ามีความต้านทานสูง (Resistant) ดังนั้นเราจึงสามารถสรุปได้ว่า ค่ามัธยฐานมีความต้านทานต่อค่าสุดโต่ง ในขณะที่ค่าเฉลี่ยไม่มี

ค่าเฉลี่ยและค่ามัธยฐานอธิบายจุดศูนย์กลางในมิติที่ต่างกัน ค่าเฉลี่ยคือจุดสมดุลของข้อมูล ส่วนค่ามัธยฐานคือจุดที่แบ่งข้อมูลออกเป็นสองส่วนเท่าๆ กัน (50/50) เมื่อชุดข้อมูลมีการกระจายตัวแบบสมมาตรสมบูรณ์ ค่าเฉลี่ยและค่ามัธยฐานจะมีค่าเท่ากัน

อย่างไรก็ตาม โดยทั่วไปแล้วค่าเฉลี่ยและค่ามัธยฐานมักจะไม่เท่ากัน

ในชุดข้อมูลบางชุด ค่าเฉลี่ยอาจน้อยกว่าค่ามัธยฐาน หรือค่ามัธยฐานอาจน้อยกว่าค่าเฉลี่ย ในกรณีเช่นนี้ เราจะเรียกว่าเป็น "การแจกแจงแบบเบ้" (Skewed Distribution)

หากค่าเฉลี่ยอยู่ทางซ้ายของค่ามัธยฐาน (ค่าน้อยกว่า) เราจะเรียกว่าข้อมูลมีการกระจายแบบเบ้ซ้าย (Left-skewed) หากค่าเฉลี่ยอยู่ทางขวาของค่ามัธยฐาน (ค่ามากกว่า) เราจะเรียกว่าข้อมูลมีการกระจายแบบเบ้ขวา (Right-skewed)

ไม่มีการระบุว่าค่าใดดีกว่ากัน ทั้งสองวิธีใช้วัดจุดศูนย์กลางในรูปแบบที่แตกต่างกัน ผู้เชี่ยวชาญด้านสถิติหลายคนนิยมใช้ค่ามัธยฐานเมื่อข้อมูลมีความเบ้สูงหรือมีค่าสุดโต่งรวมอยู่ด้วย เนื่องจากค่ามัธยฐานสามารถสะท้อนถึงค่ากลางที่แท้จริงของกลุ่มข้อมูลได้ดีกว่าในสถานการณ์เช่นนั้น

เครื่องคำนวณค่าฐานนิยม

ฐานนิยม (Mode) คือค่าที่เกิดขึ้นบ่อยที่สุด หรือมีความถี่สูงสุดในชุดข้อมูล

ชุดข้อมูลจะมีฐานนิยมเพียงค่าเดียว (Unimodal) หากมีตัวเลขใดตัวเลขหนึ่งปรากฏบ่อยกว่าตัวเลขอื่นๆ อย่างชัดเจน

หากชุดข้อมูลมีค่าที่มีความถี่สูงสุดเท่ากันสองค่า จะถือว่าข้อมูลนั้นมีฐานนิยมสองค่า เรียกว่าการแจกแจงแบบไบโมดัล (Bimodal)

หากชุดข้อมูลมีค่าที่มีความถี่สูงสุดเท่ากันมากกว่าสองค่า ทุกค่านั้นจะถือเป็นฐานนิยมทั้งหมด และชุดข้อมูลนั้นจะเรียกว่าแบบมัลติโมดัล (Multimodal)

หากไม่มีค่าข้อมูลใดในชุดข้อมูลเกิดซ้ำเลย จะถือว่าชุดข้อมูลนั้นไม่มีค่าฐานนิยม (No Mode) ในกรณีนี้ การระบุว่าค่าฐานนิยมเป็น "ศูนย์" ถือว่าไม่ถูกต้อง เพราะในชุดข้อมูลบางประเภท เช่น อุณหภูมิ ศูนย์สามารถเป็นข้อมูลที่มีอยู่จริงได้

ข้อได้เปรียบของการใช้ฐานนิยมคือ เป็นค่าที่หาได้ง่ายที่สุดและไม่ได้รับผลกระทบจากค่าสุดโต่งเลย แต่ข้อเสียคือ ในชุดข้อมูลบางชุดอาจไม่มีค่าฐานนิยมอยู่เลย

ตัวอย่างการคำนวณฐานนิยม

สำหรับชุดข้อมูล 20 ค่าดังนี้:

60, 60, 84, 45, 59, 70, 42, 59, 53, 70, 69, 70, 120, 160, 95, 50, 75, 55, 72, 70

เราสามารถหาฐานนิยมได้โดยทำตามขั้นตอนนี้:

จัดเรียงชุดข้อมูลจากน้อยไปหามากหรือจากมากไปน้อย เพื่อให้มองเห็นข้อมูลได้ง่ายขึ้น:

42, 45, 50, 53, 55, 59, 59, 60, 60, 69, 70, 70, 70, 70, 72, 75, 84, 95, 120, 160

ต่อไป ให้หาค่าที่เกิดซ้ำมากที่สุด ในที่นี้ค่าที่พบได้บ่อยที่สุดคือ 70 ดังนั้น สำหรับชุดข้อมูลนี้ ฐานนิยมคือ 70

แม้ว่าฐานนิยมจะเป็นหนึ่งในการวัดแนวโน้มเข้าสู่ส่วนกลาง แต่มันอาจไม่สะท้อนถึงจุดศูนย์กลางที่แท้จริงของการแจกแจงเสมอไป โดยเฉพาะอย่างยิ่งในกรณีที่ข้อมูลมีการกระจายแบบเบ้ ฐานนิยมอาจกลายเป็นค่าที่มากที่สุด น้อยที่สุด หรือเป็นค่าอื่นๆ ได้เลย ยกตัวอย่างเช่น หากเรามีข้อมูลชุดนี้:

42, 45, 50, 53, 55, 57, 59, 60, 63, 69, 70, 72, 79, 82, 83, 95, 96, 120, 120, 120

ฐานนิยมคือ 120 ซึ่งจะเห็นได้ชัดว่ามันไม่สามารถเป็นตัวแทนของแนวโน้มศูนย์กลางสำหรับข้อมูลชุดนี้ได้

ข้อสังเกตที่น่าสนใจคือ เราสามารถคำนวณค่าเฉลี่ยและค่ามัธยฐานได้เฉพาะกับ "ข้อมูลเชิงปริมาณ" (ตัวเลข) เท่านั้น แต่เราสามารถหาฐานนิยมได้ทั้งจากข้อมูลเชิงปริมาณและ "ข้อมูลเชิงคุณภาพ" (หมวดหมู่)

ตัวอย่างเช่น โดยเฉลี่ยแล้ว แอนนากินพิซซ่า 12 ครั้งต่อเดือน โดยแบ่งเป็น:

  • พิซซ่านาโปลิตัน 3 ครั้ง
  • พิซซ่ามาร์การิต้า 3 ครั้ง
  • พิซซ่าคัลโซเน 2 ครั้ง
  • 1 เพปเพอโรนี
  • 1 มารินารา
  • 1 โฟร์ชีส
  • 1 คาเปรเซ่

ในกรณีนี้ เราจะมีฐานนิยมสองค่า (Bimodal) นั่นคือ พิซซ่านาโปลิตัน และ พิซซ่ามาร์การิต้า

การวัดการกระจายข้อมูล

การวัดการกระจายข้อมูล (Measures of Dispersion) หรือการวัดความแปรปรวน ใช้เพื่อดูว่าข้อมูลมีการกระจายตัวหรือห่างจากค่ากลางมากน้อยเพียงใด เราสามารถตรวจสอบการกระจายตัวของข้อมูลได้โดยใช้ พิสัย (Range), ควอร์ไทล์ (Quartiles) และ พิสัยระหว่างควอร์ไทล์ (Interquartile Range - IQR)

เครื่องคำนวณพิสัย

พิสัย (Range) คือความแตกต่างระหว่างค่าที่สูงที่สุดและต่ำที่สุดในชุดข้อมูล เราสามารถคำนวณหาได้ง่ายๆ โดยนำค่าสูงสุดมาลบด้วยค่าต่ำสุด สูตรคือ:

$$\text{ช่วงต่าง} = ค่าที่ใหญ่ที่สุด - ค่าที่น้อยที่สุด$$

ตัวอย่างการคำนวณพิสัย

สำหรับชุดข้อมูล 20 ค่าดังนี้:

60, 60, 84, 45, 59, 70, 42, 59, 53, 70, 69, 70, 120, 160, 95, 50, 75, 55, 72, 70

เราสามารถหาค่าพิสัยได้ดังนี้:

จัดเรียงชุดข้อมูลจากน้อยไปหามาก จะได้ลำดับดังนี้:

42, 45, 50, 53, 55, 59, 59, 60, 60, 69, 70, 70, 70, 70, 72, 75, 84, 95, 120, 160

ค่าที่สูงที่สุดคือ 160 และค่าที่ต่ำที่สุดคือ 42 ดังนั้น เราจะคำนวณพิสัยได้เป็น:

$$\text{ช่วงต่าง} = ค่าที่ใหญ่ที่สุด - ค่าที่น้อยที่สุด = 160 - 42 = 118$$

ดังนั้น สำหรับชุดข้อมูลนี้ พิสัยจะเท่ากับ 118

เครื่องคำนวณควอร์ไทล์

ควอร์ไทล์ (Quartiles) คือค่าที่แบ่งชุดข้อมูลที่เรียงลำดับแล้วออกเป็น 4 ส่วนเท่าๆ กัน โดยมีจุดแบ่ง 3 จุด ได้แก่ ควอร์ไทล์ที่หนึ่ง สอง และสาม

ควอร์ไทล์ที่หนึ่ง (Q₁) คือค่าที่บ่งบอกว่ามีข้อมูล 25% อยู่ต่ำกว่าค่านั้น และอีก 75% มีค่ามากกว่า

ควอร์ไทล์ที่สอง (Q₂) มีค่าเท่ากับค่ามัธยฐาน ซึ่งจะแบ่งชุดข้อมูลออกเป็นสองส่วนพอดี โดย 50% ของข้อมูลจะมีค่าน้อยกว่า และ 50% จะมีค่ามากกว่า

ควอร์ไทล์ที่สาม (Q₃) คือค่าที่บ่งบอกว่ามีข้อมูล 75% อยู่ต่ำกว่าค่านั้น และมีอีกเพียง 25% ที่มีค่ามากกว่า

การคำนวณควอร์ไทล์

ขั้นตอนการคำนวณควอร์ไทล์สำหรับชุดข้อมูล:

  1. จัดเรียงข้อมูลจากน้อยไปหามาก

  2. สำหรับการหาควอร์ไทล์ที่สอง ให้ใช้วิธีเดียวกับการคำนวณหาค่ามัธยฐาน ส่วนควอร์ไทล์ที่หนึ่งและสาม ให้ทำตามขั้นตอนต่อไป โดยให้ n คือจำนวนข้อมูลทั้งหมดในชุดข้อมูล

  3. สำหรับควอร์ไทล์ที่หนึ่ง ให้หาตำแหน่ง L = 0.25n และสำหรับควอร์ไทล์ที่สาม ให้หาตำแหน่ง L = 0.75n

  4. หาก L เป็นจำนวนเต็ม ควอร์ไทล์จะเป็นค่าเฉลี่ยของข้อมูลในตำแหน่ง L และข้อมูลในตำแหน่ง L + 1

  5. หาก L ไม่ใช่จำนวนเต็ม ให้ปัดเศษขึ้นเป็นจำนวนเต็มถัดไป ควอร์ไทล์จะเท่ากับข้อมูลในตำแหน่งที่ปัดเศษขึ้นนั้น

ตัวอย่างการคำนวณควอร์ไทล์

สำหรับชุดข้อมูล 20 ค่าดังนี้:

60, 60, 84, 45, 59, 70, 42, 59, 53, 70, 69, 70, 120, 160, 95, 50, 75, 55, 72, 70

เราสามารถหาค่าควอร์ไทล์ได้ดังนี้:

  1. จัดเรียงชุดข้อมูลจากน้อยไปหามาก จะได้ดังนี้:

42, 45, 50, 53, 55, 59, 59, 60, 60, 69, 70, 70, 70, 70, 72, 75, 84, 95, 120, 160

  1. จากการคำนวณครั้งก่อน เราทราบแล้วว่า:

ค่ามัธยฐาน (Q₂) = 70

  1. หาตำแหน่ง L สำหรับควอร์ไทล์ที่หนึ่ง: 0.25 × 20 = 5 และตำแหน่ง L สำหรับควอร์ไทล์ที่สาม: 0.75 × 20 = 15

  2. เนื่องจาก 5 เป็นจำนวนเต็ม ค่า Q₁ จึงหาได้จากค่าเฉลี่ยของตำแหน่งที่ 5 และ 6:

$$Q₁=\frac{55+59}{2}=57$$

  1. เช่นเดียวกัน 15 ก็เป็นจำนวนเต็ม ค่า Q₃ จึงหาได้จากค่าเฉลี่ยของตำแหน่งที่ 15 และ 16:

$$Q₃=\frac{72+75}{2}=73.5$$

ดังนั้น สำหรับชุดข้อมูลนี้ ควอร์ไทล์ที่หนึ่งคือ 57, ควอร์ไทล์ที่สอง (มัธยฐาน) คือ 70 และควอร์ไทล์ที่สามคือ 73.5

เครื่องคำนวณพิสัยระหว่างควอร์ไทล์ (IQR)

พิสัยระหว่างควอร์ไทล์ (Interquartile Range - IQR) คือความแตกต่างระหว่างควอร์ไทล์ที่สาม (Q₃) และควอร์ไทล์ที่หนึ่ง (Q₁) ของชุดข้อมูล ถือเป็นมาตรวัดการกระจายข้อมูลส่วนกลาง 50% ของชุดข้อมูล ซึ่งสามารถคำนวณได้ดังนี้:

IQR = Q₃ - Q₁

ตัวอย่างการคำนวณ IQR

ในส่วนก่อนหน้านี้ เราได้คำนวณควอร์ไทล์ที่หนึ่งและสามไว้แล้ว ซึ่งก็คือ 57 และ 73.5 สิ่งที่เราต้องทำก็แค่นำมาเข้าสูตร:

IQR = Q₃ - Q₁ = 73.5 - 57 = 16.5

ดังนั้น สำหรับชุดข้อมูลนี้ พิสัยระหว่างควอร์ไทล์ (IQR) คือ 16.5

บทสรุปเชิงปฏิบัติ (ผลลัพธ์)

จากสถานการณ์จำลอง การสำรวจราคาพิซซ่ามาร์การิต้าแบบย่อๆ ของ Luigi ช่วยให้เขาสรุปผลได้ดังนี้: ค่าเฉลี่ยและค่ามัธยฐานมีค่าไม่ตรงกันเป๊ะ ข้อมูลมีการเบ้เล็กน้อยแต่ไม่ถึงกับรุนแรงมาก ดังนั้นเขาสามารถใช้ทั้งค่าเฉลี่ยและค่ามัธยฐานเป็นตัวแทนในการวัดแนวโน้มเข้าสู่ส่วนกลางได้

หาก Luigi ต้องการกำหนดราคาเฉลี่ยสำหรับพิซซ่ามาร์การิต้าที่ร้านของเขา เขาอาจพิจารณาใช้ราคาเฉลี่ย หรือราคาตามค่ามัธยฐานก็ได้ อย่างไรก็ตาม ราคาเช่น 71,900 IDR หรือ 69,500 IDR อาจเป็นตัวเลขที่จดจำได้ยากสำหรับลูกค้า โชคดีที่ฐานนิยมของราคาพิซซ่าตกอยู่ในช่วงนี้พอดี นั่นคือ 70,000 IDR ซึ่งถือเป็นตัวเลขกลมๆ ที่เหมาะสมและสะดวกสำหรับ Luigi ในการนำไปใช้เป็นกลยุทธ์การตั้งราคา

หากเขาต้องการเปิดร้านพิซซ่าสำหรับกลุ่มลูกค้าที่เน้นราคาประหยัด เขาสามารถตั้งเป้าไปที่ตัวเลขใกล้เคียงกับควอร์ไทล์ที่หนึ่งได้ นั่นคือราคาประมาณ 57,000 IDR ในทางกลับกัน การอ้างอิงราคาจากควอร์ไทล์ที่สามเพื่อเจาะกลุ่มลูกค้าพรีเมียมอาจไม่เหมาะสมนักในกรณีนี้ เนื่องจากการกระจายข้อมูลในฝั่งควอร์ไทล์ที่สามไม่ได้สะท้อนภาพรวมของตลาดอย่างชัดเจนพอ