วันนี้เรามาเรียนรู้การเลือกใช้ค่ากลางของข้อมูล ซึ่งค่ากลางของข้อมูลที่เรารู้จักกันหลักๆก็มี

  • ค่าเฉลี่ยเลขคณิต
  • มัธยฐาน
  • ฐานนิยม

ที่นี้คำถามมีอยู่ว่า เราจะเลือกใช้ค่ากลางตัวไหนในการนำมาวิเคราะห์ข้อมูล  การเลือกใช้ค่ากลางของข้อมูล เราต้องดูที่ข้อมูลครับเช่น

ตัอย่างที่ 1   บริษัทแห่งหนึ่งมีพนักงานจำนวน 5 คน แต่ละคนมีเงินเดือนดังต่อไปนี้

55000,50000,50000,50000,9000

แล้วให้เราหาค่ากลางของข้อมูลชุดนี้  ซึ่งจะเห็นได้ว่าข้อมูลสูงสุดกับข้อมูลต่ำสุดมีความแตกต่างกันมาก  ถ้าเราใช้ค่าเฉลี่ยในการหาค่ากลางของข้อมูลชุดนี้จะได้

\(\bar{X}=\frac{55000+50000+50000+50000+9000}{5}=42800\)

ซึ่งค่าเฉลี่ยที่เราได้มันจะโน้มไปยังค่าของข้อมูลมีพวกเยอะๆเช่นพวกห้าหมื่นมีพวกเยอะ

สรุป  ก็คือถ้าข้อมูลชุดหนึ่งมันตัวหนึ่งที่มันแปลกไปกว่าเพื่อน ก็คืออาจจะน้อยกว่าเพื่อนแบบผิดปกติ หรือมากกว่าเพื่อนแบบผิดปกติ อย่างเช่นตัวอย่างนี้ 9000 น้อยกว่าเพื่อนแบบผิดปกติ ไม่ควรใช้ค่าเฉลี่ยในการหาค่ากลางข้อข้อมูล     แต่ควรใช้ค่ากลางตัวอื่นเช่น มัธยฐานหรือฐานนิยมแทน

แต่ถ้าข้อมูลไม่แตกต่างกันมากมีค่าใกล้เคียงกันเวลาหาค่ากลางของข้อมูลให้ใช่ค่าเฉลี่ย เพราะค่าเฉลี่ยเป็นการนำข้อมูลทุกตัวมาใช้งานก็คือนำมาบวกกันแล้วหารด้วยจำนวนข้อมูลทั้งหมด ก็คือใช้งานข้อมูลทุกตัว  แต่มัยฐานกับฐานนิยมเป็นการใช้งานแค่ข้อมูลบางตัว มัธยฐานใช้ข้อมูลที่อยู่ตรงกลางเท่านั้น ฐานนิยมใช้ข้อมูลที่มีความถี่มากสุด 

สรุปข้อสังเกตและหลักเกณฑ์ที่สำคัญในการใช้ค่ากลางชนิดต่าง ๆ

ข้อสังเกตและหลักเกณฑ์ที่สำคัญในการใช้ค่ากลางชนิดต่าง ๆ

1)  ค่าเฉลี่ยเลขคณิตเป็นค่ากลางที่ได้จากการนำทุก ๆ ค่าของข้อมูลมาเฉลี่ยมัธยฐานเป็นค่ากลางที่ใช้ตำแหน่งที่ของข้อมูล และฐานนิยมเป็นค่ากลางที่ได้จากข้อมูลที่มีความถี่มากที่สุด

2) ถ้าในจำนวนข้อมูลทั้งหมดมีข้อมูลบางค่าที่มีค่าสูงหรือต่ำกว่าข้อมูลอื่น ๆ มากจะมีผลกระทบต่อค่าเฉลี่ยเลขคณิต กล่าวคืออาจจะทำให้ค่าเฉลี่ยเลขคณิต ที่ได้มีค่าสูงหรือต่ำกว่าข้อมูลที่มีอยู่ส่วนใหญ่ แต่จะไม่มีผลกระทบต่อมัธยฐานหรือฐานนิยม

3) มัธยฐานและฐานนิยมใช้เมื่อต้องการทราบค่ากลางของข้อมูลทั้งหมดโดยประมาณ และรวดเร็ว ทั้งนี้เนื่องจากการหามัธยฐานและฐานนิยมบางวิธีไม่จำเป็นต้องมีการคำนวณซึ่งอาจใช้เวลามาก

4) ถ้าการแจกแจงความถี่ของข้อมูลประกอบด้วยอันตรภาคชั้นที่มีช่วงเปิดอาจเป็นชั้นต่ำสุดหรือชั้นสูงสุดชั้นใดชั้นหนึ่งหรือทั้งสองชั้น การหาค่ากลางโดยใช้ค่าเฉลี่ยเลขคณิตไม่สามารถทำได้ แต่สามารถหามัธยฐานหรือฐานนิยมได้

5) การแจกแจงความถี่ของข้อมูลที่มีความกว้างของแต่ละอันตรภาคชั้นไม่เท่ากัน อาจจะมีผลทำให้ค่าเฉลี่ยเลขคณิตหรือฐานนิยมคลาดเคลื่อนไปจากที่ควรจะเป็นได้บ้างแต่จะไม่มีผลกระทบต่อมัธยฐาน

6) ในกรณีที่ข้อมูลเป็นประเภทข้อมูลคุณภาพ จะสามารถหาค่ากลางได้เฉพาะฐานนิยมเท่านั้น แต่ไม่สามารถหาค่าเฉลี่ยเลขคณิต หรือมัธยฐานได้

การเลือกใช้ค่ากลางที่เหมาะสมขึ้นอยู่กับวัตถุประสงค์ของการใช้ค่ากลางดังตัวอย่างต่อไปนี้

ตัวอย่าง บริษัทแห่งหนึ่งมีพนักงาน 300 คน มีรายได้ต่างกันดังนี้

 

พนักงาน จำนวน (คน) เงินเดือน (บาท)
ระดับผู้บริหาร 1

1

4

4

150000

120000

100000

750000

ระดับพนักงาน 10

60

80

130

10

15000

10000

7500

6000

5000

เมื่อนำรายได้ของพนักงานทั้งหมดมาคำนวณหาค่าเฉลี่ยเลขคณิต มัธยฐาน และฐานนิยม จะได้

ค่าเฉลี่ยเลขคณิต     10500   บาท

มัธยฐาน                   7500   บาท

ฐานนิยม                   6000   บาท

ในกรณีที่บริษัทแห่งนี้จะปรับเงินเดือนให้กับพนักงานคนละ 10% กลุ่มทีจะได้รับผลประโยชน์มากที่สุดคือ กลุ่มผู้บริหารเพราะมีเงินเดือนสูง

แต่ถ้าบริษัทเพิ่มงบประมาณค่าจ้างโดยอาศัยค่ากลาง ถ้าเลือกค่ากลางที่เป็นฐานนิยมบริษัทจะเสียค่าใช้จ่ายน้อยกว่าค่ากลางชนิดอื่น

สำหรับค่ากลางที่เหมาะสมที่จะเป็นตัวแทนของเงินเดือนของพนักงานในบริษัทควรจะเป็นค่ามัธยฐานเพราะจะไม่มีผลกระทบจากค่าต่ำสุดและค่าสูงสุดของข้อมูลชุดนี้

สรุปว่า การพิจารณาเลือกใช้ค่ากลางของข้อมูลควรเลือกให้เหมาะสมกับวัตถุประสงค์ซึ่งหากเลือกใช้ค่ากลางที่ไม่เหมาะสม อาจจะทำให้การสรุปผลหรือการตัดสินใจผิดพลาดได้ การเลือกใช้ค่ากลาง ควรจะพิจารณาจากลักษณะของข้อมูลที่มีอยู่จุดประสงค์ในการนำค่ากลางไปใช้ และข้อดีและข้อเสียของค่ากลางแต่ละชนิดดังนี้

 

ค่าเฉลี่ยเลขคณิต

ข้อดี ข้อเสีย
1)การคำนวณหาไม่ยุ่งยากและสามารถใช้เครื่องคิดเลขช่วยคำนวณได้

2)ใช้ข้อมูลทุกตัว

3)เป็นที่แพร่หลาย และส่วนใหญ่ใช้เป็นค่ากลางของข้อมูล

1)ใช้ได้เฉพาะในกรณีที่ข้อมูลเป็นข้อมูลในเชิงปริมาณเท่านั้น

2)ค่าที่คำนวณได้ไม่จำเป็นต้องเป็นค่าของข้อมูลตัวใดตัวหนึ่งเสมอไป

3)ถ้ามีข้อมูลในชุดที่แตกต่างจากข้อมูลตัวอื่นมากจะมีผลต่อค่าเฉลี่ยเลขคณิตของข้อมูลชุดนี้

 

มัธยฐาน

ข้อดี ข้อเสีย
1)หาค่ามัธยฐานจากการนำข้อมูลทั้งหมดมาจัดลำดับจากน้อยไปมากหรือกลับกันได้ง่าย

2)จะเป็นค่าของข้อมูล ถ้ามีข้อมูลเป็นจำนวนคี่

1)ใช้ได้ในกรณีที่ข้อมูลเป็นข้อมูลเชิงปริมาณเท่านั้น

2)ถ้ามีข้อมูลเป็นจำนวนมาก การจัดเรียงข้อมูลจะทำได้ค่อนข้างลำบาก

3)จะไม่ใช่ค่าที่แท้จริงของข้อมูล ถ้าจำนวนข้อมูลเป็นจำนวนคู่

 

ฐานนิยม

ข้อดี ข้อเสีย
1)ใช้ได้กับข้อมูลเชิงปริมาณและเชิงคุณภาพ

2)หาได้ไม่ยากโดยการนับจำนวนข้อมูลที่เกิดขึ้นมากครั้งที่สุดในชุดนี้

3)สามารถหาได้ง่ายจากตารางแจกแจงความถี่ แผนภูมิแท่ง แผนภูมิรูปภาพและแผนภูมิรูปวงกลม

1)ค่าที่ได้มักจะไม่ค่อยมีความหมายถ้าข้อมูบมีจำนวนน้อย

2)อาจจะมีฐานนิยมมากกว่าหนึ่งค่า

3)ข้อมูลบางชุดอาจจะไม่มีฐานนิยม