วันนี้เรามาเรียนรู้การเลือกใช้ค่ากลางของข้อมูล ซึ่งค่ากลางของข้อมูลที่เรารู้จักกันหลักๆก็มี
- ค่าเฉลี่ยเลขคณิต
- มัธยฐาน
- ฐานนิยม
ที่นี้คำถามมีอยู่ว่า เราจะเลือกใช้ค่ากลางตัวไหนในการนำมาวิเคราะห์ข้อมูล การเลือกใช้ค่ากลางของข้อมูล เราต้องดูที่ข้อมูลครับเช่น
ตัอย่างที่ 1 บริษัทแห่งหนึ่งมีพนักงานจำนวน 5 คน แต่ละคนมีเงินเดือนดังต่อไปนี้
55000,50000,50000,50000,9000
แล้วให้เราหาค่ากลางของข้อมูลชุดนี้ ซึ่งจะเห็นได้ว่าข้อมูลสูงสุดกับข้อมูลต่ำสุดมีความแตกต่างกันมาก ถ้าเราใช้ค่าเฉลี่ยในการหาค่ากลางของข้อมูลชุดนี้จะได้
\(\bar{X}=\frac{55000+50000+50000+50000+9000}{5}=42800\)
ซึ่งค่าเฉลี่ยที่เราได้มันจะโน้มไปยังค่าของข้อมูลมีพวกเยอะๆเช่นพวกห้าหมื่นมีพวกเยอะ
สรุป ก็คือถ้าข้อมูลชุดหนึ่งมันตัวหนึ่งที่มันแปลกไปกว่าเพื่อน ก็คืออาจจะน้อยกว่าเพื่อนแบบผิดปกติ หรือมากกว่าเพื่อนแบบผิดปกติ อย่างเช่นตัวอย่างนี้ 9000 น้อยกว่าเพื่อนแบบผิดปกติ ไม่ควรใช้ค่าเฉลี่ยในการหาค่ากลางข้อข้อมูล แต่ควรใช้ค่ากลางตัวอื่นเช่น มัธยฐานหรือฐานนิยมแทน
แต่ถ้าข้อมูลไม่แตกต่างกันมากมีค่าใกล้เคียงกันเวลาหาค่ากลางของข้อมูลให้ใช่ค่าเฉลี่ย เพราะค่าเฉลี่ยเป็นการนำข้อมูลทุกตัวมาใช้งานก็คือนำมาบวกกันแล้วหารด้วยจำนวนข้อมูลทั้งหมด ก็คือใช้งานข้อมูลทุกตัว แต่มัยฐานกับฐานนิยมเป็นการใช้งานแค่ข้อมูลบางตัว มัธยฐานใช้ข้อมูลที่อยู่ตรงกลางเท่านั้น ฐานนิยมใช้ข้อมูลที่มีความถี่มากสุด
สรุปข้อสังเกตและหลักเกณฑ์ที่สำคัญในการใช้ค่ากลางชนิดต่าง ๆ
ข้อสังเกตและหลักเกณฑ์ที่สำคัญในการใช้ค่ากลางชนิดต่าง ๆ
1) ค่าเฉลี่ยเลขคณิตเป็นค่ากลางที่ได้จากการนำทุก ๆ ค่าของข้อมูลมาเฉลี่ยมัธยฐานเป็นค่ากลางที่ใช้ตำแหน่งที่ของข้อมูล และฐานนิยมเป็นค่ากลางที่ได้จากข้อมูลที่มีความถี่มากที่สุด
2) ถ้าในจำนวนข้อมูลทั้งหมดมีข้อมูลบางค่าที่มีค่าสูงหรือต่ำกว่าข้อมูลอื่น ๆ มากจะมีผลกระทบต่อค่าเฉลี่ยเลขคณิต กล่าวคืออาจจะทำให้ค่าเฉลี่ยเลขคณิต ที่ได้มีค่าสูงหรือต่ำกว่าข้อมูลที่มีอยู่ส่วนใหญ่ แต่จะไม่มีผลกระทบต่อมัธยฐานหรือฐานนิยม
3) มัธยฐานและฐานนิยมใช้เมื่อต้องการทราบค่ากลางของข้อมูลทั้งหมดโดยประมาณ และรวดเร็ว ทั้งนี้เนื่องจากการหามัธยฐานและฐานนิยมบางวิธีไม่จำเป็นต้องมีการคำนวณซึ่งอาจใช้เวลามาก
4) ถ้าการแจกแจงความถี่ของข้อมูลประกอบด้วยอันตรภาคชั้นที่มีช่วงเปิดอาจเป็นชั้นต่ำสุดหรือชั้นสูงสุดชั้นใดชั้นหนึ่งหรือทั้งสองชั้น การหาค่ากลางโดยใช้ค่าเฉลี่ยเลขคณิตไม่สามารถทำได้ แต่สามารถหามัธยฐานหรือฐานนิยมได้
5) การแจกแจงความถี่ของข้อมูลที่มีความกว้างของแต่ละอันตรภาคชั้นไม่เท่ากัน อาจจะมีผลทำให้ค่าเฉลี่ยเลขคณิตหรือฐานนิยมคลาดเคลื่อนไปจากที่ควรจะเป็นได้บ้างแต่จะไม่มีผลกระทบต่อมัธยฐาน
6) ในกรณีที่ข้อมูลเป็นประเภทข้อมูลคุณภาพ จะสามารถหาค่ากลางได้เฉพาะฐานนิยมเท่านั้น แต่ไม่สามารถหาค่าเฉลี่ยเลขคณิต หรือมัธยฐานได้
การเลือกใช้ค่ากลางที่เหมาะสมขึ้นอยู่กับวัตถุประสงค์ของการใช้ค่ากลางดังตัวอย่างต่อไปนี้
ตัวอย่าง บริษัทแห่งหนึ่งมีพนักงาน 300 คน มีรายได้ต่างกันดังนี้
พนักงาน | จำนวน (คน) | เงินเดือน (บาท) |
ระดับผู้บริหาร | 1
1 4 4 |
150000
120000 100000 750000 |
ระดับพนักงาน | 10
60 80 130 10 |
15000
10000 7500 6000 5000 |
เมื่อนำรายได้ของพนักงานทั้งหมดมาคำนวณหาค่าเฉลี่ยเลขคณิต มัธยฐาน และฐานนิยม จะได้
ค่าเฉลี่ยเลขคณิต 10500 บาท
มัธยฐาน 7500 บาท
ฐานนิยม 6000 บาท
ในกรณีที่บริษัทแห่งนี้จะปรับเงินเดือนให้กับพนักงานคนละ 10% กลุ่มทีจะได้รับผลประโยชน์มากที่สุดคือ กลุ่มผู้บริหารเพราะมีเงินเดือนสูง
แต่ถ้าบริษัทเพิ่มงบประมาณค่าจ้างโดยอาศัยค่ากลาง ถ้าเลือกค่ากลางที่เป็นฐานนิยมบริษัทจะเสียค่าใช้จ่ายน้อยกว่าค่ากลางชนิดอื่น
สำหรับค่ากลางที่เหมาะสมที่จะเป็นตัวแทนของเงินเดือนของพนักงานในบริษัทควรจะเป็นค่ามัธยฐานเพราะจะไม่มีผลกระทบจากค่าต่ำสุดและค่าสูงสุดของข้อมูลชุดนี้
สรุปว่า การพิจารณาเลือกใช้ค่ากลางของข้อมูลควรเลือกให้เหมาะสมกับวัตถุประสงค์ซึ่งหากเลือกใช้ค่ากลางที่ไม่เหมาะสม อาจจะทำให้การสรุปผลหรือการตัดสินใจผิดพลาดได้ การเลือกใช้ค่ากลาง ควรจะพิจารณาจากลักษณะของข้อมูลที่มีอยู่จุดประสงค์ในการนำค่ากลางไปใช้ และข้อดีและข้อเสียของค่ากลางแต่ละชนิดดังนี้
ค่าเฉลี่ยเลขคณิต
ข้อดี | ข้อเสีย |
1)การคำนวณหาไม่ยุ่งยากและสามารถใช้เครื่องคิดเลขช่วยคำนวณได้
2)ใช้ข้อมูลทุกตัว 3)เป็นที่แพร่หลาย และส่วนใหญ่ใช้เป็นค่ากลางของข้อมูล |
1)ใช้ได้เฉพาะในกรณีที่ข้อมูลเป็นข้อมูลในเชิงปริมาณเท่านั้น
2)ค่าที่คำนวณได้ไม่จำเป็นต้องเป็นค่าของข้อมูลตัวใดตัวหนึ่งเสมอไป 3)ถ้ามีข้อมูลในชุดที่แตกต่างจากข้อมูลตัวอื่นมากจะมีผลต่อค่าเฉลี่ยเลขคณิตของข้อมูลชุดนี้ |
มัธยฐาน
ข้อดี | ข้อเสีย |
1)หาค่ามัธยฐานจากการนำข้อมูลทั้งหมดมาจัดลำดับจากน้อยไปมากหรือกลับกันได้ง่าย
2)จะเป็นค่าของข้อมูล ถ้ามีข้อมูลเป็นจำนวนคี่ |
1)ใช้ได้ในกรณีที่ข้อมูลเป็นข้อมูลเชิงปริมาณเท่านั้น
2)ถ้ามีข้อมูลเป็นจำนวนมาก การจัดเรียงข้อมูลจะทำได้ค่อนข้างลำบาก 3)จะไม่ใช่ค่าที่แท้จริงของข้อมูล ถ้าจำนวนข้อมูลเป็นจำนวนคู่ |
ฐานนิยม
ข้อดี | ข้อเสีย |
1)ใช้ได้กับข้อมูลเชิงปริมาณและเชิงคุณภาพ
2)หาได้ไม่ยากโดยการนับจำนวนข้อมูลที่เกิดขึ้นมากครั้งที่สุดในชุดนี้ 3)สามารถหาได้ง่ายจากตารางแจกแจงความถี่ แผนภูมิแท่ง แผนภูมิรูปภาพและแผนภูมิรูปวงกลม |
1)ค่าที่ได้มักจะไม่ค่อยมีความหมายถ้าข้อมูบมีจำนวนน้อย
2)อาจจะมีฐานนิยมมากกว่าหนึ่งค่า 3)ข้อมูลบางชุดอาจจะไม่มีฐานนิยม
|