แผนภาพกล่องหรือ Box-plot เป็นแผนภาพที่แสดงการกระจายของข้อมูล แผนภาพกล่องนั้นเป็นการประยุกต์ใช้ความรู้เกี่ยวกับ  Quartile (ควอร์ไทล์)แล้วเอามาสร้างเป็นกล่อง มาดูไปพร้อมกันเลยว่าเป็นอย่างไร

ตัวอย่าง  สมมติผมมีข้อมูลดังต่อไปนี้

0,0,0,0,2,2,2,3,3,3,3,3,3,4,5,5,5,5,5,6,6,6,6,6,7,9,10,11,12,12,14

ผมจะเอาข้อมูลเหล่านี้มาสร้างเป็นแผนภาพกล่อง

วิธีการสร้างก็คือ

1. เอาข้อมูลมาเรียงจากน้อยไปหามาก่อน

2. หา \(Q_{1},\quad Q_{2}=Median\quad,Q_{3}\)  อย่าลืมนะควอร์ไทล์ที่ 2 เท่ากับมัธยฐานเพราะเป็นข้อมูลที่อยู่ตรงกลาง

3.เอาข้อมูลที่เขากำหนดให้มาเขียนบนเส้นจำนวนครับ

4. เสร็จแล้วก็วาดกล่องครับ

เริ่มทำกันเลย

วิธีทำ 

1. เอาข้อมูลมาเรียงจากน้อยไปหามากก่อน  จะได้

0,0,0,0,2,2,2,3,3,3,3,3,3,4,5,5,5,5,5,6,6,6,6,6,7,9,10,11,12,12,14

2. หา

หาตำแหน่งของ \(Q_{1}=\frac{N+1}{4}=\frac{31+1}{4}=8\)

ดังนั้น ควอร์ไทล์ที่ 1  คือ ข้อมูลตัวที่ 8   ข้อมูลตัวที่ 8 คือ 3  จะได้

\(Q_{1}=3\)

หาตำแหน่งของ \(Q_{2}=\frac{2(N+1)}{4}=\frac{2(31+1)}{4}=16\)

ดังนั้น ควอร์ไทล์ที่ 2 คือข้อมูลตัวที่ 16   ข้อมูลตัวที่ 16 คือ 5 จะได้

\(Q_{2}=5\)

หาตำแหน่งของ \(Q_{3}=\frac{3(N+1)}{4}=\frac{3(31+1)}{4}=24\)

ดังนั้น ควอร์ไทล์ที่ 3 คือข้อมูลตัวที่ 16   ข้อมูลตัวที่ 16 คือ 6 จะได้

\(Q_{3}=6\)

3. เอาข้อมูลที่เขากำหนดให้มาเขียนบนเส้นจำนวนครับ จะได้

แผนภาพกล่อง

4. เสร็จแล้วก็วาดกล่องครับ ก็จะได้ดังรูปด่านล่างครับ

แผนภาพกล่อง

ความสั้น-ยาวของกล่องจะหมายถึง การกระจายของข้อมูล กล่องยาวมากจะหมายถึงข้อมูลมีการกระจายมากครับ เช่นจากรูป

ข้อมูลที่อยู่ระหว่าง \(Q_{1}\) และ \(Q_{2}\)  มีการกระจายมากกว่าข้อมูลที่อยู่ระหว่าง \(Q_{2}\)  และ \(Q_{3}\)

ซึ่งถ้าเราไปดูที่ข้อมูลที่เขากำหนดให้มามันก็สอดคล้องกัน ซึ่งก็คือ

ข้อมูลที่อยู่ระหว่าง \(Q_{1}\) และ \(Q_{2}\) คือ

3,3,3,3,3,3,4,5,5

ข้อมูลที่อยู่ระหว่าง \(Q_{2}\)  และ \(Q_{3}\) คือ

5,5,5,5,6,6,6,6,6

อันบนมีข้อมูล มีทั้ง 3 ทั้ง 4 ท้้ง 5  แต่อันล่างมีข้อมูลแค่ 5 กับ 6 อันบนจึงกระจายมากกว่าอันล่าง

แต่ข้อมูลที่อยู่ระหว่าง \(Q_{3}\) ถึงค่าที่มากที่สุดก็คือ 14 มีการกระจายมากที่สุด  เพราะถ้าดูจากแผนภาพด้านบนกล่องจะยาวมากครับ

***อธิบายความหมายของกล่องอีกรอบนะครับ ความสั้น - ยาว ของกล่องหมายถึง การกระจายของข้อมูล ยาวมากแสดงว่าข้อมูลมีการกระจายมากครับ

***จำนวนข้อมูลจะถูกแบ่งออกเป็น 4 ส่วนแต่ละส่วนมีจำนวนข้อมูลอยู่ 25% เท่ากันหมดนะครับ  เวลาวาดความยาวของกล่องอาจจะไม่เท่ากันแต่ให้เราคำนึงไว้เลยว่าถึงแม้ว่าความยาวกล่องไม่เท่ากันแต่จำนวนข้อมูลแต่ละส่วนมีอยู่เท่ากันครับ  

มาดูข้อสอบ o-net ที่เกี่ยวกับแผนภาพกล่องกันครับ

1. คะแนนสอบความรู้ทั่วไปของนักเรียน 200 คนนำเสนอโดยใช้แผนภาพกล่องดังนี้

แผนภาพกล่อง

ข้อใดเป็นเท็จ (o-net 53/32)

1) จำนวนนักเรียนที่ทำได้ 12 ถึง 16 คะแนน มีเท่ากับ จำนวนนักเรียนที่ทำได้ 16 ถึง 18 คะแนน

2) จำนวนนักเรียนที่ทำได้ 12 ถึง 18 คะแนน มีเท่ากับ จำนวนนักเรียนที่ทำได้ 18 ถึง 24 คะแนน

3)  จำนวนนักเรียนที่ทำได้ 10 ถึง 12 คะแนน มีเท่ากับ จำนวนนักเรียนที่ทำได้ 18 ถึง 24 คะแนน

4) จำนวนนักเรียนที่ทำได้ 10 ถึง 16 คะแนน มีเท่ากับ จำนวนนักเรียนที่ทำได้ 16 ถึง 24 คะแนน

วิธีทำ ข้อนี้ง่ายครับแผนภาพกล่องจะแบ่งข้อมูลออกเป็น 4 ส่วนแต่ละส่วนมีจำนวนข้อมูลอยู่เท่ากันคือ 25% ดังนั้น

ข้อ 1 ถูกต้อง

ข้อ 2 เป็นเท็จ เพราะ คะแนน 12 ถึง 18 มีจำนวนนักเรียนอยู่ในช่วงนี้ 50% แต่คะแนน 18 ถึง 24 มีจำนวนนักเรียนอยู่แค่ 25%

ข้อ 3 ถูกต้อง

ข้อ 4 ถูกต้อง


2. จากการทดสอบนักเรียนจำนวน 100 คนใน 2 รายวิชาแต่ละรายวิชามีคะแนนเต็ม 150 คะแนน ถ้าผลการทดสอบทั้งสองรายวิชาสามารถเขียนเป็นแผนกล่องได้ดังนี้ (o-net 50/40)

แผนภาพกล่อง

แล้วข้อใดต่อไปนี้สรุปถูกต้อง

1. คะแนนสอบทั้งสองรายวิชามีการแจกแจงแบบปกติ

2. จำนวนนักเรียนที่ได้คะแนนไม่เกิน 80 คะแนน ในรายวิชาที่ 1 มากกว่าจำนวนนักเรียนที่ได้คะแนนไม่เกิน 80 คะแนนในรายวิชาที่ 2

3. คะแนนสูงสุดที่อยู่ในกลุ่ม 25% ต่ำสุด ของผลการสอบของรายวิชาที่ 1 น้อยกว่า คะแนนสูงสุดที่อยู่ในกลุ่ม 25% ต่ำสุด ของผลการสอบรายวิชาที่ 2

4. จำนวนนักเรียนที่ได้คะแนนระหว่าง 60-80 คะแนนในการสอบในรายวิชาที่ 2 น้อยกว่า จำนวนนักเรียนที่ได้คะแนนในช่วงเดียวกันในการสอบรายวิชาที่ 1

วิธีทำ

1. ผิดครับถ้ามีการแจกแจงแบบปกติความยาวของกล่องในแต่ละรายวิชาจะยาวเท่ากัน

2. ผิด เพราะจำนวนนักเรียนที่ได้คะแนนไม่เกิน 80 คะแนนในรายวิชาที่ 2  มีอยู่ 75% แต่จำนวนนักเรียนที่ได้คะแนนไม่เกิน 80 คะแนนในรายวิชาที่ 1 มีไม่ถึง 75%  ดูจากแผนภาพกล่องเอานะครับ

แผนภาพกล่อง

3. ถูกต้อง คะแนนสูงสุดที่อยู่ในกลุ่ม 25% ต่ำสุด ของผลการสอบของรายวิชาที่ 1 เท่ากับ 30 คะแนน

    คะแนนสูงสุดที่อยู่ในกลุ่ม 25% ต่ำสุด ของผลการสอบรายวิชาที่ 2  เท่ากับ 50 คะแนน

ดังนั้น 

 คะแนนสูงสุดที่อยู่ในกลุ่ม 25% ต่ำสุด ของผลการสอบของรายวิชาที่ 1 น้อยกว่า คะแนนสูงสุดที่อยู่ในกลุ่ม 25% ต่ำสุด ของผลการสอบรายวิชาที่ 2