• ความแปรปรวน

    ความแปรปรวนของประชากร  (population variance)

        ความแปรปรวน คือ กำลังสองของส่วนเบี่ยงเบนมาตรฐาน  ความแปรปรวนของประชากรที่ไม่ได้แจกแจงความถี่ หาได้โดยใช้สูตร

    \begin{array}{lcl} \sigma^{2}&=&\frac{\displaystyle\sum_{i=1}^{N}(x_{i}-\mu)^{2}}{N}\\&=&\frac{\displaystyle\sum_{i=1}^{N}x_{i}^{2}}{N}-\mu^{2}\end{array}

    มีสองสูตรให้เลือกใช้ในครับใช้อันไหนก็ได้ครับ

    และความแปรปรวนของประชากรที่แจกแจงความถี่ หาได้จากสูตร

    \begin{array}{lcl}\sigma^{2}&=&\frac{\displaystyle\sum_{i=1}^{k}f_{i}(x_{i}-\mu)^{2}}{N}\\&=&\frac{\displaystyle\sum_{i=1}^{k}f_{i}x_{i}^{2}}{N}-\mu^{2}\end{array}

    เมื่อ

    \(k\) แทนจำนวนอัตรภาคชั้น

    \(x_{i}\) แทนจุดกึ่งกลางของอันตรภาคชั้นที่ \(i\)

    \(f_{i}\) แทนความถี่ของอันตรภาคชั้นที่ \(i\)

    ความแปรปรวนของตัวอย่าง (sample vaviance)

       ความแปรปรวนของตัวอย่างทั้งกรณีไม่แจกแจงความถี่และแจกแจงความถี่ คือ กำลังสองของส่วนเบี่ยงเบนมาตรฐานของตัวอย่างในทั้งสองกรณีตามลำดับ

       ดังนั้น ความแปรปรวนของตัวอย่าง คำนวณได้ดังนี้

    กรณีข้อมูลไม่แจกแจงความถี่

    \[s^{2}=\frac{\displaystyle\sum_{i=1}^{n}(x_{i}-\bar{X})^{2}}{n-1}\]

    หรือ

    \[s^{2}=\frac{\displaystyle\sum_{i=1}^{n}x_{i}^{2}-n\bar{X}^{2}}{n-1}\]

    กรณีข้อมูลแจกแจงความถี่

    \[s^{2}=\frac{\displaystyle\sum_{i=1}^{k}f_{i}(x_{i}-\bar{X})^{2}}{n-1}\]

    หรือ

    \[s^{2}=\frac{\displaystyle\sum_{i=1}^{k}f_{i}x_{i}^{2}-n\bar{X}^{2}}{n-1}\]

    โดยที่

    \(x_{i}\)  แทนจุดกึ่งกลางของอันตรภาคชั้นที่ \(i\)

    \(f_{i}\) แทนความถี่ของอันตรภาคชั้นที่ \(i\)

    \(\bar{X}\) แทนค่าเฉลี่ยเลขคณิตของตัวอย่าง

    \(n\) แทนจำนวนตัวอย่างทั้งหมด \((n=\displaystyle\sum_{i=1}^{k}f_{i})\)

    \(k\) แทนจำนวนอันตรภาคชั้นหรือจำนวนกลุ่ม

    เริ่มทำแบบฝึกหัดกันเลยดีกว่าครับแบบฝึกหัดไม่ยากนะครับแต่จะเน้นความเข้าใจและความรู้พื้นฐานครับ

    1. ครอบครัวหนึ่งมีบุตร 4 คน ถ้าอายุของบิดา มารดา และบุตรทั้งสี่คน เป็น 45,  42,  20,  17,  16  และ 14  ปีตามลำดับ  จงหาส่วนเบี่ยงเบนมาตรฐานและความแปรปรวนของอายุของสมาชิกทุกคนในครอบครัวนี้ และในอีก 5 ปีข้างหน้า ส่วนเบี่ยงเบนมาตรฐานและความแปรปรวนของอายุสมาชิกทุกคนในครอบครัวนี้จะเป็นอย่างไร

    วิธีทำ

    อายุของคนในครอบครัวนี้เป็น 45,42,20,17,16,14  จะได้ว่า

    ค่าเฉลี่ยเลขคณิต \(=\frac{45+42+20+17+16+14}{6}=\frac{154}{6}=25.67 \quad ปี\)

    ต่อไปหาความแปรปรวนครับ ใช้สูตรนี้นะครับ เพราะข้อมูลที่เขาให้มาเป็นประชากรและเป็นข้อมูลแบบไม่แจกแจงความถี่ครับ

    \begin{array}{lcl}\sigma^{2}&=&\frac{\displaystyle\sum_{i=1}^{N}x_{i}^{2}}{N}-\mu^{2}\\&=&\frac{\displaystyle\sum_{i=1}^{6}}{6}-25.67^{2}\\&=&\frac{45^{2}+42^{2}+20^{2}+17^{2}+16^{2}+14^{2}}{6}-(25.67)^{2}\\&=&\frac{4930}{6}-658.9489\\&=&162.72\quad ปี^{2}\end{array}

    เนื่องจากความแปรปรวน

    \(\sigma^{2}=162.72\)

    ดังนั้น ส่วนเบี่ยงเบนมาตรฐาน\(\quad(\sigma)\)

    \begin{array}{lc}\sqrt{\sigma^{2}}&=&\sqrt{162.72}\\\sigma&=&12.76 \quad ปี\end{array}

    นั่นคือส่วนเบี่ยงเบนมาตรฐานเท่ากับ  12.76 ปี

    ในอีก 5 ปีข้างหน้า ส่วนเบี่ยงเบนมาตรฐานและความแปรปรวนของอายุสมาชิกในครอบครัวนี้จะมีค่าเท่าเดินนะครับเพราะว่าข้อมูลของเราเป็นอายุมันจะเพิ่มขึ้นเท่าเดิมเสมอครับ

    2. ความแปรปรวนของน้ำหนักในรอบ 6 ปี ซึ่งมีนำหนัก 60,40,60,50,70 และ 80 กิโลกรัมตามลำดับเท่ากับกี่กิโลกรัม2

    วิธีทำ  ก่อนจะหาความแปรปรวมเราต้องหาค่าเฉลี่ยก่อน จะได้ค่าเฉลี่ยคือ

    \begin{array}{lcl}\overline{x}&=&\frac{60+40+60+50+70+80}{6}\\&=&\frac{360}{6}\\&=&60\end{array}

    ต่อไปให้เราหาตัวนี้ครับ \((x_{i}-\overline{x})^{2}\) ก็คือเอาข้อมูลก็คือน้ำหนักของแต่ละปีไปลบกับค่าเฉลี่ยแล้วยกกำลังสองจะได้ดังนี้

    \((60-60)^{2}=0^{2}=0\)

    \((40-60)^{2}=(-20)^{2}=400\)

    \((60-60)^{2}=0^{2}=0\)

    \((50-60)^{2}=(-10)^{2}=100\)

    \((70-60)^{2}=10^{2}=100\)

    \((80-60)^{2}=20^{2}=400\)

    ต่อไปเราจะได้ว่า

    \begin{array}{lcl}\displaystyle\sum_{i=1}^{6}(x_{i}-\overline{x})^{2}&=&0+400+0+100+100+400\\&=&1000\end{array}

    ดังนั้นเราจะได้ความแปรปรวนของน้ำหนักคือ

    \begin{array}{lcl}\sigma^{2}&=&\frac{\displaystyle\sum_{i=1}^{6}(x_{i}-\overline{x})^{2}}{N}\\&=&\frac{1000}{6}\quad kg^{2}\end{array}


    3. ถ้าข้อมูลชุดหนึ่งมีความแปรปรวนเป็น \(8+\sqrt{60}\)  แล้วส่วนเบี่ยงเบนมาตรฐานเท่ากับเท่าใด

    วิธีทำ ข้อนี้ไม่ยากครับ เริ่มทำกันเลย

    \begin{array}{lcl}\sigma^{2}&=&8+\sqrt{60}\\so\\S.D.&=&\sqrt{8+\sqrt{60}}\\&=&\sqrt{8+2\sqrt{15}}\\&=&\sqrt{5}+\sqrt{3}\end{array}


    4. จากการคำนวณอายุเฉลี่ยของนักเรียนชั้นมัธยมศึกษาตอนต้น 6 คน ได้เป็น 15 ปี ผลบวกกำลังสองของอายุแต่ละคนเป็น 1404 ปี ความแปรปรวนของอายุคน 6 คนนี้เป็นกี่ปี2

    วิธีทำ  จากโจทย์ได้ว่า

    \(\overline{x}=15\)

    \(\displaystyle\sum_{i=1}^{6}x_{i}^{2}=1404\)

    ดังนั้น

    \begin{array}{lcl}\sigma^{2}&=&\frac{\displaystyle\sum_{i=1}^{N}x_{i}^{2}}{N}-(\overline{x})^{2}\\&=&\frac{1404}{6}-15^{2}\\&=&9\end{array}

    สามารถศึกษาเกี่ยวกับโจทย์พวกความแปรปรวนจากลิงค์ต่อไปนี้

    เฉลย Pat 1 เรื่องโจทย์ส่วนเบี่ยงเบนมาตรฐาน ความแปรปรวน ส่วนเบี่ยงเบนเฉลี่ย

    การหาส่วนเบี่ยงเบนมาตรฐานความแปรปรวนเมื่ออ่านข้อมูลผิด

    โจทย์ส่วนเบี่ยงเบนมาตรฐาน ความแปรปรวน ส่วนเบี่ยงเบนเฉลี่ย

    แบบฝึกหัดการหาความแปรปรวนของข้อมูลหลายชุด

    แบบฝึกหัดการหาส่วนเบี่ยงเบนมาตรฐานและความแปรปรวนเมื่อมีการอ่านข้อมูลผิดพลาด

    ความแปรปรวน

  • สมบัติของส่วนเบี่ยงเบนมาตรฐานและส่วนเบี่ยงเบนเฉลี่ย

    สมบัติของส่วนเบี่ยงเบนมาตรฐานและส่วนเบี่ยงเบนเฉลี่ย

    1. ส่วนเบี่ยงเบนเฉลี่ย และส่วนเบี่ยงเบนมาตรฐานของข้อมูลใดๆ จะต้องเป็นจำนวนจริงบวกหรือศูนย์เสมอ

    2. ส่วนเบี่ยงเบนเฉลี่ยและส่วนเบี่ยงเบนมาตรฐานของข้อมูลจะเท่ากับศูนย์ ก็ต่อเมื่อ ค่าทุกค่าในข้อมูลนั้นเท่ากันหมด 

    3. ถ้านำจำนวนจริง \(b\) ไปบวกกับค่าแต่ละค่าในข้อมูลเดิมแล้ว  ส่วนเบี่ยงเบนเฉลี่ยหรือส่วนเบี่ยงเบนมาตรฐานของข้อมูลใหม่ จะเท่ากับส่วนเบี่ยงเบนเฉลี่ย หรือส่วนเบี่ยงเบนมาตรฐานของข้อมูลเดิมตามลำดับ

    4. ถ้านำจำนวนจริง \(a\) ไปคูณค่าแต่ละค่าในข้อมูลเดิมเดิมแล้ว  ส่วนเบี่ยงเบนเฉลี่ยหรือส่วนเบี่ยงเบนมาตรฐานของข้อมูลใหม่ จะเท่ากับ \(|a|\)เท่าของส่วนเบี่ยงเบนเฉลี่ยหรือส่วนเบี่ยงเบนมาตรฐานของข้อมูลเดิมตามลำดับ

    5. ถ้า \(x\) แทนค่าในข้อมูลชุดหนึ่ง และ \(y\) แทนค่าในข้อมูลอีกชุดหนึ่ง โดยที่

    \[y=ax+b\]

    เมื่อ \(a\) และ \(b\) เป็นค่าคงตัวแล้ว

    \[M.D._{y}=|a|M.D._{x}\]

    และ

    \[S.D._{y}=|a|S.D._{x}\]

    6. ถ้าคำนวณหาส่วนเบี่ยงเบนมาตรฐานโดยใช้ค่ากลางของข้อมูลอย่างอื่นที่ไม่ใช่ค่าเฉลี่ยเลขคณิต  ส่วนเบี่ยงเบนมาตรฐานที่หาได้จะมีค่ามากกว่าส่วนเบี่ยงเบนมาตรฐานที่หาได้จากค่าเฉลี่ยเลขคณิตเสมอ

    มาดูตัวอย่างการทำแบบฝึกหัดกัน

    1. ถ้าข้อมูลชุดหนึ่งคือ \(a,b,c,d\) มี่ส่วนเบี่ยงเบนมาตรเท่ากับ \(p\) แล้ว ส่วนเบี่ยงเบนมาตรฐานของข้อมูล \(2-3a,2-3b,2-3c,2-3d\) เท่ากับเท่าใด

    วิธีทำ ใช้สมบัติของส่วนเบี่ยงเบนมาตรฐานเลยคับ 

    จะเห็นได้ว่า

    \(-3a,-3b,-3c,-3d\)  คือการเอา \(-3\) คูณเข้ากับข้อมูลเดิม ดังนั้นส่วนเบี่ยงเบนมาตรฐานของข้อมูลนี้จึงเท่ากับ \(|-3|p=3p\)

    และจะเห็นว่า

    \(2-3a,2-3b,2-3c,2-3d\) คือการเอา \(2\) ไปบวกเข้ากับข้อมูล \(-3a,-3b,-3c,-3d\)  ดังนัั้นตามสมบัติของส่วนเบี่ยงเบนมาตรฐานจะยังเท่ากับส่วนเบี่ยงเบนมาตรฐานของข้อมูลชุดเดิมคือ \(3p\)

    ข้อนี้ตอบ \(3p\)


    2. ในการศึกษาน้ำหนักมังคุด 10 ผล ปรากฎว่าส่วนเบี่ยงเบนเฉลี่ยของน้ำหนักมังคุดมีค่าเป็นศูนย์ ถ้าผลรวมกำลังสองของน้ำหนักมังคุดแต่ละผลเป็น 9000 กรัม มังคุดแต่ละผลหนักกี่กรัม

    วิธีทำ จากโจทย์เนื่องจากส่วนเบี่ยงเบนเฉลี่ยเท่ากับศูนย์ เราจึงได้ว่าน้ำหนักมังคุดทั้ง 10 ผลนี้ มันหนักเท่ากัน

    ผมสมมติให้ แต่ละผลหนักเท่ากับ \(x\) กรัม ดังนั้น กำลังสองของน้ำหนังมังคุดแต่ละลูกคือ \(x^{2}\)

    และจะได้อีกว่าผลรวมกำลังสองของน้ำหนักมังคุดทั้งหมดคือ \(10x^{2}\) ซึ่งจากโจทย์เราจะได้ว่า

    \begin{array}{lcl}10x^{2}&=&9000\\x^{2}&=&\frac{9000}{10}\\x^{2}&=&900\\x&=&\pm 30\end{array}

    เนื่องจาก \(x\) คือน้ำหนักมังคุดแต่ละลูก ดังนั้น \(x=30\) กรัม นั่นคือมังคุดแต่ละลูกหนัก 30 กรัม


    3. เมื่อวันปีใหม่ที่ผ่านมา คุณพ่อตั้งใจจะเห็นเงินแก่ลูก 7 คน เรียงตามลำดับอายุดังนี้ \(31,30,29,28,27,26,25\) บาท ตามลำดับ คุณพ่อนึกขึ้นมาได้ว่าปัจจุบันค่าใช้จ่ายสูงขึ้น ควรจะให้เงินแก่ลูกเพิ่มขึ้นตามสัดส่วนของแต่ละคน ซึ่งเมื่อคิดส่วนเบี่ยงเบนมาตรฐานของเงินที่ได้รับครั้งหลังแล้วได้เท่ากับ 3 บาท จงหาว่าลูกคนที่สองจะได้รับเงินกี่บาท

    วิธีทำขั้นตอนการทำข้อนี้คือ เอาข้อมูลนี้คือ \(31,30,29,28,27,26,25\) ซึ่งผมจะเรียกว่าข้อมูลเดิม มาหา S.D. ซึ่งจะได้ S.D. ของข้อมูลเดิมนี้เท่ากับ 2  ไปหากันเองนะคับไม่แสดงวิธีทำให้ดู

    ขั้นตอนต่อไปคือพิจารณาจากโจทย์  พ่อเพิ่มเงินให้แก่ลูกตามสัดส่วนของแต่ละคน สมมติให้พ่อเพิ่มเงินให้แต่ละคนคิดเป็นสัดส่วนคือ \(a\) นั่นคือ แต่ละคนได้เงินเพิ่มเป็น \(31a,30a,29a,28a,27a,26a,25a\) ซึ่งหลังจากที่พ่อเพิ่มให้เงินแก่ลูกๆแล้ว ส่วนเบี่ยงเบนมาตรฐานของเงินครั้งหลังนี้มีค่าเท่ากับ \(3\) ตามสมบัติของส่วนเบี่ยงเบนมาตรฐาน เราได้ว่า

    \begin{array}{lcl}3&=&|a|2\\|a|&=&\frac{3}{2}\\|a|&=&1.5\\a&=&1.5\end{array}

    นั่นก็คือลูกคนที่สองได้รับเงิน \(30a=30(1.5)=45\) บาท

    *** ค่าของ \(a\) ต้องใช้เป็น 1.5 นะคับเพื่อให้เข้ากับเงื่อนไขของโจทย์คือได้เงินเพิ่มขึ้น แต่ถ้าใช้ \(a\) เป็น \(-1.5\) เงินจะติดลบซึ่งไม่ตรงตามเงื่อนไขของโจทย์


    4. ข้อมูล 2 ชุด มีจำนวนข้อมูลเท่ากัน  ในการคำนวณค่าเฉลี่ยเลขคณิตและส่วนเบี่ยงเบนมาตรฐาน ปรากฏผลดังนี้ \(\overline{x_{1}}:\overline{x_{2}}=3:5\) และส่วนเบี่ยงเบนมาตรฐานมีค่าเท่ากัน ถ้าข้อมูลชุดที่หนึ่งเป็น  \(1,4,6,9,10\)  จงหาข้อมูลชุดที่สอง

    วิธีทำ จากข้อมูลชุดที่หนึ่งที่โจทย์ให้มา ทำให้เราได้ว่าข้อมูลชุดที่หนึ่งมีค่าเฉลี่ยเลขคณิต \(\overline{x_{1}}=6\)  ดังนั้นเราจึงได้ว่า

    \(\overline{x_{2}}=10\) ก็คือข้อมูลชุดที่สองมีค่าเฉลี่ยเลขคณิตเท่ากับ \(10\) นั่นเองครับ อันนี้ไม่คำนวณให้ดูนะ ลองไปหาเองไม่ยาก

    ต่อไปคิดตามดีๆ นะ เนื่องจากข้อมูลชุดที่สองมันมีค่าเฉลี่ยเลขคณิตเท่ากับ \(10\) ดังนั้นผลรวมของข้อมูลชุดที่สองซึ่งมีข้อมูลอยู่ 5 ตัวจะเท่ากับ \(50\) นะคับคิดตามดีๆ

    การหาข้อมูลชุดที่สอง ให้เริ่มต้นจากข้อมูลชุดที่หนึ่ง  และใช้สมบัติของส่วนเบี่ยงเบนมาตรฐาน มาช่วยในการหานิดหน่อย ก็คือว่า

    ข้อมูลชุดที่หนึ่งคือ \(1,4,6,9,10\)  ซึ่งผลรวมของข้อมูลชุดที่หนึ่งคือ 30 

    แต่ข้อมูลชุดที่สอง ที่เราต้องการหาอยู่นี้เราต้องการผลรวมของมันคือให้ได้เท่ากับ 50 ดังนั้นเราต้องเอา \(4\) ไปบวกเข้ากับทุกตัวของข้อมูลชุดที่ 1 ก็จะได้ข้อมูลชุดที่สองเป็น \(1+4,4+4,6+4,9+4,10+4\) หรือก็คือ \(5,8,10,13,14\)  ตามสมบัติของส่วนเบี่ยงเบนมาตรฐานจะเห็นได้ว่า ข้อมูลชุดที่หนึ่ง กับ ข้อมูลชุดที่สอง ก็ยังมีส่วนเบี่ยงเบนมาตรฐานเท่ากัน ไม่เชื่อลองคำนวณดู  ดังนั้นข้อมูลชุดที่สอง ก็คือ \(5,8,10,13,14\)


    5. ในการหาส่วนเบี่ยงเบนมาตรฐานของข้อมูลชุดหนึ่ง นักคำนวณได้ใช้ค่ามัธยฐานซึ่งมีค่า 45 มาคำนวณแทนค่าเฉลี่ยเลขคณิต ซึ่งมีค่า 48 ปรากฎหาส่วนเบี่ยงเบนมาตรฐานได้ 5 ถ้านักคำนวณผู้นี้ใช้ค่าเฉลี่ยเลขคณิตมาคำนวณหาส่วนเบี่ยงเบนมาตรฐานแล้ว จะคำนวณได้เท่าใด

    วิธีทำ จากโจทย์เราได้ว่า

    \begin{array}{lcl}5&=&\sqrt{\frac{\displaystyle\sum_{i=1}^{N}(x_{i}-median)^{2}}{N}}\\25&=&\frac{\displaystyle\sum_{i=1}^{N}(x_{i}-45)^{2}}{N}\quad\cdots (1)\end{array}

    และจากโจทย์อีกอันคือ

    \begin{array}{lcl}S.D.&=&\sqrt{\frac{\displaystyle\sum_{i=1}^{N}(x_{i}-\overline{x})^{2}}{N}}\\S.D.&=&\sqrt{\frac{\displaystyle\sum_{i=1}^{N}(x_{i}-48)^{2}}{N}}\\S.D.^{2}&=&\frac{\displaystyle\sum_{i=1}^{N}(x_{i}-48)^{2}}{N}\quad\cdots (2)\end{array}

    จากสมการที่ \((1)\) และ \((2)\) และข้อมูลที่โจทย์ให้มาคือ \(\frac{\displaystyle\sum_{i=1}^{N}x_{i}}{N}=48\)

    เริ่มหาคำตอบกันเลยครับผม

    \begin{array}{lcl}S.D.^{2}&=&\frac{\displaystyle\sum_{i=1}^{N}(x_{i}-48)^{2}}{N}\\&=&\frac{\displaystyle\sum_{i=1}^{N}(x_{i}-45-3)^{2}}{N}\\&=&\frac{\displaystyle\sum_{i=1}^{N}\left[(x_{i}-45)^{2}-6(x_{i}-45)+9\right]}{N}\\&=&\frac{\displaystyle\sum_{i=1}^{N}(x_{i}-45)^{2}}{N}-\frac{6\displaystyle\sum_{i=1}^{N}(x_{i}-45)}{N}+\frac{\displaystyle\sum_{i=1}^{N}9}{N}\\&=&25-6\left[\frac{\displaystyle\sum_{i=1}^{N}x_{i}}{N}-\frac{\displaystyle\sum_{i=1}^{N}45}{N}\right]+\frac{9N}{N}\\&=&25-6[48-\frac{45N}{N}]+9\\&=&25-6[3]+9\\&=&25-9\\&=&16\end{array}

    เนื่องจาก

    \(S.D.^{2}=16\)

    นั่นคือ

    \(S.D.=4\)

    ก็คือถ้าใช้ค่าเฉลี่ยเลขคณิตมาคำนวณค่าส่วนเบี่ยงเบนมาตรฐานจะได้ ส่วนเบี่ยงเบนมาตรฐานเท่ากับ 4


    6.ถ้า \(\mu\) และ \(\sigma\) เป็นค่าเฉลี่ยเลขคณิตและส่วนเบี่ยงเบนมาตรฐานโดยประมาณเป็นจำนวนเต็มของข้อมูล \(12,13,15,17,23\) ตามลำดับ ถ้าแปลงข้อมูลใหม่ด้วยสูตร \(y_{i}=ax_{i}+b\) ค่าเฉลี่ยเลขคณิตและส่วนเบี่ยงเบนมาตรฐานของข้อมูลชุดใหม่เป็น 18 และ  \(3\sigma\) ตามลำดับ จงหาค่าของ \(\mu ,\sigma ,a,b\)

    วิธีทำ จากโจทย์จะเห็นได้ว่าข้อมูลชุดใหม่ถูกแปลงด้วยสูตร \(y_{i}=ax_{i}+b\) ทำให้ข้อมูลทั้งสองชุดนี้มีความสัมพันธ์เชิงเส้น ดังนั้นเราสามารถใช้สมบัติของค่าเฉลี่ยเลขคณิตได้เลย ถ้าให้ \(\mu_{new}\) เป็นค่าเฉลี่ยเลขคณิตของข้อมูลชุดใหม่เราสามารถหาค่า \(\mu_{new}\) ได้จาก

    \[\mu_{new}=a\mu+b\]

    ซึ่งเราจะได้ว่า

    \begin{array}{lcl}\mu_{new}&=&a\mu+b\\18&=&a(16)+b\quad\cdots (1)\end{array}

    *** จากข้อมูลที่กำหนดให้คือ 12,13,15,17,23 ได้ค่าเฉลี่ยเลคณิต(\(\mu\)) เท่ากับ 16 นะ

    และข้อมูลสองชุดนี้มีความสัมพันธ์เชิงเส้นตามสมบัติของส่วนเบี่ยงเบนมาตรฐานจะได้ว่า

    \[\sigma_{new}=|a|\sigma\]

    เมื่อ \(\sigma_{new}\) คือ ส่วนเบี่ยงเบนมาตรฐานของข้อมูลชุดใหม่

    \(\sigma\) คือ ส่วนเบี่ยงเบนมาตรฐานของข้อมูลชุดเดิม 

    ดังนั้นเราจึงได้ว่า

    \begin{array}{lcl}\sigma_{new}&=&|a|\sigma\\3\sigma&=&|a|\sigma\quad\cdots (2)\end{array}

    จากสมการที่ \((2)\) เราได้ว่า \(a=3\) และเรานำค่า \(a=3\) ไปแทนในสมการที่ \((1)\) ได้ค่า \(b=-30\)

    เนื่องจากเราได้ค่าของ \(a\) และ \(b\) แล้ว เราจึงได้ว่า

    \[y_{i}=ax_{i}+b\]

    มีค่าเท่ากับ

    \[y_{i}=3x_{i}-30\] 

    ต่อไปเราได้ว่า เราก็คำนวณหาค่าของ \(\sigma\) ทำเองนะคับจะได้ว่า

    \[\sigma=\sqrt{\frac{76}{5}}\]

     

  • ส่วนเบี่ยงเบนมาตรฐาน

    ส่วนเบี่ยงเบนมาตรฐาน เป็นค่าที่บ่งบอกถึงการกระจายของข้อมูล  ถ้าค่าเบี่ยงเบนมาตรฐานหาออกมาแล้วมี

    ค่ามากนั้่นหมายความว่า ข้อมูลชุดนั้นมีการกระจายกันมากถ้าเป็นคะแนนสอบของนักเรียนก็บ่งบอกว่านักเรียนได้คะแนนต่างกัน  แต่ถ้าส่วนเบี่ยงเบนมาตรฐานหาออกมาแล้วมีค่าน้อย นั้นหมายความว่าข้อมูลชุดนั้นเป็นข้อมูลที่เกาะกลุ่มกันอยู่ เป็นข้อมูลที่มีค่าใกล้เคียงกัน ถ้าเป็นเป็นคะแนนสอบของนักเรียนก็แสดงว่านักเรียนได้คะแนนไล่เลี่ยกันไม่ห่างกันมาก

  • ส่วนเบี่ยงเบนมาตรฐานของข้อมูลที่ไม่แจกแจงความถี่

    ส่วนเบี่ยงเบนมาตรฐานของข้อมูลที่ไม่แจกแจงความถี่

       ถ้า \(x_{1},x_{2},x_{3},\cdots ,x_{N}\) เป็นข้อมูลของประชากร  N หน่วย และมีค่าเฉลี่ยเลขคณิตเป็น \(\mu\) แล้ว ส่วนเบี่ยงเบนมาตรฐานของประชากร หรือ \(\sigma\) (อ่านว่า ซิกมา) สามารถคำนวณได้ดังนี้

    \begin{array}{lcl}\sigma &=&\sqrt{\frac{\displaystyle\sum_{i=1}^{N}(x_{i}-\mu )^{2}}{N}}\end{array}

    หรือ

    \begin{array}{lcl}\sigma &=&\sqrt{\frac{\displaystyle\sum_{i=1}^{N}x_{i}^{2}}{N}-\mu^{2}}\end{array}

    โดยที่

    \(\mu\)  แทนค่าเฉลี่ยเลขคณิตของประชากร

    \(N\) แทนจำนวนข้อมูลทั้งหมดของประชากร

    นอกการใช้สัญลักลักษณ์ \(\sigma\) แล้ว อาจใช้สัญลักษณ์ S.D. หรือ s 

    แต่ในกรณีที่ไม่สามารถศึกษาข้อมูลทั้งหมดของประชากร และข้อมูลที่ใช้เป็นข้อมูลตัวอย่างซึ่งเป็นตัวแทนของประชากรแล้ว ส่วนเบี่ยงเบนมาตรฐานของตัวอย่าง(sample standard deviation หรือ s)ซึ่งใช้เป็นตัวประมาณของ \(\sigma\) คำนวณได้ดังนี้

    พูดง่ายๆก็คือ ถ้าข้อมูลที่ให้มาเป็นกลุ่มตัวอย่างซึ่งเป็นแค่ส่วนหนึ่งของประชากรเวลาคำนวณส่วนเบี่ยงเบนมาตรฐานให้ใช้สูตรนี้ครับ

    \begin{array}{lcl} s&=&\sqrt{\frac{\displaystyle\sum_{i=1}^{n}(x_{i}-\bar{X})^{2}}{n-1}}\end{array}

    หรือ

    \begin{array}{lcl} s&=&\sqrt{\frac{\displaystyle\sum_{i=1}^{n}x_{i}^{2}-n\bar{X}^{2}}{n-1}}\end{array}

    โดยที่

    \(\bar{X}\)  แทนค่าเฉลี่ยเลขคณิตของตัวอย่าง

    \(n\)  แทนจำนวนของข้อมูลทั้งหมดของตัวอย่าง

     อนึ่งในทางปฏิบัติจริงๆ ข้อมูลที่เขาให้มานั้นมักจะเป็นตัวอย่าง  ไม่ใช่ประชากร ดังนั้นจึงนิยมใช้สูตรที่เป็น \(s\)  มากกว่า \(\sigma\)

    มาดูตัวอย่างการทำแบบฝึกหัดกันเลยครับ

    1. จงหาพิสัย  ส่วนเบี่ยงเบนมาตรฐาน  ส่วนเบี่ยงเบนเฉลี่ย  และส่วนเบี่ยงเบนควอร์ไทล์ของราคาเครื่องสำอางชนิดหนึ่ง ซึ่งจากการสำรวจร้านค้ามาเป็นตัวอย่าง 8 แห่ง ได้ราคาของเครื่องสำอางดังนี้  410  415  425  410  640  400  410  และ 410 บาท ตามลำดับ แล้วพิจารณาว่าการวัดการกระจายของข้อมูลวิธีใดเหมาะสมกับข้อมูลที่สุด

    วิธีทำ

    ราคาเครื่องสำอางชนิดหนึ่งที่นำมาเป็นตัวอย่างจากร้านค้า 8 แห่ง เรียงจากน้อยไปมากดังนี้

    400  410 410  410  410  415  425  640

    พิสัยเท่ากับ  640-400=240  บาท

    ค่าเฉลี่ยเลขคณิต \(\bar{X}=\frac{400+4(410)+415+425+640}{8}=440\)

    ต่อไปหาส่วนเบี่ยงเบนมาตรฐาน (s)

    \begin{array}{lcl} s&=&\sqrt{\frac{\displaystyle\sum_{i=1}^{n}(x_{i}-\bar{X})^{2}}{n-1}}\\&=&\sqrt{\frac{(-40)^{2}+4(-30)^{2}+(-25)^{2}+(-15)^{2}+(200)^{2}}{8-1}}\\&=&\sqrt{\frac{46050}{7}}\\&=&81.11\quad บาท \end{array}

    ต่อไปหาส่วนเบี่ยงเบนเฉลี่ย

    \begin{array}{lcl}M.D. &=&=\frac{\displaystyle\sum_{i=1}^{n}|x_{i}-\bar{X}|}{n}\\&=&\frac{40+4(30)+25+15+200}{8}\\&=&\frac{400}{8}\\&=&50\quad บาท \end{array}

    ต่อไปหาส่วนเบี่ยงเบนควอร์ไทล์

    หาตำแหน่งของ \(Q_{1}=\frac{1}{4}(8+1)=2.25\)

    จะได้ ควอร์ไทล์ที่ 1 หรือก็คือ \(Q_{1}=410\)  การหาค่าควอร์ไทล์ใครหาไม่เป็นไปอ่านตามลิงค์นะครับ

    หาตำแหน่งของ \(Q_{3}=\frac{3}{4}(8+1)=6.75\)

    จะได้ \(Q_{3}=415+(10\times 0.75)=422.5\)

    จะได้ส่วนเบี่ยงเบนควอร์ไทล์เท่ากับ \(\frac{422.5-410}{2}=6.25\)  บาท

    ดังนั้นการวัดการกระจายของข้อมูลชุดนี้ ควรใช้ส่วนเบี่ยงเบนควอร์ไทล์จึงเหมาะสมที่สุดเนื่องจากราคาเครื่องสำอาง 640 บาท เป็นค่าสูงผิดปกติเมื่อเปรียบเทียบกันค่าอื่น


    2. จงหาค่าเฉลี่ยเลขคณิตและเปรียบเทียบการกระจายของราคาสินค้าชนิดหนี่งที่ขายตามร้านต่างๆในสองท้องที่ซึ่งขายในราคาที่ต่างกันดังนี้

    ท้องที่ที่หนึ่ง (บาท) 50,  52,  45,  55,  54,  48,  53

    ท้องที่ที่สอง (บาท) 40,  50,  51,  52,  51,  51,  62,  53,  49

    วิธีทำ

    ค่าเฉลี่ยเลขคณิตของราคาสินค้าในท้องที่ที่หนึ่งคือ

    \(\bar{X}=\frac{50+52+45+55+54+48+53}{7}=51\quad บาท\)

    ค่าเฉลี่ยเลขคณิตของราคาสินค้าในท้องที่ที่สองคือ

    \(\bar{X}=\frac{40+50+51+52+51+51+62+53+49}{9}=51\quad บาท\)

    จะเห็นว่าค่าเฉลี่ยเลขคณิตของราคาสินค้าของสองท้องที่เท่ากัน  การเปรียบเทียบการกระจายของราคาสินค้าในสองท้องที่สามารถใช้  ส่วนเบี่ยงเบนเฉลี่ยหรือส่วนเบี่ยงเบนมาตรฐานได้

    (ในกรณีที่ค่าเฉลี่ยเลขคณิตไม่เท่ากันไม่สามารถทำการเปรียบเทียบการกระจายของข้อมูล 2 ชุดโดยการใช้การกระจายสัมบูรณ์ได้)

    การหาการกระจายราคาสินค้าโดยการใช้ส่วนเบี่ยงเบนเฉลี่ย

    ส่วนเบี่ยงเบนเฉลี่ยของท้องที่ที่หนึ่งเท่ากับ

    \(M.D.=\frac{1+1+6+4+3+3+2}{7}=\frac{20}{7}\approx 2.86\)

    ส่วนเบี่ยงเบนเฉลี่ยของท้องที่ที่สองเท่ากับ

    \(M.D.=\frac{11+0+1+0+0+11+2+2}{9}=\frac{28}{9}\approx 3.11\)

    ดังนั้น ราคาสินค้าในท้องที่ที่สองมีการกระจายมากกว่าราคาสินค้าในท้องที่ที่หนึ่ง

    การหาการกระจายราคาสินค้าโดยการใช้ส่วนเบี่ยงเบนมาตรฐานของข้อมูลที่ไม่แจกแจงความถี่

    ส่วนเบี่ยงเบนมาตรฐานของท้องที่ที่หนึ่งเท่ากับ

    \(s=\sqrt{\frac{1+1+36+16+9+9+4}{6}}\approx 3.56\)

    ส่วนเบี่ยงเบนมาตรฐานของท้องที่ที่สองเท่ากับ

    \(s=\sqrt{\frac{121+1+0+1+0+0+121+4+4}{8}}\approx 5.61\)

    ดังนั้นราคาสินค้าในท้องที่ที่สองมีการกระจายมากกว่าราคาสินค้าในท้องที่ที่หนึ่ง

    จากที่เราหาการกระจายของราคาสินค้าของสองท้องที่ ได้คำตอบเหมือนกันคือราคาสินค้าในท้องที่ที่สองมีการกระจายมากกว่าในท้องที่ที่หนึ่ง แต่ในทางปฏิบัติมักจะใช้ส่วนเบี่ยงเบนมาตรฐานครับ


    3. ค่าเฉลี่ยเลขคณิตและส่วนเบี่ยงเบนมาตรฐานของข้อมูลที่เป็นกลุ่มตัวอย่างของประชากรขนาด 20 รายการ ชุดหนึ่งเป็น 10 และ 2 ตามลำดับ ภายหลังพบว่ามีการบันทึกข้อมูลรายการหนึ่งผิดพลาดไป โดย 12 บันทึกเป็น 8 จงคำนวณหาค่าเฉลี่ยเลขคณิต และส่วนเบี่ยงเบนมาตรฐานที่ถูกต้อง

    วิธีทำ  การทำข้อนี้ไม่ยากครับ  จากโจทย์ตอนแรกโจทย์บอกว่า

    \(\bar{X}=10\)

    \(s=8  \)

    จากสูตรการหาค่าเฉลี่ยของตัวอย่าง

    \begin{array}{lcl}\bar{X}&=&\frac{\displaystyle\sum_{i=1}^{n}x_{i}}{n}\\10&=&\frac{\sum_{i=1}^{20}}{20}\\\displaystyle\sum_{i=1}^{20}&=&10\times 200\\\displaystyle\sum_{i=1}^{20}&=&200\end{array}

    ต่อโจทย์บอกว่ามีการบันทึกข้อมูลผิดพลาดไป โดย 12 แต่เขาบันทึกเป็น 8  แสดงว่าต้องบันทึกเพิ่มอีก 4 ใช่ไหมครับดังนั้น

    \(\sum_{x=1}^{20}=200+4\)  อันนี้คือผลรวมที่ถูกต้องครับ

    ดังนั้นค่าเฉลี่ยเลขคณิตที่ถูกต้องคือ

    \(\bar{X}=\frac{204}{20}=10.2\)

    ต่อไปหาส่วนเบี่ยงเบนมาตรฐานครับ

    ใช้สูตรนี้ในการหานะครับ เลือกใช้สูตรให้เหมาะสมนะครับ

    \(s=\sqrt{\frac{\sum_{i=1}^{n}x_{i}^{2}-n\bar{X}^{2}}{n-1}}\) 

    ลองแทนค่าตามที่โจทย์ให้มาลงไปในสูตรครับจะได้

    \(2=\sqrt{\frac{\sum_{i=1}^{20}x_{i}^{2}-20(10)^{2}}{20-1}}\)

    ทำการยกกำลังสองทั้งสองข้างครับจะได้

    \begin{array}{lcl}4&=&\frac{\displaystyle\sum_{i=1}^{20}x_{i}^{2}-20(10)^{2}}{20-1}\\\displaystyle\sum_{i=1}^{20}x_{i}^{2}&=&4\times 19+2000\\\displaystyle\sum_{i=1}^{20}x_{i}^{2}&=&2076\end{array} อันนี้ยังเป็นการคำนวณที่ผิดนะครับเพราะเขาบันทึกข้อมูลผิดครับที่ถูกต้องก็คือ จากเริ่มแรกที่เราคำนวณมา

    \(\bar{X}=200-8+12=204\)

    ดังนั้นผลรวม \(x_{i}^{2}\) ที่ถูกต้องคือ

    \(\sum_{i=1}^{20}=x_{i}^{2}=2076-(8)^{2}+(12)^{2}=2156\)

    ดังนั้นส่วนเบี่ยงเบนมาตรฐานที่ถูกต้องคือ

    \begin{array}{lcl}s&=&\sqrt{\frac{\displaystyle\sum_{i=1}^{20}x_{i}^{2}-n\bar{X}^{2}}{n-1}}\\&=&\sqrt{\frac{2156-20(10.2)^{2}}{20-1}}\\&=&\sqrt{\frac{75.2}{19}}\\&=&1.99\end{array}

    ส่วนเบี่ยงเบนมาตรฐานที่ถูกต้องคือ 1.99

    ค่าเฉลี่ยที่ถูกต้องคือ 10.2


    9.ให้ \(x_{1},x_{2},x_{3},\cdots ,x_{5}\) เป็นข้อมูลชุดหนึ่งที่มีค่าเฉลี่ยเลขคณิตเท่ากับ 6 ถ้า \(\displaystyle\sum_{i=1}^{5}(x_{i}-4)^{2}=30\) จงหาส่วนเบี่ยงเบนมาตรฐานของข้อมูลชุดนี้

    วิธีทำ เราก็หาคำตอบจากสิ่งที่โจทย์กำหนดให้นั่นแหละครับ โจทย์บอกว่าค่าเฉลี่ยเท่ากับกับ 6 นั่นก็คือ

    \(\bar{X}=\frac{\displaystyle\sum_{i=1}^{5}x_{i}}{5}=6\quad\cdots  (1)\)

    จากสมการที่\((1)\) จะได้ว่า

    \(\displaystyle\sum_{i=1}^{5}x_{i}=30\quad\cdots  (2)\)

    และโจทย์ยังให้อันนี้เรามาอีกก็คือ \(\displaystyle\sum_{i=1}^{5}(x_{i}-4)^{2}=30\) เราเอาอันนี้มากระจายจะได้

    \begin{array}{lcl}\displaystyle\sum_{i=1}^{5}(x_{i}-4)^{2}&=&30\\\displaystyle\sum_{i=1}^{5}(x_{i}^{2}-8x_{i}+16)&=&30\\\displaystyle\sum_{i=1}^{5}x_{i}^{2}-8\displaystyle\sum_{i=1}^{5}x_{i}+\displaystyle\sum_{i=1}^{5}16&=&30\\\displaystyle\sum_{i=1}^{5}x_{i}^{2}-8(30)+(16)(5)&=&30\\\displaystyle\sum_{i=1}^{5}x_{i}^{2}&=&190\end{array}

    สิ่งที่เราหามาข้างบนก็เพื่อนำมาแทนค่าในสูตรของส่วนเบี่ยงเบนมาตรฐานก็คือสูตรนี้

    \[S.D.=\sqrt{\frac{\displaystyle\sum_{i=1}^{5}x_{i}^{2}}{N}-(\bar{X})^{2}}\]

    ทำต่อเลยคับจะได้

    \begin{array}{lcl}S.D.&=&\sqrt{\frac{\displaystyle\sum_{i=1}^{5}x_{i}^{2}}{N}-(\bar{X})^{2}}\\&=&\sqrt{\frac{190}{5}-6^{2}}\\&=&\sqrt{2}\quad\underline{Ans}\end{array}


    10. ถ้า \(x_{1},x_{2},\cdots ,x_{10}\) เป็นข้อมูลชุดหนึ่งซึ่ง \(\displaystyle\sum_{i=1}^{10}(x_{i}-M)^{2}\) มีค่าน้อยที่สุดเท่ากับ \(M^{2}\) เมื่อ \(M=15\)  จงหาค่าของ \(\displaystyle\sum_{i=1}^{10}(2x_{i}+5)\) และส่วนเบี่ยงเบนมาตรฐานของข้อมูลชุดนี้

    วิธีทำ สิ่งที่เราต้องรู้ข้อนี้ก็คือสมบัติของค่าเฉลี่ยเลขคณิตก็คือ ถ้า \(\displaystyle\sum_{i=1}^{10}(x_{i}-M)^{2}\) มีค่าน้อยที่สุดแล้ว เราจะได้ว่า \(M\) คือค่าเฉลี่ยเลขคณิต นั่นก็คือ

    \[\bar{X}=\frac{\displaystyle\sum_{i=1}^{10}x_{i}}{10}=M=15\quad\cdot (1)\]

    จากสมการที่ \((1)\) เราจึงได้ว่า

    \[\displaystyle\sum_{i=1}^{10}x_{i}=10\times 15=150\quad\cdots (2)\]

    ต่อไปโจทย์บอกว่า \(\displaystyle\sum_{i=1}^{10}(x_{i}-M)^{2}\) มีค่าเท่ากับ \(M^{2}\) ดังนั้นจะได้สมการนี้ออกมาคือ

    \begin{array}{lcl}\displaystyle\sum_{i=1}^{10}(x_{i}-M)^{2}&=&M^{2}\\\displaystyle\sum_{i=1}^{10}(x_{i}-15)^{2}&=&15^{2}\\\displaystyle\sum_{i=1}^{10}(x_{i}^{2}-30x_{i}+225)&=&225\\\displaystyle\sum_{i=1}^{10}x_{i}^{2}-30\displaystyle\sum_{i=1}^{10}x_{i}+\displaystyle\sum_{i=1}^{10}225&=&225\\\displaystyle\sum_{i=1}^{10}x_{i}^{2}-30(150)+(225)(10)&=&225\\\displaystyle\sum_{i=1}^{10}x_{i}^{2}&=&2475\end{array}

    ตอนนี้เราได้ค่าต่างๆที่คำนวณมา ดังต่อไปนี้

    \(\displaystyle\sum_{i=1}^{10}x_{i}=150\)

    \(\displaystyle\sum_{i=1}^{10}x_{i}^{2}=2475\)

    \(\bar{X}=15\) 

    เรานำค่าที่เราได้มานี้มาคำนวณหาคำตอบกันเลยครับจะได้ดังนี้

    \begin{array}{lcl}\displaystyle\sum_{i=1}^{10}(2x_{i}+5)&=&2\displaystyle\sum_{i=1}^{10}x_{i}+\displaystyle\sum_{i=1}^{10}5\\&=&2(150)+(5)(10)\\&=&300+50\\&=&350\quad\underline{Ans}\end{array}

    ต่อไปหา ส่วนเบี่ยงเบนมาตรฐาน

    \begin{array}{lcl}S.D.&=&\sqrt{\frac{\displaystyle\sum_{i=1}^{10}x_{i}^{2}}{N}-(\bar{X})^{2}}\\&=&\sqrt{\frac{2475}{10}-15^{2}}\\&=&\sqrt{22.5}\quad\underline{Ans}\end{array}


    11. ค่าเฉลี่ยเลขคณิตและส่วนเบี่ยงเบนมาตรฐานของข้อมูล \(x_{1},x_{2},x_{3}\) เป็น 8 และ 3 ตามลำดับ ค่าเฉลี่ยเลขคณิตของข้อมูล \(x_{4},x_{5},x_{6}\) เป็น 10 และ \(\displaystyle\sum_{i=1}^{6}x_{i}^{2}=567\)  จงหาส่วนเบี่ยงเบนมาตรฐานของข้อมูล \(x_{4},x_{5},x_{6}\)

    วิธีทำ ข้อนี้เริ่มทำที่โจทย์บอกว่า ส่วนเบี่ยงเบนมาตรฐานของข้อมูล \(x_{1},x_{2},x_{3}\) มีค่าเท่ากับ 3  เราจะได้ดังนี้คือ

    \begin{array}{lcl}S.D.&=&\sqrt{\frac{\displaystyle\sum_{i=1}^{3}x_{i}^{2}}{N}-(\bar{X})^{2}}\\3&=&\sqrt{\frac{\displaystyle\sum_{i=1}^{3}x_{i}^{2}}{3}-(8)^{2}}\\9&=&\frac{\displaystyle\sum_{i=1}^{3}x_{i}^{2}}{3}-64\\\displaystyle\sum_{i=1}^{3}x_{i}^{2}&=&219\quad\cdots (1)\end{array}

    และโจทย์บอกอีกว่า \(\displaystyle\sum_{i=1}^{6}x_{i}^{2}=567\) จะได้ว่า

    \begin{array}{lcl}\displaystyle\sum_{i=4}^{6}x_{i}^{2}&=&\displaystyle\sum_{i=1}^{6}x_{i}^{2}-\displaystyle\sum_{i=1}^{3}x_{i}^{2}\\&=&567-219\\&=&384\quad\cdots (2)\end{array}

    จากสมการที่ \((1),(2)\) เราสามารถนำไปหาคำตอบได้แล้ว ก็คือ โจทย์ให้หาส่วนเบี่ยงเบนมาตรฐานของข้อมูล \(x_{4},x_{5},x_{6}\) จะได้ว่า

    \begin{array}{lcl}S.D.&=&\sqrt{\frac{\displaystyle\sum_{i=4}^{6}x_{i}^{2}}{N}-(\bar{X})^{2}}\\&=&\sqrt{\frac{384}{3}-10^{2}}\\&=&\sqrt{28}\quad\underline{Ans}\end{array}


    12.ในการสอบสัมภาษณ์นักเรียน 3 คน ปรากฎว่าค่าเฉลี่ยเลขคณิตของคะแนนเท่ากับ 53  มัธยฐานเท่ากับ 50 และพิสัยเท่ากับ 21 ส่วนเบี่ยงเบนเฉลี่ยในการสอบครั้งนี้เป็นเท่าใด

    วิธีทำ กำหนดให้ \(x_{1},x_{2},x_{3}\) เป็นข้อมูลที่เรียงจากน้อยไปหามาก ดังนั้นจึงได้ว่า \(x_{2}=50\)

    และโจทย์บอกว่าค่าเฉลี่ยเลขคณิตเท่ากับ 53 จึงได้ว่า

    \begin{array}{lcl}\frac{x_{1}+50+x_{3}}{3}&=&53\\x_{1}+x_{3}&=&159-50\\x_{1}+x_{3}&=&109\quad\cdots (1)\end{array}

    และโจทย์ยังบอกอีกว่าพิสัยเท่ากับ 21 จึงได้ว่า

    \(x_{3}-x_{1}=21\quad\cdots (2)\)

    ต่อไปเพื่อจะหาค่าของ \(x_{1}\) กับ \(x_{3}\) ต้องเอาสมการที่ \((1)+(2)\) จะได้ว่า

    \begin{array}{lcl}(x_{1}+x_{3})+(x_{3}-x_{1})&=&109+21\\x_{3}&=&65\end{array}

    และแทนค่า \(x_{3}=65\) ในสมการที่ \((2)\) จะได้ว่า \(x_{1}=44\)

    ต่อไปเราต้องหาค่าพวกนี้ก่อน \(|x_{i}-\bar{X}|\) จะได้ว่า

    \(|44-53|=9\)

    \(|50-53|=3\)

    \(|65-53|=12\)

    ดังนั้น \(\displaystyle\sum_{i=1}^{3}|x_{i}-\bar{X}|=9+3+12=24\)

    ต่อไปหาค่าส่วนเบี่ยงเบนเฉลี่ยเลยคับผม

    \begin{array}{lcl}M.D.&=&\frac{\displaystyle\sum_{i=1}^{3}|x_{i}-\bar{X}|}{N}\\&=&\frac{9+3+12}{3}\\&=&8\quad\underline{Ans}\end{array}


    13. ข้อมูลชุดหนึ่งมี N ตัว มี 1 อยู่ \(X\%\) นอกนั้นเป็น \(0\) ส่วนเบี่ยงเบนมาตรฐานของข้อมูลชุดนี้เท่ากับเท่าใด

    วิธีทำ  การทำข้อนี้เดี๋ยวผมจะยกตัวอย่างให้ดูแบบนี้นะคับ สมมติผมมีข้อมูลแบบนี้คือ

    \(1,1,1,1,0,0,0,0,0,0\)

    จากข้อมูลที่กำหนดให้จะเห็นว่ามีข้อมูล 1 อยู่ \(40\%\)  และได้ว่า

    \(\frac{\displaystyle\sum_{i=1}^{10}x_{i}^{2}}{N}=\frac{4}{10}=\frac{40}{100}\)

    \(\bar{X}=\frac{4}{10}=\frac{40}{100}\)

    ดังนั้นเราจะได้ส่วนเบี่ยงเบนมาตรฐานของข้อมูลนี้เท่ากับ

    \begin{array}{lcl}S.D.&=&\sqrt{\frac{\displaystyle\sum_{i=1}^{10}x_{i}^{2}}{N}-(\bar{X})^{2}}\\&=&\sqrt{\frac{40}{100}-(\frac{40}{100})^{2}}\end{array}

    พอเห็นตัวอย่างข้างบนนี้หลายคนน่าจะมองเห็นวิธีการตอบของข้อนี้แล้วนะคับ ว่าจะตอบอย่างไร

    ดังนั้นข้อนี้เขาบอกว่ามีข้อมูล 1 อยู่ \(X\%\) จึงทำให้ได้ว่าส่วนเบี่ยงเบนมาตรฐานของข้อมูลชุดนี้เท่ากับ

    \begin{array}{lcl}S.D.&=&\sqrt{\frac{\displaystyle\sum_{i=1}^{N}x_{i}^{2}}{N}-(\bar{X})^{2}}\\&=&\sqrt{\frac{X}{100}-(\frac{X}{100})^{2}}\end{array}

  • ส่วนเบี่ยงเบนเฉลี่ย

    ส่วนเบี่ยงเบนเฉลี่ย(mean deviation หรือ average deviation)  ส่วนเบี่ยงเบนเฉลี่ย คือ ค่าที่ใช้วัดการกระจายของข้อมูลที่ได้จากการเฉลี่ยค่าสัมบูรณ์ของความแตกต่างระหว่างค่าของข้อมูลแต่ละค่าจากค่ากลางของข้อมูลชุดนั้น ค่ากลางที่ใช้อาจเป็นค่าเฉลี่ยเลขคณิตหรือมัธยฐานก็ได้ แต่ส่วนมากนิยมใช้ค่าเฉลี่ยเลขคณิต

    การหาส่วนเบี่ยงเบนเฉลี่ยของข้อมูลที่ไม่ได้แจกแจงความถี่

       ถ้า \(x_{1},x_{2},x_{3},\cdots ,x_{n}\) เป็นข้อมูลตัวอย่าง n  จำนวน และมีค่าเฉลี่ยเลขคณิตเป็น \(\bar{X}\) แล้ว

    \begin{array}{lcl} ส่วนเบี่ยงเบนเฉลี่ย (M.D.) &=&\frac{|x_{1}-\bar{X}|+|x_{2}-\bar{X}|+|x_{3}+\bar{X}+\cdots +|x_{n}+\bar{X}|}{n}\\&=&\frac{\displaystyle\sum_{i=1}^{n}|x_{i}-\bar{X}|}{n}\end{array}

    การหาส่วนเบี่ยงเบนเฉลี่ยของข้อมูลที่แจกแจงความถี่

      ถ้า \(x_{1},x_{2},x_{3},\cdots ,x_{k}\) เป็นจุดกึ่งกลางของอันตรภาคชั้นต่างๆ  k ชั้น ซึ่งมีความถี่  \(f_{1},f_{2},f_{3},\cdots ,f_{k}\) ตามลำดับ   n เป็นจำนวนข้อมูลตัวอย่างทั้งหมด และถ้าข้อมูลชุดนี้มีค่าเฉลี่ยเลขคณิตเป็น  \(\bar{X}\)  แล้ว สามารถคำนวณส่วนเบี่ยงเบนเฉลี่ย (โดยประมาณ) ได้จากสูตร

    \begin{array}{lcl} ส่วนเบี่ยงเบนเฉลี่ย (M.D.)&=&\frac{\displaystyle\sum_{i=1}^{k}f_{i}|x_{i}-\bar{X}|}{\displaystyle\sum_{i=1}^{k}f_{i}}\\&=&\frac{\displaystyle\sum_{i=1}^{k}f_{i}|x_{i}-\bar{X}|}{n}\end{array}

    เมื่อ k  แทนจำนวนอันตรภาคชั้น

          \(f_{i}\)  แทนความถี่ของอันตรภาคชั้นที่ \(i\)

          \(x_{i}\)   แทนจุดกึ่งกลางของอันตรภาคชั้นที่ \(i\)

    ต่อไปเราลองมาทำแบบฝึกหัดเกี่ยวกับ การหาส่วนเบี่ยงเบนเฉลี่ยของข้อมูลที่ไม่แจกแจงความถี่และการหาส่วนเบี่ยงเบนเฉลี่ยของที่แจกแจงความถี่

    สำหรับการหาส่วนเบี่ยงเบนเฉลี่ยของข้อมูลที่ไม่แจกแจงความถี่ให้อ่านตามลิงค์นี้ครับผมได้เขียนแสดงตัวอย่างให้ดูเยอะแล้วครับจะเป็นตัวอย่างที่รวมอยู่ในหัวข้อส่วนเบี่ยงเบนควอร์ไทล์ค่อยๆอ่านครับส่วนเบี่ยงเบนควอร์ไทล์

    ต่อไปก็ไปดูแบบฝึกหัดเกี่ยวกับส่วนเบี่ยงเบนเฉลี่ยของข้อมูลที่แจกแจงความถี่

    1. จงหาส่วนเบี่ยงเบนควอร์ไทล์และส่วนเบี่ยงเบนเฉลี่ยของรายได้ชองคนงานหญิง 400 คน จากตารางแจกแจงความถี่ต่อไปนี้ แล้วเปรียบเทียบค่าที่ได้กับพิสัยของข้อมูลชุดนี้

    รายได้(บาท) จำนวนคนงาน (คน)
    1500-1599 20
    1600-1699 70
    1700-1799 120
    1800-1899 100
    1900-1999 60
    2000-2099 20
    2100-2199 10

    วิธีทำ ข้อนี้โจทย์ให้หาส่วนเบี่ยงเบนควอร์ไทล์ และ ส่วนเบี่ยงเบนเฉลี่ย และข้อมูลที่เขาให้มาเป็นข้อมูลแบบแจกแจงความถี่  ดังนั้นต้องใช้สูตรนี้ครับ

    \begin{array}{lcl} ส่วนเบี่ยงเบนเฉลี่ย (M.D.)&=&\frac{\displaystyle\sum_{i=1}^{k}f_{i}|x_{i}-\bar{X}|}{\displaystyle\sum_{i=1}^{k}f_{i}}\\&=&\frac{\displaystyle\sum_{i=1}^{k}f_{i}|x_{i}-\bar{X}|}{n}\end{array}

    เมื่อ k  แทนจำนวนอันตรภาคชั้น

          \(f_{i}\)  แทนความถี่ของอันตรภาคชั้นที่ \(i\)

          \(x_{i}\)   แทนจุดกึ่งกลางของอันตรภาคชั้นที่ \(i\)

    แสดงว่าเราต้องไปหาจุดกี่งกลางชั้น หาค่าเฉลี่ย และหาความถี่สะสม ความถี่สะสมนี้เอาไว้ไปใช้คำนวณในการหาควอร์ไทล์ การหาค่าควอร์ไทล์ของข้อมูลที่แจกแจงความถี่ให้ไปอ่านตามลิงค์นี้ครับควอร์ไทล์ของข้อมูลที่แจกแจงความถี่

    รายได้ จุดกึ่งกลางชั้น \((x_{i})\) จำนวนคนงาน\((f_{i})\) ความถี่สะสม \(f_{i}x_{i}\) \(|x_{i}-\bar{X}|\) \(f_{i}|x_{i}-\bar{X}|\)
    1500-1599 1549.5 20 20 30990 252.5 5050
    1600-1699 1649.5 70 90 115465 152.5 10675
    1700-1799 1749.5 120 210 209940 52.5 6300
    1800-1899 1849.5 100 310 184950 47.5 4750
    1900-1999 1949.5 60 370 116970 147.5 8850
    2000-2099 2049.5 20 390 40990 247.5 4950
    2100-2199 2149.5 10 400 21495 347.5 3475
    total 400 total 720800 total 44050

    จากตาราง จะได้ว่า

    \(\bar{X}=\frac{720800}{400}=1802\)

    ตำแหน่งของ \(Q_{1}=\frac{1}{4}\times 400=100\)

    ดังนั้น \(Q_{1}\) อยู่ในอันตรภาคชั้นที่ 3  การหาควอร์ไทล์ของข้อมูลที่แจกแจงความถี่อ่านได้ตามลิงค์นี้นะครับควอร์ไทล์ของข้อมูลที่แจกแจงความถี่ จะได้

    \(Q_{1}=1699.5+\left(\frac{100-90}{120}\right)\times 100=1707.83\)

    ต่อไป

    ตำแหน่งของ \(Q_{3}=\frac{3}{4}\times 400=300\)

    ดังนั้น \(Q_{3}\) อยู่ในอันตรภาคชั้นที่ 4 จะได้

    \(Q_{3}=1799.5+\left(\frac{300-210}{100}\right)\times 100=1889.5\)

    ดังนั้น ส่วนเบี่ยงเบนควอร์ไทลเท่ากับ

    \(\frac{1889.5-1707.83}{2}=\frac{181.67}{2}=90.835\) บาท

    ต่อไปหาส่วนเบี่ยงเบนเฉลี่ยก็นำข้อมูลในตารางมาแทนค่าในสูตรเลยครับเพราะในตารางเราเตรียมข้อมูลไว้เรียบร้อยแล้วครับ

    จากสูตรการหาส่วนเบี่ยงเฉลี่ย

    \begin{array}{lcl} ส่วนเบี่ยงเบนเฉลี่ย (M.D.)&=&\frac{\displaystyle\sum_{i=1}^{k}f_{i}|x_{i}-\bar{X}|}{\displaystyle\sum_{i=1}^{k}f_{i}}\\&=&\frac{\displaystyle\sum_{i=1}^{k}f_{i}|x_{i}-\bar{X}|}{n}\\&=&\frac{44050}{400}\\&=&110.125\quad บาท\end{array}

    พิสัยเทากับ  2199.5-1499.5=700 บาท

    เปรียบเทีบบค่าของส่วนเบี่ยงเบนควอร์ไทล์และส่วนเบี่ยงเบนเฉลี่ยกับค่าพิสัยจะพบว่าพิสัยมีค่าสูงกว่าส่วนส่วนเบี่ยงเบนควอร์ไทล์และส่วนเบี่ยงเบนเฉลี่ยมากครับ


    2. โรงเรียนแห่งหนึ่งมีครู 8 คน ซึ่งมีเงินเดือนดังนี้

    8430 , 9550 , 17920 , 19400 , 20290 , 20710 , 30210 , 32740 

    จงหาส่วนเบี่ยงเบนเฉลี่ยของข้อมูลชุดนี้

    วิธีทำ ข้อมูลชุดนี้เป็นข้อมูลที่ไม่มีการแจกแจงความถี่ จะได้

    \begin{array}{lcl}\bar{X}&=&\frac{8430 + 9550 + 17920 + 19400 + 20290+ 20710 + 30210+ 32740 }{8}\\&=&19906.25\end{array}

    ต่อไปหาค่าของ \(|x_{i}-\bar{X}|\) จะได้

    \(|8430-19906.25|=11476.25\)

    \(|9550-19906.25|=10356.25\)

    \(|17920-19906.25|=1986.25\)

    \(|19400-19906.25|=506.25\)

    \(|20290 -19906.25|=383.75\)

    \(|20710-19906.25|=803.75\)

    \(|30210-19906.25|=10303.75\)

    \(|32740-19906.25|=12833.75\)

    เพราะฉะนั้นจะได้

    \begin{array}{lcl}\frac{\displaystyle\sum_{i=1}^{n}|x_{i}-\bar{X}|}{n}&=&\frac{11476.25+10356.25+1986.25+506.25+383.75+803.75+10303.75+12833.75}{8}\\&=&6081.25\end{array}

    นั่นคือ ส่วนเบนเบนเฉลี่ยของเงินเดือนครูโรงเรียนแห่งนี้เท่ากับ 6081.25 บาท


    3.ในการสอบสัมภาษณ์นักเรียน 3 คน ปรากฎว่าค่าเฉลี่ยเลขคณิตของคะแนนเท่ากับ 53  มัธยฐานเท่ากับ 50 และพิสัยเท่ากับ 21 ส่วนเบี่ยงเบนเฉลี่ยในการสอบครั้งนี้เป็นเท่าใด

    วิธีทำ กำหนดให้ \(x_{1},x_{2},x_{3}\) เป็นข้อมูลที่เรียงจากน้อยไปหามาก ดังนั้นจึงได้ว่า \(x_{2}=50\)

    และโจทย์บอกว่าค่าเฉลี่ยเลขคณิตเท่ากับ 53 จึงได้ว่า

    \begin{array}{lcl}\frac{x_{1}+50+x_{3}}{3}&=&53\\x_{1}+x_{3}&=&159-50\\x_{1}+x_{3}&=&109\quad\cdots (1)\end{array}

    และโจทย์ยังบอกอีกว่าพิสัยเท่ากับ 21 จึงได้ว่า

    \(x_{3}-x_{1}=21\quad\cdots (2)\)

    ต่อไปเพื่อจะหาค่าของ \(x_{1}\) กับ \(x_{3}\) ต้องเอาสมการที่ \((1)+(2)\) จะได้ว่า

    \begin{array}{lcl}(x_{1}+x_{3})+(x_{3}-x_{1})&=&109+21\\x_{3}&=&65\end{array}

    และแทนค่า \(x_{3}=65\) ในสมการที่ \((2)\) จะได้ว่า \(x_{1}=44\)

    ต่อไปเราต้องหาค่าพวกนี้ก่อน \(|x_{i}-\bar{X}|\) จะได้ว่า

    \(|44-53|=9\)

    \(|50-53|=3\)

    \(|65-53|=12\)

    ดังนั้น \(\displaystyle\sum_{i=1}^{3}|x_{i}-\bar{X}|=9+3+12=24\)

    ต่อไปหาค่าส่วนเบี่ยงเบนเฉลี่ยเลยคับผม

    \begin{array}{lcl}M.D.&=&\frac{\displaystyle\sum_{i=1}^{3}|x_{i}-\bar{X}|}{N}\\&=&\frac{9+3+12}{3}\\&=&8\quad\underline{Ans}\end{array}