Page 31 - 2_2023 Journal
P. 31

ก�รวิเคร�ะห์ข้อสอบปรนัย  โดยทั่วไป

        ส�ม�รถแยกออกได้เป็นสองส่วนหลักๆ

        ได้แก่  ก�รวิเคร�ะห์คุณสมบัติของข้อสอบ
        ทั้งชุด (test statistics) และก�รวิเคร�ะห์

        คุณสมบัติข้อสอบร�ยข้อ (item statistics)






                   ก�รวิเคร�ะห์คุณสมบัติของข้อสอบทั้งชุด (Test statistics)




             สิ่งที่ผู้จัดสอบต้องตรวจสอบขั้นพื้นฐานสำาหรับ
        การสอบทุกครั้ง คือ คว�มเที่ยง (reliability)
                                                     เมื่อ  n    คือ จำานวนข้อสอบ
        ของคะแนนสอบ ซึ่งเป็นดัชนีที่บอกว่า คะแนน         Var คือ Variance ของคะแนนสอบทั้งชุด
        ที่ได้มานั้นมีความคลาดเคลื่อนมากน้อยเพียงใด      p   คือ สัดส่วนของผู้สอบที่ตอบข้อสอบข้อนั้นถูก
                 ้
        หากวัดผลซำาในผู้เข้าสอบที่มีความสามารถเท่าเดิม   q   คือ สัดส่วนของผู้สอบที่ตอบข้อสอบข้อนั้นผิด
        คะแนนที่ได้จะคงเดิมหรือไม่ การวัดความเที่ยง      โดยค่า KR-20 มีค่าระหว่าง 0 – 1 โดยค่าสูง

        ของคะแนนสอบปรนัยที่นิยมทำากันที่สุดคือ       แสดงถึงคะแนนสอบมีความเที่ยงสูง แสดงว่าข้อสอบ
        การหา internal consistency reliability โดย   ทุกข้อในชุดข้อสอบนั้นวัดผลไปในทางเดียวกัน

        มีหลักการพื้นฐานคือ ในการสอบข้อสอบชุดหนึ่งๆ   ประเด็นที่สำาคัญคือ ค่าความเที่ยงสูงเพียงใดจึงจะพอ
        เป้าหมายคือ การวัดความสามารถของผู้เข้าสอบ    ซึ่งผู้เชี่ยวชาญในการวัดผลจะให้พิจารณาว่า

        หนึ่งอย่าง (unidimensional construct) แม้ว่า  การสอบนั้นๆ มีความสำาคัญต่อผู้เข้าสอบมากน้อย
        รายละเอียดของสิ่งที่ทำาการวัดผลนั้นจะมีหลาย  เพียงใด หากเป็นการสอบที่มีความสำาคัญมาก

        องค์ประกอบย่อย แต่ทุกข้อในข้อสอบชุดเดียวกัน  (high-stakes examination) เช่น การสอบขอรับ
        นั้นมุ่งไปหาวัตถุประสงค์ใหญ่อันเดียวกัน ดังนั้น   ใบประกอบวิชาชีพเวชกรรม หรือประกาศนียบัตร

        คะแนนจากข้อสอบแต่ละข้อในชุดเดียวกันควรมี     แพทย์ผู้เชี่ยวชาญเฉพาะสาขา มักต้องการความเที่ยง
                                                        ่
        ความสัมพันธ์เชิงบวกกัน (positive correlation)   ไม่ตำากว่า 0.9 หากเป็นการสอบที่มีความสำาคัญ
        ซึ่งสูตรที่ใช้ในการหา internal consistency   ปานกลาง (medium-stakes examination) เช่น
        reliability สำาหรับข้อสอบปรนัย ที่ใช้กันอย่าง  การสอบ summative test ปลายภาคเพื่อตัดสินเกรด

        กว้างขวางคือ Kuder-Richardson Formula 20     และเลื่อนชั้น มักต้องการความเที่ยง 0.8 – 0.89
        (KR-20)                                      ส่วนการสอบที่มีความสำาคัญน้อย (low-stakes

                                                     examination) เช่น การสอบ formative test มัก
                                                     ต้องการความเที่ยง 0.7 – 0.79


                                                 - 28 -
   26   27   28   29   30   31   32   33   34   35   36