Page 31 - 2_2023 Journal
P. 31
ก�รวิเคร�ะห์ข้อสอบปรนัย โดยทั่วไป
ส�ม�รถแยกออกได้เป็นสองส่วนหลักๆ
ได้แก่ ก�รวิเคร�ะห์คุณสมบัติของข้อสอบ
ทั้งชุด (test statistics) และก�รวิเคร�ะห์
คุณสมบัติข้อสอบร�ยข้อ (item statistics)
ก�รวิเคร�ะห์คุณสมบัติของข้อสอบทั้งชุด (Test statistics)
สิ่งที่ผู้จัดสอบต้องตรวจสอบขั้นพื้นฐานสำาหรับ
การสอบทุกครั้ง คือ คว�มเที่ยง (reliability)
เมื่อ n คือ จำานวนข้อสอบ
ของคะแนนสอบ ซึ่งเป็นดัชนีที่บอกว่า คะแนน Var คือ Variance ของคะแนนสอบทั้งชุด
ที่ได้มานั้นมีความคลาดเคลื่อนมากน้อยเพียงใด p คือ สัดส่วนของผู้สอบที่ตอบข้อสอบข้อนั้นถูก
้
หากวัดผลซำาในผู้เข้าสอบที่มีความสามารถเท่าเดิม q คือ สัดส่วนของผู้สอบที่ตอบข้อสอบข้อนั้นผิด
คะแนนที่ได้จะคงเดิมหรือไม่ การวัดความเที่ยง โดยค่า KR-20 มีค่าระหว่าง 0 – 1 โดยค่าสูง
ของคะแนนสอบปรนัยที่นิยมทำากันที่สุดคือ แสดงถึงคะแนนสอบมีความเที่ยงสูง แสดงว่าข้อสอบ
การหา internal consistency reliability โดย ทุกข้อในชุดข้อสอบนั้นวัดผลไปในทางเดียวกัน
มีหลักการพื้นฐานคือ ในการสอบข้อสอบชุดหนึ่งๆ ประเด็นที่สำาคัญคือ ค่าความเที่ยงสูงเพียงใดจึงจะพอ
เป้าหมายคือ การวัดความสามารถของผู้เข้าสอบ ซึ่งผู้เชี่ยวชาญในการวัดผลจะให้พิจารณาว่า
หนึ่งอย่าง (unidimensional construct) แม้ว่า การสอบนั้นๆ มีความสำาคัญต่อผู้เข้าสอบมากน้อย
รายละเอียดของสิ่งที่ทำาการวัดผลนั้นจะมีหลาย เพียงใด หากเป็นการสอบที่มีความสำาคัญมาก
องค์ประกอบย่อย แต่ทุกข้อในข้อสอบชุดเดียวกัน (high-stakes examination) เช่น การสอบขอรับ
นั้นมุ่งไปหาวัตถุประสงค์ใหญ่อันเดียวกัน ดังนั้น ใบประกอบวิชาชีพเวชกรรม หรือประกาศนียบัตร
คะแนนจากข้อสอบแต่ละข้อในชุดเดียวกันควรมี แพทย์ผู้เชี่ยวชาญเฉพาะสาขา มักต้องการความเที่ยง
่
ความสัมพันธ์เชิงบวกกัน (positive correlation) ไม่ตำากว่า 0.9 หากเป็นการสอบที่มีความสำาคัญ
ซึ่งสูตรที่ใช้ในการหา internal consistency ปานกลาง (medium-stakes examination) เช่น
reliability สำาหรับข้อสอบปรนัย ที่ใช้กันอย่าง การสอบ summative test ปลายภาคเพื่อตัดสินเกรด
กว้างขวางคือ Kuder-Richardson Formula 20 และเลื่อนชั้น มักต้องการความเที่ยง 0.8 – 0.89
(KR-20) ส่วนการสอบที่มีความสำาคัญน้อย (low-stakes
examination) เช่น การสอบ formative test มัก
ต้องการความเที่ยง 0.7 – 0.79
- 28 -