การวัดสมรรถนะการอ่านสำหรับนักเรียนไทย ม.3

ผังการสร้างข้อสอบ (Test Blueprint)

ผังการสร้างข้อสอบ (Test Blueprint) คือแผนผังหรือโครงร่างที่กำหนดโครงสร้างและรายละเอียดของข้อสอบ โดยระบุว่าเนื้อหาหรือทักษะใดบ้างที่จะนำมาทำเป็นข้อสอบ จำนวนข้อในแต่ละส่วน ความยากง่ายของข้อ และวิธีการวัดผลที่ใช้ เช่น ข้อสอบแบบปรนัย หรืออัตนัย ซึ่งผังนี้ช่วยให้การสร้างข้อสอบมีโครงสร้างที่ชัดเจนและเป็นระบบ   

นอกจากนี้ การสร้างผังการสร้างข้อสอบยังต้องคำนึงถึงองค์ประกอบหลายประการ ได้แก่ ผังข้อสอบต้องมีเนื้อหาครอบคลุมวัตถุประสงค์การเรียนรู้หรือผลลัพธ์ที่คาดหวัง กระจายจำนวนข้อสอบให้สมดุลกับเนื้อหาหรือทักษะที่ต้องการวัด ทำให้การวัดผลมีความเที่ยงตรงและเป็นธรรม กำหนดระดับความยากง่ายของข้อสอบในแต่ละส่วนตามความเหมาะสม เพื่อให้ข้อสอบมีความท้าทายแต่ไม่ยากหรือง่ายเกินไป การสร้างข้อสอบโดยอิงจากผังการสร้างข้อสอบจึงเป็นขั้นตอนที่สำคัญในการพัฒนาข้อสอบที่มีคุณภาพและสะท้อนความรู้และทักษะของผู้สอบได้อย่างแท้จริง

จากการทบทวนลักษณะข้อสอบที่กล่าวมาทั้งหมด ด้วยเหตุนี้ คณะผู้วิจัยจึงเห็นว่า มีความจำเป็นที่จะต้องสร้างและพัฒนาแบบทดสอบวัดสมรรถภาพด้านการอ่านมาตรฐานที่สามารถวัดความสามารถของผู้เรียนได้ครอบคลุมตรงตามวัตถุประสงค์ที่ต้องการวัดจริง ทั้งผู้เรียนและผู้สอนมีความเข้าใจในเรื่องตัวชี้วัดหรือทักษะการอ่านแบบต่าง ๆ ที่ตรงกันกับที่พบในแบบทดสอบ รวมทั้งแบบทดสอบมีเนื้อหาที่หลากหลาย มีจำนวนข้อที่เพียงพอต่อการวัดระดับ มีระดับความยากง่ายและเนื้อหาที่ตรงตามวัตถุประสงค์ที่ต้องการวัดครบถ้วน และเหมาะสมบริบทการอ่านของสังคมไทย โดยคณะผู้วิจัยได้กำหนดร่างผังการสร้างข้อสอบ (Test Blueprint) แบบทดสอบสมรรถภาพการอ่านระดับกลางไว้เพื่อใช้เป็นแนวทางในการสร้างแบบทดสอบชุดทดลองต่อไป รายละเอียดดังนี้

รูปแบบข้อสอบ : ตอบคำถามจากบทอ่าน 5 บท แบบปรนัย จำนวน 40-50 ข้อ (100 คะแนน)

เวลาในการทดสอบ : 2 ชั่วโมง

สมรรถภาพด้านการอ่านที่วัด :    

1. การอ่านจับรายละเอียด             น้ำหนัก 10 คะแนน  

2. การอ่านจับใจความ                    น้ำหนัก 40 คะแนน  

3. การอ่านตีความ                         น้ำหนัก 30 คะแนน  

4. การอ่านอย่างมีวิจารณญาณ      น้ำหนัก 20 คะแนน  

         ประเภทบทอ่าน    จำนวนเรื่องความสามารถด้านการอ่านที่วัดน้ำหนักคะแนน
บทอ่านให้ข้อมูล ความยาวไม่เกิน 1 หน้า  2  การอ่านจับรายละเอียด4
การอ่านจับใจความ10
การอ่านตีความ4
การอ่านอย่างมีวิจารณญาณ10
บทอ่านแสดงทัศนะ ความยาวไม่เกิน 1½ หน้า1การอ่านจับรายละเอียด3
การอ่านจับใจความ15
การอ่านตีความ5
การอ่านอย่างมีวิจารณญาณ5
บทอ่านแสดงทัศนะ ความยาวไม่เกิน 2½ หน้า  1การอ่านจับรายละเอียด3
การอ่านจับใจความ15
การอ่านตีความ6
การอ่านอย่างมีวิจารณญาณ5
บทอ่านเล่าเรื่อง ความยาวไม่เกิน 1½  หน้า    1การอ่านตีความ15
  รวม100

จากร่างผังการสร้างแบบทดสอบสมรรถภาพการอ่านระดับกลาง คณะผู้วิจัยกำหนดให้สมรรถภาพด้านการอ่านที่วัดมีสัดส่วนแตกต่างกัน โดยให้การอ่านจับใจความมีน้ำหนักคะแนนมากที่สุด (ร้อยละ 40) รองลงมาคือการอ่านตีความ (ร้อยละ 30) การอ่านอย่างมีวิจารณญาณ (ร้อยละ 20) และการอ่านจับรายละเอียด น้อยที่สุด (ร้อยละ 10) เพื่อให้สอดคล้องกับร่างคำอธิบายระดับสมรรถภาพด้านการอ่านระดับกลางที่เน้นไปที่การอ่านเพื่อจับใจความและตีความเป็นส่วนใหญ่ ในส่วนของบทอ่านที่จะใช้ทำเป็นแบบทดสอบ คณะผู้วิจัยเน้นให้มีความหลากหลายและมีความยาวประมาณ 1-2 หน้า เพื่อให้สามารถวัดความสามารถด้านการอ่านในบทอ่านขนาดยาวที่มีโครงสร้างภาษาที่หลากหลายและซับซ้อนได้ ตรงตามที่ระบุไว้ในร่างคำอธิบายระดับสมรรถภาพด้านการอ่านระดับกลางเช่นกัน ทั้งนี้ คณะผู้วิจัยยังไม่ได้กำหนดจำนวนข้อที่แน่ชัด ซึ่งอาจปรับเปลี่ยนรูปแบบและจำนวนได้ ขึ้นอยู่กับว่าจำนวนข้อที่ออกนั้นครอบคลุมเนื้อหาเพียงพอที่จะวัดความสามารถแล้วหรือไม่ในขณะที่ดำเนินการสร้างแบบทดสอบ รวมทั้งสามารถคำนวณคะแนนออกมาได้ตามน้ำหนักคะแนนที่กำหนดไว้หรือไม่เช่นกัน สำหรับประเภทแบบทดสอบ คณะผู้วิจัยเลือกเป็นแบบปรนัยเพื่อลดความเป็นอัตวิสัยในการตรวจให้คะแนน

การประเมินแบบทดสอบสมรรถนะการอ่านระดับกลาง

คณะผู้วิจัยได้นำแบบทดสอบความสามารถการอ่านภาษาไทยระดับกลางที่สร้างไว้ตามผังการสร้างแบบทดสอบไปดำเนินการทดลองกับกลุ่มตัวอย่างเพื่อวิเคราะห์ว่าแบบทดสอบที่สร้างไว้นั้นมีความเหมาะสมกับระดับความสามารถของกลุ่มตัวอย่างและมีความตรงเชิงเนื้อหากับตัวชี้วัดที่คณะผู้วิจัยได้กำหนดไว้หรือไม่ ซึ่งขั้นตอนการดำเนินงานและผลการทดลองมีรายละเอียดดังนี้

1) ข้อมูลแบบทดสอบและผู้สอบ

ข้อมูลแบบทดสอบ เครื่องมือที่ใช้ในการวิจัยนี้เป็นแบบทดสอบความสามารถการอ่านภาษาไทยระดับกลาง เป็นแบบทดสอบหลายตัวเลือก (multiple-choice) จำนวน 43 ข้อ ประกอบด้วย 2 ตัวเลือก (ข้อ 1-24) และ 4 ตัวเลือก (ข้อ 25-43) โดยแบ่งเป็นบทอ่าน 5 เรื่อง วัดทักษะการอ่าน 4 ด้าน ได้แก่ การอ่านจับรายละเอียด (ร้อยละ 9.30) การอ่านจับใจความสำคัญ (ร้อยละ 32.56) การอ่านตีความ (ร้อยละ 25.58) และการอ่านอย่างมีวิจารณญาณ (ร้อยละ 32.56)

ข้อมูลผู้สอบ

  • ประชากร ที่ใช้ในการวิจัยครั้งนี้ เป็นนักเรียนมัธยมศึกษาชั้นปีที่ 3 ประจำปีการศึกษา 2568 ทุกสังกัดในจังหวัดกรุงเทพมหานครและปริมณฑล ซึ่งเป็นกลุ่มตัวอย่างที่คณะผู้วิจัยเห็นว่าน่าจะมีความสามารถด้านการอ่านภาษาไทยตรงกับความสามารถด้านการอ่านระดับกลางที่กำลังทำวิจัยอยู่        
  • กลุ่มตัวอย่าง ที่ใช้ในการวิจัยครั้งนี้ เป็นนักเรียนมัธยมศึกษาชั้นปีที่ 3 ประจำปีการศึกษา 2568 ทุกสังกัดในจังหวัดกรุงเทพมหานครและปริมณฑล โดยผู้วิจัยกำหนดขนาดกลุ่มตัวอย่างตามผลการวิจัยที่เสนอโดย ปราโมทย์ โสภา และคณะ (2566) ที่ให้ข้อเสนอแนะว่า แบบทดสอบที่มีความยาว 40 ข้อ ควรใช้ขนาดกลุ่มตัวอย่างขั้นต่ำ 700 คน ซึ่งการวิจัยครั้งนี้ ผู้วิจัยสร้างแบบทดสอบที่มีความยาว 43 ข้อ โดยมีจำนวนใกล้เคียงกับข้อเสนอแนะดังกล่าว ดังนั้น จึงกำหนดขนาดกลุ่มตัวอย่างขั้นต่ำจำนวน 700 คน และใช้วิธีการสุ่มกลุ่มตัวอย่างแบบแบ่งชั้น (Stratified Random Sampling)

2) การวิเคราะห์คุณภาพข้อสอบตามทฤษฎีการตอบสนองข้อสอบ (Item Response Theory: IRT)

การวิเคราะห์ข้อสอบในส่วนนี้ ผู้วิจัยเลือกใช้โมเดลแข่งขัน 6 โมเดล ได้แก่

1) โมเดล 1PNO
2) โมเดล 2PNO
3) โมเดล 3PNO
4) โมเดล 1PNO testlet
5) โมเดล 2PNO testlet
6) โมเดล 3PNO testlet

เพื่อคัดเลือกว่าโมเดลใดมีความสอดคล้องกับแบบทดสอบมากที่สุด โดยวิเคราะห์ด้วยโปรแกรม R แพ็กเกจ sirt (Robitzsch, 2024) อาศัยวิธีการประมาณค่าแบบเบส์ (Bayesian estimation) ด้วยขั้นตอนวิธี Markov Chain Monte Carlo (MCMC) การนำเสนอข้อมูลแบ่งเป็น 4 ส่วน ได้แก่

2.1) การคัดเลือกโมเดล
2.2) พารามิเตอร์ข้อสอบ (item parameter)
2.3) สารสนเทศของแบบสอบ (test information)
2.4) ความสามารถของผู้สอบ (examinee ability)

จากผลการวิเคราะห์คุณภาพข้อสอบตามทฤษฎีการตอบสนองข้อสอบพบว่า ข้อสอบจำนวน 7 ข้อมีค่าพารามิเตอร์อำนาจจำแนกอยู่ในระดับจำแนกไม่ได้ ได้แก่ ข้อ 4, 14, 20, 21, 28, 34 และ 40 ซึ่งข้อสอบส่วนใหญ่มีค่าพารามิเตอร์ความยากอยู่ในระดับค่อนข้างยาก ซึ่งทำให้เกิดข้อสันนิษฐานดังนี้

1) ข้อสอบยากเกินไป ไม่เหมาะสมกับความสามารถของผู้สอบ หรือ
2) ผู้สอบมีความสามารถต่ำกว่าระดับความยากของข้อสอบ

สรุปและอภิปรายผลการวิเคราะห์แบบทดสอบหลังจากทำไปทดลอง

ผลการวิเคราะห์แบบทดสอบที่นำไปทดลองกับกลุ่มตัวอย่างชี้ให้เห็นว่า ในภาพรวม แบบทดสอบความสามารถด้านการอ่านภาษาไทยระดับกลางที่สร้างขึ้นตามผังการสร้างแบบทดสอบที่คณะผู้วิจัยได้ออกแบบไว้ สามารถใช้เป็นเครื่องมือในการวัดและประเมินความสามารถด้านการอ่านระดับกลางได้ เนื่องจากข้อสอบแต่ละข้อส่วนใหญ่มีค่าอำนาจจำแนกที่ดี และสามารถจำแนกผู้สอบที่มีความสามารถแตกต่างกันได้ในทุกทักษะ ไม่ว่าจะเป็นการอ่านจับรายละเอียด การอ่านจับใจความ การอ่านตีความ หรือการอ่านอย่างมีวิจารณญาณ

อย่างไรก็ตาม สำหรับข้อสอบ 7 ข้อที่พบว่าใช้จำแนกผู้สอบไม่ได้เนื่องจากมีค่าอำนาจจำแนกไม่เป็นไปตามเกณฑ์นั้น คณะผู้วิจัยได้ร่วมประชุมกันเพื่อนำมาพิจารณาเนื้อหาตามข้อเสนอแนะของหลักการวัดและประเมินผลอีกครั้งว่ามีความบกพร่องในส่วนใดหรือไม่ และอาจพิจารณาปรับแก้หากเห็นว่ามีข้อบกพร่องของเนื้อหา หรือไม่ปรับแก้หากเห็นว่าไม่พบความบกพร่องของเนื้อหาและตรงกับตัวชี้วัดด้านการอ่านที่ต้องการวัด

จากการพิจารณาเนื้อหาข้อสอบทั้ง 7 ข้อ คณะผู้วิจัยได้ดำเนินการปรับแก้ข้อสอบทั้งหมด 4 ข้อ และไม่ปรับแก้ทั้งหมด 3 ข้อ ดังนี้

  • ข้อสอบข้อ 4 วัดความสามารถการอ่านตีความ ไม่ปรับแก้ ยืนยันความตรงเชิงเนื้อหา
  • ข้อสอบข้อ 14 วัดความสามารถการอ่านอย่างมีวิจารณญาณ ปรับแก้โจทย์ใหม่ให้ชัดเจนมากขึ้น เนื่องจากโจทย์เดิมมีความไม่ชัดเจน พร้อมกับปรับแก้เฉลยใหม่
  • ข้อสอบข้อ 20 วัดความสามารถการอ่านจับใจความ ปรับแก้โจทย์ใหม่ให้มีความซับซ้อนน้อยลง เนื่องจากพบว่ากลุ่มที่ได้คะแนนสูงไม่สามารถทำข้อสอบข้อนี้ได้เป็นส่วนใหญ่ (มีเพียงร้อยละ 19.17 ที่ทำได้) จึงอาจยากเกินไป ไม่เหมาะกับความสามารถการอ่านระดับกลาง
  • ข้อสอบข้อ 21 วัดความสามารถการอ่านจับใจความ ไม่ปรับแก้ ยืนยันความตรงเชิงเนื้อหา
  • ข้อสอบข้อ 28 วัดความสามารถการอ่านอย่างมีวิจารณญาณ ปรับแก้ข้อความในตัวเลือกที่ถูกให้ถูกต้องและชัดเจนมากขึ้น เนื่องจากพบว่ากลุ่มที่ได้คะแนนสูงไม่สามารถทำข้อสอบข้อนี้ได้เป็นส่วนใหญ่ (มีเพียงร้อยละ 22.80 ที่ทำได้) ซึ่งอาจเป็นผลจากข้อความของตัวเลือกที่ถูกเดิมนั้นมีความกำกวมและยังไม่เป็นคำตอบที่ถูกต้องที่มีความชัดเจนพอ
  • ข้อสอบข้อ 34 วัดความสามารถการอ่านจับใจความ ปรับแก้ข้อความในตัวเลือกให้แคบลงเพื่อความชัดเจนและสอดคล้องกับโจทย์มากขึ้น เนื่องจากพบว่ากลุ่มที่ได้คะแนนสูงและที่ได้คะแนนน้อยตอบได้ไม่แตกต่างกันมากนัก ทำให้จำแนกความสามารถของผู้สอบไม่ได้
  • ข้อสอบข้อ 28 วัดความสามารถการอ่านจับใจความ ไม่ปรับแก้ ยืนยันความตรงเชิงเนื้อหา

เมื่อปรับแก้แล้ว จึงได้แบบทดสอบวัดความสามารถด้านการอ่านระดับกลางฉบับสมบูรณ์พร้อมนำไปใช้ โดยคณะผู้วิจัยเห็นว่า อาจเผยแพร่เพื่อให้นักเรียนทั่วไปได้เข้ามาทำแบบทดสอบผ่านแพลตฟอร์มออนไลน์ต่อไป