Please use this identifier to cite or link to this item: http://kb.psu.ac.th/psukb/handle/2016/19185
Title: การคาดการณ์การออกกลางคันของนักศึกษามหาวิทยาลัยสงขลานครินทร์ด้วยเทคนิคการเรียนรู้ของเครื่อง
Other Titles: Prince of Songkla University Students’ Dropout Prediction Using Machine Learning
Authors: นฤบาล ยมะคุปต์
กฤตกร อินแพง
College of Digital Science
โครงการจัดตั้งวิทยาลัยวิทยาศาสตร์ดิจิทัล
Keywords: นักศึกษาออกกลางคัน;อุดมศึกษา;การเรียนรู้ของเครื่อง;เหมืองข้อมูล;การคาดการณ์;Student Dropout;Higher Education;Machine Learning;Data Mining;Prediction
Issue Date: 2022
Publisher: มหาวิทยาลัยสงขลานครินทร์
Abstract: Student retention rate plays a critical role and serves as an essential indicator of a tertiary institution’s success. However, not all first-time students complete their program at the same institution within a specified period of time: some students drop out of the program. Prince of Songkla University Hatyai Campus is no exception. From Academic Years 2013-2017, the student dropout rates rose by 19.18%. This research study adopted data mining and machine learning techniques to explore factors that predict the likelihood of a student dropping out, and to create a learning model of five-decision trees, which will be used for the prediction of the student dropouts. Data were collected from 33,930 students of Prince of Songkla University Hatyai Campus, from 6 intakes ranging from Academic Years 2015-2020, and with 39 variables. Collected data cover students’ learning achievements, students’ basic information, and students’ family background. Data were classified into two categories: Undergraduate and Postgraduate. As for undergraduate category, the study found that Light Gradient Boosting Machine is the most appropriate methodology, as it yielded the highest value of the area under the curve of 93.03%, and the accuracy value of 89.99%. The top factors that predict the likelihood for student dropouts include the accumulated (overall) grade point average (GPAX); academic year; Grade Point Average (GPA); semester; pre-university GPAX; and pre-university English scores, respectively. As for postgraduate category, the study found that the Random Forest is the most appropriate methodology, as it yielded the highest value of the area under the curve of 78.86%, and the accuracy value of 85.28%. The top factors that predict the likelihood for student dropouts include GPAX; academic year; semester; social and humanity science; GPA; supplementary class; and Plan A, A2-Type, respectively. In the final procedure, the researcher implemented the obtained models for making a prediction with the actual data, and visually presented the results of the analysis in the dashboard report, which can be used for monitoring possible risks. This will enable respective staff to give immediate assistance to the students who are in needs or show the likelihood to drop out, and help the management board in making decisions and devising management plans to minimize the dropout rate in their institution.
Abstract(Thai): อัตราการคงอยู่ของนักศึกษาเป็นส่วนสำคัญและเป็นตัวชี้วัดหนึ่งในการวัดความสำเร็จของสถาบันการศึกษา อย่างไรก็ตามผู้ที่เข้ามาศึกษาไม่สามารถสำเร็จการศึกษาในระบบได้ทั้งหมด เนื่องจากส่วนหนึ่งต้องออกจากการศึกษากลางคัน เช่นเดียวกับมหาวิทยาลัยสงขลานครินทร์ วิทยาเขตหาดใหญ่ โดยตั้งแต่ปีการศึกษา พ.ศ. 2556 ถึง 2560 พบว่าอัตราการออกกลางคันของนักศึกษาเพิ่มสูงขึ้นอยู่ที่ร้อยละ 19.18 ด้วยเหตุนี้ผู้วิจัยจึงได้นำเสนอการนำเทคนิคเหมืองข้อมูลและการเรียนรู้ของเครื่องมาวิเคราะห์เพื่อค้นหาคุณลักษณะที่สำคัญและสร้างแบบจำลองการเรียนรู้ของเครื่องประเภทต้นไม้ 5 แบบ เพื่อคาดการณ์การออกกลางคันของนักศึกษา โดยใช้ข้อมูลนักศึกษามหาวิทยาลัยสงขลานครินทร์ วิทยาเขตหาดใหญ่ 6 รุ่นปีการศึกษา คือในช่วง พ.ศ. 2558 ถึง 2563 จำนวน 33,930 ราย 39 ตัวแปร ขอบเขตของงานวิจัยนี้คือข้อมูลผลลัพธ์ทางการศึกษา ข้อมูลพื้นฐานของนักศึกษา และข้อมูลครอบครัวของนักศึกษา โดยแบ่งข้อมูลเป็นสองชุดคือ ชุดข้อมูลระดับปริญญาตรี พบว่าแบบจำลองไลท์กาเดียนบูทติ้งแมชชีนเป็นวิธีที่ดีที่สุดให้ค่าพื้นที่ใต้กราฟสูงที่สุดร้อยละ 93.03 และค่าความถูกต้องร้อยละ 89.99 และปัจจัยสำคัญที่ส่งผลต่อการออกกลางคันของนักศึกษาคือ ผลการเรียนเฉลี่ยสะสม รองลงมาคือชั้นปี ผลการเรียนเฉลี่ยปัจจุบัน ภาคการศึกษา ผลการเรียนเฉลี่ยสะสมก่อนเข้าศึกษา และคะแนนภาษาอังกฤษก่อนเข้าศึกษา ตามลำดับ และชุดข้อมูลระดับบัณฑิตศึกษา พบว่าแบบจำลองแรนดอมฟอเรสต์เป็นวิธีที่ดีที่สุดให้ค่าพื้นที่ใต้กราฟสูงที่สุดร้อยละ 78.86 และค่าความถูกต้องร้อยละ 85.28 และปัจจัยที่สำคัญที่ส่งผลต่อการออกกลางคันของนักศึกษา คือ ผลการเรียนเฉลี่ยสะสม รองลงมาคือชั้นปี ภาคการศึกษา กลุ่มสาขาวิชาสังคมศาสตร์และมนุษยศาสตร์ ผลการเรียนเฉลี่ยปัจจุบัน ประเภทภาคสมทบ และแผนการศึกษาแผน ก แบบ ก2 ตามลำดับ โดยขั้นตอนสุดท้ายผู้วิจัยนำแบบจำลองที่ได้ไปทำการคาดการณ์กับข้อมูลจริงและแสดงผลการวิเคราะห์นำเสนอรายงานแดชบอร์ดเพื่อติดตามความเสี่ยง ซึ่งจะช่วยให้เจ้าหน้าที่ที่เกี่ยวข้องสามารถเข้าช่วยเหลือนักศึกษาที่มีความเสี่ยงได้ทันที และเพื่อช่วยผู้บริหารในการสนับสนุนการตัดสินใจและวางแผนการบริหารงานเพื่อลดอัตราการออกกลางคันในมหาวิทยาลัยให้ต่ำลงได้
Description: วิทยาศาสตรมหาบัณฑิต (วิทยาการข้อมูล), 2565
URI: http://kb.psu.ac.th/psukb/handle/2016/19185
Appears in Collections:950 Thesis

Files in This Item:
File Description SizeFormat 
6310025001.pdf4.01 MBAdobe PDFView/Open


This item is licensed under a Creative Commons License Creative Commons