กรุณาใช้ตัวระบุนี้เพื่ออ้างอิงหรือเชื่อมต่อรายการนี้:
http://kb.psu.ac.th/psukb/handle/2016/19228
ชื่อเรื่อง: | การตรวจจับและการจำแนกใบหน้าสวมหน้ากากโดยใช้ข้อมูลเข้าหลายค่ากับการเรียนรู้เชิงลึก |
ชื่อเรื่องอื่นๆ: | Face-mask Detection and Classification Using Multiple Inputs Deep Learning |
ผู้แต่ง/ผู้ร่วมงาน: | วิภาดา เวทย์ประสิทธิ์ ภีมกานต์ รุจิราพงศ์ Faculty of Science (Computer Science) คณะวิทยาศาสตร์ ภาควิชาวิทยาการคอมพิวเตอร์ |
คำสำคัญ: | การจำแนกประเภทใบหน้า;โครงข่ายประสาทเทียมแบบคอนโวลูชัน;การสกัดคุณลักษณะ;การเรียนรู้เชิงลึก |
วันที่เผยแพร่: | 2023 |
สำนักพิมพ์: | มหาวิทยาลัยสงขลานครินทร์ |
บทคัดย่อ: | This research presents face-mask detection and classification using multiple inputs. The face-mask detection composes of 3 classes including the with_mask class, with_out_mask class, and wear_mask_incorrect class. The differences between these classes are the nose area and mouth area which help in classification. A deep learning multiple input model that can use face images, nose images, and mouth images as inputs was developed. This experiment is tried out with 2 datasets including Face Mask Label Dataset (FMLD) and Andrewmvd Face Mask Detection Kaggle (AFMDK). There are comparison models which are created by using single input and multiple inputs. The study finds that the results are confirmed that the purposed multiple input model has accuracy, precision, recall, and F1 score has higher values than a single input model in both datasets. This research also does an experiment on image enhancement by super-resolution for small image problems. The results increase the resolution at the nose and mouth area.The experiment shows that model trained by image from BSRGANs cannot solves the small image problem but can solve the medium and large images. |
Abstract(Thai): | งานวิจัยนี้นำเสนอการตรวจจับและการจำแนกใบหน้าสวมหน้ากากโดยใช้ข้อมูลเข้า หลายค่า เนื่องจากการตรวจจับใบหน้าสวมหน้ากากแบบ 3 ประเภท ได้แก่ประเภทสวมหน้ากาก ถูกต้อง ประเภทไม่สวมหน้ากาก และประเภทสวมหน้ากากไม่ถูกต้อง เมื่อสังเกตข้อแตกต่างของทั้ง 3 ประเภท จะเห็นว่าบริเวณจมูกและปากจะเป็นส่วนหลักที่ช่วยในการจำแนกประเภท จึงพัฒนาโมเดล การเรียนรู้เชิงลึกที่รับข้อมูลเข้าหลายค่า ได้แก่ ภาพใบหน้า ภาพบริเวณจมูกและภาพบริเวณปาก การ ทดลองมีการใช้ชุดข้อมูล 2 ชุด ได้แก่ ชุดข้อมูล Face Mask Label Dataset (FMLD) และ Andrewmvd Face Mask Detection Kaggle (AFMDK) มีการเปรียบเทียบการสร้างโมเดลซึ่งใช้ ข้อมูลเข้าแบบเดี่ยว พบว่าผลลัพธ์ที่ได้โมเดลข้อมูลเข้าหลายค่าที่นำเสนอมีค่าความถูกต้อง ค่าความ แม่นยำ ค่าความครบถ้วน และค่า F1 มีประสิทธิภาพสูงกว่าโมเดลข้อมูลเข้าเดี่ยวทั้งสองชุดข้อมูล นอกจากนี้งานวิจัยนี้ได้ทำการทดลองการปรับปรุงภาพ โดยใช้ Super-Resolution (SR) เพื่อ แก้ปัญหาภาพขนาดเล็ก ทำให้ภาพบริเวณจมูกและภาพส่วนปากมีความคมชัดมากขึ้น จากการ ทดลองพบว่าโมเดลใช้ภาพจาก BSRGANs ไม่สามารถช่วยแก้ปัญหาภาพขนาดเล็กได้แต่สามารถช่วย แก้ปัญหาภาพขนาดปานกลางและขนาดใหญ่ได้ |
รายละเอียด: | วิทยาการศาสตรมหาบัณฑิต (วิทยาการคอมพิวเตอร์), 2566 |
URI: | http://kb.psu.ac.th/psukb/handle/2016/19228 |
ปรากฏในกลุ่มข้อมูล: | 344 Thesis |
แฟ้มในรายการข้อมูลนี้:
แฟ้ม | รายละเอียด | ขนาด | รูปแบบ | |
---|---|---|---|---|
6310220004.pdf | 4.16 MB | Adobe PDF | ดู/เปิด |
รายการนี้ได้รับอนุญาตภายใต้ Creative Commons License