เมื่อประสบการณ์สอนเรา: การพัฒนาตัวชี้วัดประสิทธิภาพการวิเคราะห์จัดกลุ่มแบบเบย์เซียนพื้นฐานความน่าจะเป็น


หัวหน้าโครงการ


ผู้ร่วมโครงการ

ไม่พบข้อมูลที่เกี่ยวข้อง


สมาชิกทีมคนอื่น ๆ

ไม่พบข้อมูลที่เกี่ยวข้อง


รายละเอียดโครงการ

วันที่เริ่มโครงการ25/04/2023

วันที่สิ้นสุดโครงการ24/04/2025


คำอธิบายโดยย่อ

การวิเคราะห์จัดกลุ่มเป็นหนึ่งในวิธีการเรียนรู้เชิงสถิติ และ การเรียนรู้ของเครื่องแบบไม่มีผู้สอนที่นิยมใช้อย่างแพร่หลายที่สุด ซึ่งถูกใช้ในการแบ่งกลุ่มของข้อมูลเพื่อให้แต่ละกลุ่มมีลักษณะใกล้เคียงกัน นักวิจัยหลากหลายศาสตร์ประยุกต์ใช้เพื่อแก้ปัญหาต่างๆมากมาย ตั้งแต่ปัญหาเชิงสังคมศาสตร์ ไปจนถึงปัญหานอกอวกาศ ในการวิเคราะห์จัดกลุ่มนั้น มีตัวชี้วัดประสิทธิภาพกลุ่ม (Cluster Validity Index) จำนวนมากถูกคิดค้นขึ้น โดยหนึ่งในเหตุผลหลักในการใช้ตัวชี้วัดเหล้านี้คือเพื่อหาจำนวนกลุ่มที่เหมาะสมที่สุด ในปี 2021 [Wiroonsri 2021] (https://github.com/nwiroonsri/NCvalid/) คิดตัวชี้วัดประสิทธิภาพกลุ่มใหม่โดยใช้สหสัมพันธ์ซึ่งมีจุดเด่นที่สามารถหาจำนวนกลุ่มที่ดีที่สุดได้แม่นยำ นอกจากนี้ยังแสดงตัวเลือกที่ดีลำดับรองๆลงไปเสมอ ซึ่งจุดเด่นนี้เองจะทำให้ผู้ใช้งานสามารถจัดลำดับของจำนวนกลุ่มที่ดีที่สุดได้ อย่างไรก็ตาม ตัวชี้วัดประสิทธิภาพกลุ่มดังกล่าวนั้นยังใช้เพียงแค่กับ k-means และ hierarchical clustering และ ยังขึ้นกับข้อมูลที่มีเพียงอย่างเดียว โดยไม่ได้มีการนำเอาประสบการณ์ของผู้ใช้เข้ามาเกี่ยวข้องด้วย ในงานนี้ผู้วิจัยจะนำเสนอตัวชี้วัดประสิทธิภาพกลุ่มใหม่สองตัว คือ ตัวชี้วัดแบบคลุมเครือ (FNCI) และ ตัวชี้วัดแบบเบย์เซียน (BNCI) โดยสร้างจากพื้นฐานของ NC index (NCI) จากงาน [Wiroonsri21] ซึ่งสำหรับ FNCI จะใช้ได้กับ fuzzy clustering EM clustering และวิธีการใหม่อื่นๆ ที่สามารถให้ค่าสมาชิกกลุ่มแบบความน่าจะเป็น ในขณะที่ BNCI นั้น ผู้วิจัยจะใช้ prior distribution เป็น Dirichlet distribution สำหรับโมเดลจำนวนกลุ่มที่เหมาะสมที่สุด ซึ่งผู้ใช้สามารถกำหนดพารามิเตอร์ของ Dirichlet โดยใช้ประสบการณ์ในบริบทของตนเอง จากนั้น Posterior Distribution จะยังคงเป็น Dirichlet Distribution ที่พารามิเตอร์ถูกเปลี่ยนไปตามข้อมูลที่เก็บมาได้ ดังนั้น จำนวนกลุ่มที่เหมาะสมในท้ายที่สุดจะมีพื้นฐานมาจากทั้งประสบการณ์ และ ข้อมูล ท้ายสุดแล้ว นอกจากการคิดค้น FNCI และ BNCI และ การวิเคราะห์คุณสมบัติของทั้งสองตัวชี้วัด ผู้วิจัยจะประยุกต์ใช้ FNCI และ BNCI กับบริบทในโลกจริง โดยมีแผนจะใช้ตัวชี้วัดดังกล่าวในข้อมูลประชากรไทย โดยจะปรับพารามิเตอร์ของ BNCI โดยอาศัยความรู้ทางด้านสังคมศาสตร์ รวมถึงแผนในการประยุกต์ใช้ตัวชี้วัดในการแบ่งกลุ่มกราฟจากคุณสมบัติจากทฤษฎีกราฟอีกด้วย


คำสำคัญ

  • Bayesian
  • Cluster Validity Index
  • Correlation
  • Probabilistic Machine Learning
  • Statistical Learning


กลุ่มสาขาการวิจัยเชิงกลยุทธ์


ผลงานตีพิมพ์

ไม่พบข้อมูลที่เกี่ยวข้อง


อัพเดทล่าสุด 2025-08-07 ถึง 14:10